|自学四个月,我如何获得亚洲最大电信公司的数据科学实习机会?
全文共2755字 , 预计学习时长7分钟
本文插图
图源:unsplash
作为一个尚未完成计算机科学学位、只拥有数据科学证书的求职者 , 几周前 , 笔者接受了亚洲最大电信公司之一的数据科学实习面试 , 而下周就将开始工作 。
我是如何这个获得面试机会的?在我看来 , 这完全是因为我的数据科学作品集以及展示的项目 。
申请数据科学工作太不容易了 , 要想与你所申请的公司完美契合几乎是不可能的 。 笔者的建议是 , 与其尝试学习所有工具 , 不如使用已掌握的知识来创建实用的事物 , 这样你可以学到最多 , 之后还能向全世界展示你的项目 , 围绕它讲故事 。
创建感兴趣的项目并不仅仅展示了你的技能 , 还显示出你对工作的热爱 。
你将需要花费数周(有时乃至数月)时间来将一个想法付诸实践 。 盯着笔记本电脑几个小时 , 试图修复代码 , 每次试图运行它时都会向你抛出一个错误 。
有时 , 你花了一个月的时间后才意识到项目根本无法完成;也许是数据集存在缺陷 , 你无法提高模型在实际用户数据上的准确性 , 一个月的辛苦工作付诸东流 , 不得不重新开始 。
只有对工作真正热爱的人才能坚持下去 , 这将使雇主相信你可以胜任这份工作 。 即使没有完全符合职位描述 , 雇主也会相信你是一个能够解决当前任务的人 。
本文将带你了解一些应该做的数据科学项目 。 这些项目不仅能提高你作为数据科学家的技能 , 而且能为你的简历增添光彩 。
Kaggle
本文插图
图源:unsplash
Kaggle项目是一个很好的起始点 , 其项目中的数据干净且结构化 , 分析结构良好的数据并对其运行机器学习模型是非常容易的 。 如果你是一个初学者 , Kaggle是动手实践的最佳的地方!
做Kaggle项目的最大优势就是你可以在网上找到大量指导 。 每个人都在做 , 争相获得最高的准确度 。 人们写博客文章、制作GitHub存储库和YouTube视频 , 展示解决问题的方法 。
Kaggle还提供了一些对初学者友好项目的教程 , 这些教程在起步时非常有帮助 。 Kaggle项目非常适合初学者的起步阶段 。 浪费在数据收集和清理上的时间越少 , 就可以将越多的时间花费在培养机器学习技能上 。
但是 , 如果你的目标是创建令人印象深刻的数据科学作品集 , 请远离Kaggle 。
为什么?现实世界的数据是混乱的 。 在公司工作时 , 你不会获得像Kaggle那样干净整洁的数据集 。 实际上 , 数据科学家约80%的工作都用在清理数据上 , 而仅有20%用于模型 。
通过展示Kaggle项目 , 你只显示出了工作所需技能的一小部分——创建高度准确的模型(有时) 。 那么 , 进阶做法是怎样的?
展示各种技能
是的 , 现在潜在的雇主知道了你可以创建出色的监督学习模型 , 从而做出高度准确的预测 。 还有别的什么能展示吗?
确保创建展示各种技能的不同类型的项目——数据清理、分析、可视化、机器学习和交流 。 如果你拥有其他领域的专业知识 , 那么将这些知识融合到数据科学项目中会更容易脱颖而出 。
展现热爱
本文插图
图源:unsplash
你需要热爱所做的事 。 可能未必热爱编码、数学或机器学习 , 没关系 , 你需要做的是找到一种在热爱的领域中使用数据的方法 。 也许你喜欢音乐 , 你可以尝试创建一个音乐分析项目 , 通过分析趋势来预测下一个大热门 。 在Towards Data Science上就有一整页都是专门介绍音乐分析的 。
如果创建与热爱事情相关的数据科学项目 , 即使遇到困难也更可能继续前进 , 相比于不感兴趣的项目这要容易得多 。
举例
笔者一直对揭示社会问题感兴趣 , 如气候变化、性别不平等和种族差异等 。 有什么方法能比数据更深入地了解这些问题呢?这让笔者创建了数据分析项目 , 例如:
· 好莱坞性别差异分析(https://towardsdatascience.com/the-bechdel-test-analyzing-gender-disparity-in-hollywood-263cd4bcd9d)
· 黑人驾驶——数据分析(https://towardsdatascience.com/driving-while-black-what-does-the-data-say-e77cac9ab15b)
· 技术中的性别不平等分析(https://medium.com/better-programming/the-gender-gap-in-data-science-what-the-data-says-2a74892655f1)
另外 , 笔者喜欢阅读 。 小时候最喜欢《哈利·波特》系列 , 所以笔者创建了一个《哈利波特》人格预测模型 。 (https://towardsdatascience.com/a-full-stack-machine-learning-project-7ab80e46e1c4)
本文插图
图源:unsplash
这只是一些例子 , 你可以试着将数据和热爱的领域结合起来 , 创建一个数据科学作品集 。
交流
更重要的是 , 你要确保传达出你的项目 。 如果将代码放在GitHub存储库中而没有任何解释 , 那么仅仅是创建一个出色的产品是不够的 。 创建数据科学项目后 , 你要围绕它讲一个故事 。
你为什么决定开始这个项目?完成它采取了哪些步骤?你有什么数据发现?用简单的术语来介绍你的项目 , 让所有努力读懂它的人都可以轻松理解 。 可以创建GitHub pages网站来解释你的项目 , 写给 Medium出版 , 甚至创建自己的博客 。
数据科学作品集
最后 , 你需要将所有工作放在一起 。 建议创建一个数据科学作品集网站来展示所有内容 。 当笔者申请实习时 , 发送的只是作品集网站的链接 。 包括笔者GitHub和Medium帐户的链接 , 并对做的所有项目撰写了简短的摘要 。
笔者只花了一天就完成了自己的网站 。 可以从这里了解如何创建简单的数据科学作品集网站:(https://towardsdatascience.com/how-to-create-a-data-science-portfolio-website-dcba6bf00994?source=---------8------------------) 。
如果已参加了几门在线课程 , 并且不确定接下来要做什么 , 那么我建议你开始做数据科学项目 。 做一些研究 , 选择一个数据集 , 然后开始 。 给自己一个截止日期 , 努力在那之前完成 。 行动起来吧!
本文插图
留言点赞关注
我们一起分享AI学习与发展的干货
【|自学四个月,我如何获得亚洲最大电信公司的数据科学实习机会?】如转载 , 请后台留言 , 遵守转载规范
推荐阅读
- 春天湿气重,多喝这碗糖水,祛湿清热又甘甜,我隔两天喝一次
- 这早餐我从3岁开始吃,三十多年了,从没吃腻过,晶莹剔透很好吃
- 这几道菜在我家太受欢迎, 做法还很简单!
- 我家一周的晚餐,7天不重样,荤素搭配,营养又美味
- 晒晒我家一周的晚餐,每天3个菜,每天都不重样,老公直夸真贤惠
- 虾别再煮着吃了,我换种做法外酥里嫩,老公一口气干掉一盘,佩服
- 宇宙|我们的宇宙是真实的吗?全息宇宙
- 猪血和此菜才是绝配,5块钱炒一盘,补铁助消化,我家一周吃2次
- 丸子这样做最好吃,不放面粉不加水,鲜嫩又营养,我家2天做一回
- 天暖了,趁着这个功夫我们做一个芝麻馅,不煎不炸,蒸熟后包上芝麻糖馅,糯糯甜甜,真好吃
