今日必看|数据科学何以成为第二个MBA?
全文共2686字 , 预计学习时长9分钟
本文插图
风口轮流转 , 如今 , 合法红的就是数据科学领域 , 许多人都但愿能进入这一领域 。 一些新闻媒体把数据科学描述得十分有吸引力 , 各种学术机构都承诺在短短几个月内即可培训出数据科学家 , 这下你已有了通向劫难的秘诀 。
作为数据科学家 , 我以为题目不在于人们愿意选择数据科学作为职业 。 假如你对处理数据、理解业务题目、学习数学感兴趣 , 并且喜欢编码 , 那么很可能会在数据科学领域有所建树 。
你会有许多机会使用数学和编码来开发新奇的题目解决方案 , 并以为这项工作很有意义 。 主要题目在于人们进入数据科学领域的念头经常没有这么想 。
对某些人来说 , 数据科学领域的吸引力是金钱 , 还有些人则喜欢这个职业头衔 。 更糟的是 , 有些人可能只是在回应社会灌注贯注的羊群思惟 。
不久前 , 每位毕业生都渴想获得MBA学位 。 曾经我也是这样 , 我参加了GMAT考试并遭到了几回拒绝后 , 才意识到自己并不是真的想要这个学位 。 这些拒绝终极对我来说实在是好事 , 后来我终于意识到自己真正的爱好是数据科学 。
而今 , 我看到数据科学已经以某种方式获得了MBA曾经的地位 。
许多人都想从事数据科学工作 , 但并不知道这项工作真正需要做什么;很多人自称数据科学家 , 还做出了很多错误的决议计划;很多人正在考虑进入数据科学行业 , 但他们甚至可能都不知道什么是数据科学 。
本文插图
互联网如斯发达的今天 , 人们可以获得非常多的相关学习材料 , 数据科学领域开始走向大众化了 。 大量的慕课课程有最好的讲师 , 涵盖了从基础到高级的各种概念 , 你可以轻松地找到仅需几行代码即可创建模型的软件包 。
这当然很好 , 我们有了这么多资源可以用来学习和实践数据科学 。 但是这种民主化本身也产生了一些题目 , 这些题目可能对数据科学领域带来的的不利影响 。
本文插图
自动化的数据科学?
很多AutoML软件包都旨在让数据科学走向大众化 。 这些软件包提供了模型存储库 , 可以自动执行超参数调整过程 , 有时还提供了把这些模型投入出产的方法 。
这些软件包是如斯利便 , 使得许多人相信数据科学可以完全实现自动化 , 再也不需要任何数据科学家 。 或者说 , 假如过程无法实现自动化 , 那么这些工具将可让任何人都成为数据科学家 。
我从心底里反对这样的观点 。 我发现这样的代码库有时很有用 , 但纯粹是从编码角度来看数据科学 。 我以为 , 数据科学包括的工作不仅仅是建模 。
数据科学的工作包括了解和识别当前的题目及建立准确的评估指标 。 此外数据科学家还必需分析项目的盈利能力:大多数企业都不想在可能会亏损的项目上花钱 。
你可以使用现有数据 , 但是有时可能需要提出一些方法 , 建立新的数据管道来收集数据以解决问题 。 这就要求与利益相关者进行交谈 , 全方位地理解题目 。 数据科学家还需要进行数据收拾整顿和功能创建 , 从现有模型中获得更多机能 。
最后 , 模型测试和设置反馈轮回需要和企业进行不断的讨论 , 对每一项目都要进行专门的讨论 。 仅仅会运行代码的人可能无法为这样的讨论带来价值 , 他们并不了解AutoML中使用的模型背后的那一切 。
本文插图
其次就是这一领域专业知识的题目 。 零售领域可接受的流程不适用于金融领域 , 金融领域中 , 一个微小的变化都可能导致客户损失大量资金 。 有些程序不能自动化 , 由于需要行业知识以及对从事业务的了解 。
推荐阅读
- 今日话题:假人安检员,申通快递要凉凉?
- 育儿|「家长必看」这些“防溺水”安全知识,请及时get
- 中外合作办学能否成为留学“替代品”?
- 英国政府暂停发布每日新冠病亡数据
- 大数据&云计算|Kubernetes新标签:DevOps时代的数据保护神
- 伊朗自己公布了一个惊人的数据…
- 江湖雀语:今日新闻说漏洞
- 娱乐大爆料|考生必看!历年河北公务员考试申论考情分析
- 乘风破浪的姐姐|每日推荐:今日最佳:高手在民间版《乘风破浪的姐姐》
- 伊朗自己公布了一个惊人的数据……
