一位算法工程师给初学者的一封信( 四 )


谷歌和微软的AutoML等服务 , 只需要上传数据集并选择目标变量 , 就可以轻松使用机器学习 。但是这些事情还在初始阶段 , 尚未成形 。如果你是开发人员 , 只需要fast.ai这样的库 , 就可以在几行代码中使用最先进的模型 , 以及各种模型的预建的模型 , 例如 , PyTorch hub和TensorFlow提供相同的功能 。
这意味着什么?虽然机器学习已经如此方便 , 但是仍然需要了解数据科学和机器学习的基本原理 , 更重要的是要知道如何恰当的运用他们 。
Math or Code?It is a problem
对于我处理的客户端问题 , 代码优先,所有的机器学习和数据科学代码都是Python 。有时我会通过阅读论文并进行复现来涉足数学 , 但99.9%的情况下 , 现有的框架已经包含数学的库 。
虽说在现实生活中 , 数学并没有想象中的那么重要 , 毕竟机器学习和深度学习都是数学的应用 。但是知道最小矩阵相乘 , 一些线性代数和微积分 , 特别是链式法则依旧是重中之重 。
请记住 , 我的目标不是发明一种新的机器学习算法 , 而是向客户展示机器学习对他们的业务是否有帮助,有了坚固的基础 , 你就可以建立你自己的最好模型 , 而不是重复使用已有的模型了 。
软件行业的快速迭代
你去年所做的工作明年可能就没用了哦!这是客观事实 , 由于软件工程和机器学习工程的融合 , 这种情况越来越严重 。但是你既然已经加入了机器学习的大家庭 , 我来告诉你什么保持不变——框架会变化 , 库会变化 , 但基础统计 , 概率论 , 数学永远不会变 。最大的挑战仍然是:如何应用它们 。
说了这么多 , 希望以上建议能对与机器学习的入门者和从业者有所帮助 , 最后玩的开心 , 开启你的数据之旅吧!




推荐阅读