并非魔法但也有“神力”:我们何时该使用机器学习?
全文共1949字 , 预计学习时长7分钟

文章图片
图源:unsplash
想象一下 , 你刚刚从一个临床试验中得到了一个数据集(为了帮你更好地理解 , 笔者整理了一些数据供你查看) , 假设这些数据反映了治疗日(输入“特征”)与某个病人在某种奇迹疗法60天的疗程中应接受的正确剂量(毫克)(输出“预测”)之间的关系 。

文章图片
#数据:(1,28)(2,17)(3,92)(4,41)(5,9)(6,87)(7,54)(8,3)(9,78)(10,67)(11,1)(12,67)(13,78)(14,3)(15,55)(16,86)(17,8)(18,42)(19,92)(20,17)(21,29)(22,94)(23,28)(24,18)(25,93)(26,40)(27,9)(28,87)(29,53)(30,3)(31,79)(32,66)(33,1)(34,68)(35,77)(36,3)(37,56)(38,86)(39,8)(40,43)(41,92)(42,16)(43,30)(44,94)(45,27)(46,19)(47,93)(48,39)(49,10)(50,88)(51,53)(52,4)(53,80)(54,65)(55,1)(56,69)(57,77)(58,3)(59,57)(60,86)...你正在治疗一个病人 , 今天是第二天 。 你会建议用什么剂量?

文章图片
答案是“17mg” , 这是一个很简单的问题 。 那第四天呢?没错 , 是41mg 。 现在 , 你将如何开发一个软件以输出1-5天的正确剂量?你会尝试使用机器学习吗?
换句话说 , 可以尝试在这些数据中找到模型并将其转换为从输入到输出的方法(“模型”)吗?答案是否定的 。 可以让软件完全按照你的方式去做:在表中查找答案 。 这样一来 , 将获得60天内所有时间100%正确的答案 , 不需要模型 , 也不需要机器学习 。

文章图片
什么样的情况需要机器学习呢?

文章图片
现在 , 假设今天是第61天 , 剂量的正确答案该是多少?
我们从未见过第61天的数据 , 所以无法在此处查找答案 。 机器学习可以帮上忙吗?要看情况 。 如果没有将输入与输出连接起来的模型 , 那就算了 。 在那种情况下 , 没有什么能帮上忙 。
如果那是你认为的机器学习 , 赶紧打住吧 , 魔法是不存在的 。
但是 , 如果有这样一个真实存在的模型 , 那么可以尝试将其应用到第61天 , 预测或猜测正确的答案 , 也许机器学习可以帮上忙 。
问题在于我们的数据还不足以形成这种模型 。 如果这样去构建模型 , 那就太草率了 。 60天之后 , 模型结果也必须是接近的 。 如果第61天的情况完全不同 , 无法证明模型的有效性怎么办呢?如果第61天所有患者都已完全治愈 , 或全部死亡 , 或者正在服用与之相克的药物 , 那么这种模型会对你不利 。

文章图片
不稳定宇宙
如果你的数据对于探索未来没有帮助 , 或许是因为疫情改变了所有的规则 , 过往的信息有多好就都不重要了 。 如果生活在宇宙的一个不稳定的角落 , 那将很难证实已知的遍历性和平稳性假设 , 这些假设大致可以理解为“规则没有改变 。 ”

文章图片
图源:unsplash
这不是在说外行眼中的那种不稳定性 。 当规则是时间的预测函数时 , 处理平缓的不稳定性就是时间序列分析领域的内容 。
由于系统的规则根本上是不同的 , 无法从一个阶段预测到下一个阶段 , 所以谈到这种剧烈的不稳定性时 , 我们束手无策 。 如果过往的数据突然无法用于预测不稳定的未来 , 就不能用过去直观地预测未来 。
但如果有一种模型 , 并且这种模型适用于新情况 , 那么恭喜你 , 可以开始了 。 可以在旧数据中寻找模型 , 根据它制定一个方法 , 然后使用它成功获得第61天及以后的数据!找到模型并投入使用就是机器学习的全部内容 。

文章图片
何时使用机器学习
在应用机器学习和人工智能时 , 无需重新思考记忆中见过的示例 , 只需查找就可以了!人工智能能做的不仅仅是重复旧的答案 , 它能在新例子上取得成功 。
你要做的是构建能够成功总结概括的解决方案 , 要么中止项目 。 换句话说 , 如果解决方案无法处理从未见过的新案例 , 那么就说明它不好 。 并不是说那些打破稳定宇宙所有规则的全新案例 , 而是与以往主题稍有偏差的例子 。

文章图片
图源:unsplash
我们不像鹦鹉学舌 , 而是要在这里概括新情况 , 这就是机器学习的力量和美妙之处 。 如果你未看到61天前输入值的精确组合 , 那么正确的输出值是什么?也许可以将旧的模型转变成可以做出合理猜测的方案 。
例如 , 你利用成千上万张动物照片训练一个识别猫/非猫的分类器 , 你可以要求其辨别一张全新的照片中是否包含猫 , 但是让它告诉你一幅画是否是立体主义风格的显然太难为人了 。
换种不老套介绍 , 机器学习是一种自动化重复决策的途径 , 涉及从算法上找到数据模型并使用这些模型来制定能够正确处理全新数据的方案 。
机器学习并非无所不能 , 但也别把它想的太简单了 , 找到合适的时机再用它 , 你会得到满意的效果 。

文章图片
留言点赞关注
我们一起分享AI学习与发展的干货
【并非魔法但也有“神力”:我们何时该使用机器学习?】如转载 , 请后台留言 , 遵守转载规范
推荐阅读
- 人间风物志|游雍和宫:有人说这是北京必打卡景点之一,但我并不觉得非去不可
- 三分钟游世界|云南新走红一座公园,门票高达100元,但去过的游客都说好
- 移动互联网|微信终于有这个功能了!但尴尬的是……
- 特朗普|特朗普:将赦免“非常重要”的一个人,但不是斯诺登或弗林
- 结婚|两人都是老戏骨,结婚15年女儿都14岁了,但却无人知他们是夫妻
- 戚薇这造型绝了,穿连体裤故意露出安全裤,但这腿又P得过头了
- 林郑月娥首度承认使用信用卡受限|被美国列入制裁名单,林郑月娥首度承认使用信用卡受限,有不便但感光荣
- 微信朋友圈可以删评论了|微信朋友圈可以删评论了 但是被删除评论的人也能看见
- 8月17日猪评:扛价有效,猪价跟涨?但利空风险依旧存在!
- 想做游戏领域短视频,但不知道选什么方向比较好?有7个选择给你
