AI科技大本营|Gary Marcus:因果熵理论的荒诞和认知科学带给AI的11个启示 | 文末赠书(11)


AI科技大本营|Gary Marcus:因果熵理论的荒诞和认知科学带给AI的11个启示 | 文末赠书
本文插图

维根在读研究生的时候 , 编撰了一本名为《假性相关》(Spurious Correlations )的著作 。同一时期 , 维根注意到 , 掉进池塘里淹死的人数与 尼古拉斯·凯奇(Nicholas Cage)出镜的影片数量存在紧密的相关性 。 这些 胡乱搭上关系的相关性是不存在的 , 其中并没有真正的因果关系 , 但是油门 踏板和汽车加速之间的关联则是因果关系的真实实例 。 有朝一日 , 若能让机器认识到这一点 , 将是一项重大成就 。
我们针对逐个的人和事件进行跟进
日常生活中 , 我们会对各种各样的事物进行跟进了解 , 对其特征和历 史进行把握 。 你的另一半以前当过采访人员 , 喜欢喝白兰地 , 不那么喜欢威士 忌 。 你的女儿以前特别害怕暴风雨 , 喜欢吃冰激凌 , 没那么喜欢吃曲奇饼 。 你车子的右后门被撞了个小坑 , 一年前你更换了车子的变速器 。 街角那家小 商店 , 以前卖的东西质量特别好 , 后来转手给新老板之后 , 东西的质量就一 天不如一天 。 我们对世界的体验 , 是由许多持续存在、不断变化的个体组成 的 , 而我们的许多知识 , 也是围绕着这些个体事物而建立起来的 。 不仅包括 汽车、人物和商店 , 还包括特定的实体 , 及其特定的历史和特征 。
奇怪的是 , 这并非深度学习与生俱来的观点 。 深度学习以类别为重点 , 而不以个体为重点 。 通常情况下 , 深度学习善于归纳和概括:孩子都喜欢吃甜食 , 不那么喜欢吃蔬菜 , 汽车有四个轮子 。 这些事实 , 是深度学习系统善于发现和总结的 , 而对关于你的女儿和你的车子的特定事实 , 则没什么 感觉 。
当然 , 也存在例外情况 。 但如果我们深入观察 , 就会发现 , 那些例外情况也证实了这个原则 。 举例来说 , 深度学习非常善于学习关于个体人物的图片识别 , 比如 , 你可以训练深度学习以很高的准确率去识别德瑞克 · 基特(Derek Jeter)的图片 。 但是 , 这是因为系统认为“德瑞克·基特的图片”属于同类图片之中的一个类别 , 而不是因为系统了解德瑞克 · 基特是一位运动员 , 是一个人 。 学习识别德瑞克 · 基特等人物图片与学习识别诸如棒球运动员等类别的深度学习机制 , 基本是相同的 , 都是图像的类别 。 训练深度学习识别德瑞克 · 基特的图片 , 比让系统从多年的新闻报道中推断出此人从 1995年到 2014 年在洋基队担任游击手 , 要容易得多 。
同样 , 我们可以让深度学习以一定的准确率在视频中对某个人进行跟踪 。 但是对于深度学习来说 , 不过是将一个视频帧中的一块像素与下一个视频帧中的另一块像素进行关联而已;系统并不了解像素究竟指代的是什么东西 。 系统不知道 , 当人物从视频帧中暂时消失 , 此人依然在别处存在 。 如果系统看到一个人走进电话亭 , 过一会儿从里面走出来两个人 , 并不会觉得有什么不妥 。
复杂的认知生物体并非白板一块
1865 年 , 格雷戈尔· 孟德尔(Gregor Mendel)发现了遗传的核心 , 他称之为因子 , 如今我们称之为基因 。 他当时不知道基因是由什么构成的 。 后来 , 科学家们又花了将近 80 年的时间才找到答案 。 几十年间 , 许多科学家都走上了一条死胡同 , 错误地认为孟德尔的基因是由蛋白质构成的 , 几乎没有人想到 , 基因是由不起眼的核酸构成的 。 直到 1944 年 , 奥斯瓦尔德 · 埃弗里(Oswald Avery)才利用排除法 , 最终发现了 DNA 的重要作用 。 即使在那个时候 , 人们也鲜有关注 , 因为当时科学界“对核酸并不感兴趣” 。 孟德尔本人的 重要地位最初也被人忽视 , 一直到他提出的定律在 1900 年被人重新发现 。
关于“先天”这个古老的话题 , 当代人工智能很可能也同样错失良机 。 面对自然界的诸多现象 , 这一话题常被表达成为“先天还是后天” 。 大脑有多少结构是与生俱来的 , 又有多少是后天习得的?同样的问题也出现在人工智能领域之中:所有东西都应该是预先内置的吗?还是应该通过学习而掌握?


推荐阅读