AI科技大本营|Gary Marcus:因果熵理论的荒诞和认知科学带给AI的11个启示 | 文末赠书(12)


认真思考过这一话题的人都会意识到 , 这是逻辑谬误中的假两难推理 。 从发展心理学(研究婴幼儿发展的学科)和发展神经科学(研究基因和大脑发育之间关系的学科)等领域 , 我们得到了大量的生物学证据:先天和后天合作发挥作用 , 而不是互为对立面 。 正如马库斯在其著作《心智的诞生》(The Birth of the Mind)中所讲到的一样 , 个体基因实际上是这一合作关系 的杠杆 。每个基因 , 都像是计算机程序中的“IF–THEN”语句 。 THEN 一 侧指明需要构建的特定蛋白质 , 但只在 IF 特定化学信号存在的情况下 , 该蛋白质才会构建出来 , 每个基因都有其自身独特的 IF 条件 。这个结果 , 就像是富有适应性而经过高度压缩的一套计算机程序 , 由个体细胞在对其所在 环境进行响应的过程中自动执行 。 学习本身 , 也是基因的产品 。
奇怪的是 , 机器学习领域的大多数研究人员似乎并不想要与生物领域的这一方面发生互动 。 a 关于机器学习的文章很少与发展心理学的大量文献有什么关联 , 就算有所关联 , 也只是提到让·皮亚杰(Jean Piaget)这位业界先驱 , 而他早在近 40 年前就离世了 。 举例来说 , 皮亚杰提出的问题“将物体藏起来之后 , 婴儿是否知道此物依然存在”55 如今看来依然一针见血 , 但他给出的答案 , 正如他提出的认识发展阶段理论和他对儿童发现事物年龄的猜测 , 其方法论的依据并没能经得起时间的考验 , 如今看来 , 这些都是过时 的参考资料了 。
我们很少能见到机器学习的论文引用近 20 年来的发展心理学研究成果 , 更是看不到机器学习论文引用遗传学或发展神经科学的内容 。 通常来看 , 机器学习领域的人们会着重强调学习 , 但从不考虑先天知识 。 就好像是他们认为 , 因为他们在研究学习 , 所以任何具有价值的事物都不可能是先天的 。 但先天和后天并不构成如此的竞争模式 , 反之 , 你在起跑线上所拥有的越丰富 , 你能学习的就越多 。 但是 , 深度学习还是被“白板”视角所主宰 , 完全忽略掉任何形式的先天知识 。
我们认为 , 未来的人们在回顾时会将这种对先天的忽视看作一次巨大的疏忽 。 当然 , 我们并不否认从经验中进行学习的重要性 , 就算我们这些非常重视先天知识的人也懂得学习的重要性 。 但是 , 像机器学习领域的研究人员所做的那样 , 从空无一物的白板起步进行学习 , 会令这项任务的难度更加艰巨 。 这就相当于只有后天没有先天 , 而最有效的解决方案 , 应该是将两者合二为一 。
在生物界 , 生命体自出生之时就具备各自不同的先天能力 , 以及关于世界的一些知识 。 据我们了解 , 山羊生下来就能识别出山峦(或陡坡与平面)的作用 , 也对自己的身体有一定的了解 , 知道如何加以运用 。
正如哈佛大学发展心理学家伊丽莎白·史培基(Elizabeth Spelke)提出的观点一样 , 人类很可能自出生之时便了解世界由持续的物体所构成 , 这些物体沿时空的连接通路行进 , 拥有对几何和数量的感知能力 , 以及直觉心理 学的基础 。或如康德在 200 年前从哲学角度出发的观点 , 若想正确地对世界加以理解 , 先天的“时空流形”是不可或缺的 。
而且 , 语言之中的某些方面 , 很可能也部分地形成了先天的预连线 。 孩子或许天生就知道 , 周围的人们所发出的声音和做出的动作是在进行富有意义的沟通;59 而这种知识 , 与有关人类关系的其他先天基础知识(妈妈会照顾我等)相互联结 。 而且 , 人类语言的其他方面或许也是先天的 , 例如:将语言划分为句子和词汇;对语言发音特征的预期;语言所拥有的句法结构 ,以及句法结构与语义结构的关系 。
相比之下 , 一位从白板起步的纯粹的学习者则将世界当作纯粹的视听流 , 就像一个 MPEG 4 文件一样 。 这位学习者需要对每一样事物进行学习 , 就连反复出现的不同人物都要去学习 。 包括 DeepMind 在内的一部分研究者曾尝试着做过一些白板学习的事情 , 但结果远远不像利用同样的方法来下棋 那样令人惊叹 。


推荐阅读