人工智能的黎明:从信息动力学的角度看ChatGPT


人工智能的黎明:从信息动力学的角度看ChatGPT

文章插图
David S. Soriano, CC BY-SA 4.0 via Wikimedia Commons
导读:
      以ChatGPT为代表的新的人工智能语言模型的出现与更迭,引发人们极大的兴奋和关注 。
       物理学家祁晓亮从信息动力学的角度分析,认为AI革命的标志是信息处理复杂度的临界点 。AI还没有真正学会思考,但它的迅速发展会给科学研究和人类社会带来深刻的改变 。
祁晓亮 | 撰文
过去几个月,人工智能的新闻目不暇接,我感到自己好像是三体世界的一个居民,在看着地平线上的朝霞,知道一定有什么要发生,却不知道将要升起的是一轮还是两轮太阳 。
在这样一个时刻,个人的思考也许没什么用,但是却不能不思考,这也算是人类的本能 。因此,我在这里把一些粗浅的想法写下来,以供抛砖引玉之用 。需要提醒读者的是,本文不是广为接受的科研成果的介绍,而是只代表个人看法,观点谬误在所难免,欢迎读者批评指正 。
GhatGPT是怎样的临界点?
许多人都认为ChatGPT的横空出世是一个大事件,人工智能可能带来一场科技革命,但这究竟是一场怎样的变革,用什么样的判据来断言这场变革有多么重要?例如农业的发明、工业革命,是在能量利用的意义上,成为人类文明的里程碑 。相比之下,人工智能显然是在信息的层面上发生的革命 。这一点本身已经是老生常谈了,但这里有一个我想深入讨论的问题,就是大语言模型的诞生究竟是一个什么意义上的临界点?
我认为,重要的并不是ChatGPT能够实现多少功能,能够比之前的AI多做多少事情,问题的关键不是能力,而是复杂性——我们今天所看到的,是AI的信息处理复杂度的临界点 。
我们先来谈一下什么是信息处理 。从信息的角度来看人类历史,一切事件本质上都是信息的处理过程 。比如轮子的发明,需要有人(或者很多人)想到这个主意,摸索出制作方法,再把这个方法传下去 。轮子发明以后的人,在基因上和以前的人是一样的,但是他们可以享受轮子带来的便利,因为这条信息传了下来 。张良“运筹帷幄之中,决胜千里之外”是信息处理,他的传令兵把这个命令传给前线也是信息处理 。因为“处理”这个词给人一种信息是被动的、静态的感觉,我认为对于信息的传播和演化更准确的描述应该是“信息动力学”(information dynamics) 。人类历史本身就是信息的动力学过程,而具体的个人就是信息动力学演化的媒介和载体 。不同的信息处理有不同的复杂度,比如张良的决策复杂度显然要高于传令兵传令的复杂度 。粗略地来讲,复杂度量的就是最少需要多少个简单的步骤来实现一件事情 。这个复杂度有三个方面,一是输入信息的复杂度,二是信息处理本身的计算复杂度,三是输出信息的复杂度 。如果张良面对前线传来的复杂混乱的信息,考虑了方方面面的问题,最后让传令兵发了两个字“撤退”,那么在这个例子中,输入和处理的复杂度是高的,输出的复杂度是低的 。
【人工智能的黎明:从信息动力学的角度看ChatGPT】现在让我们回到现代 。在人工智能生成内容(Artificial Intelligence Generated Content,简称AIGC)之前的世界里,电脑、互联网、智能手机的发明已经极大地改变了人类社会,但从信息动力学的角度来看,你会发现机器做的事情非常简单,只有三种:复制,粘贴,排序 。互联网、社交媒体是通过一个网络,让人与人之间的信息传播(也就是复制粘贴)变得更加便捷 。google搜索、各种推荐算法是排序 。这个时代的信息动力学可以用图1(a)中的网络来代表 。从复杂性的角度来看,可以说所有复杂的信息处理都发生在人脑中 。机器除了复制粘贴以外,只有排序是复杂的运算,但是排序虽然可以是很复杂的算法,最终的输出却是简单的,只是一个序号,所以这个复杂运算一步之后就终结了,机器下一步只能把这个序号返回给人类,而无法自行迭代运用它的运算能力来完成更复杂的任务 。当一个中学生看到一个事件,发一个150字的微博表达自己的意见,这对于信息的处理就已经比ChatGPT以前任何的机器更复杂了 。
人工智能的黎明:从信息动力学的角度看ChatGPT

文章插图
图 1:(a)大语言模型出现之前的信息动力学 。电脑的工作局限于简单的复制粘贴(浅蓝色)或提供排序(深蓝色) 。(b)大语言模型出现之后的信息动力学 。AI可以和人一样进行复杂信息的处理 。


推荐阅读