聊天机器人ChatGPT火出圈,能写论文、编代码、创作小说( 三 )


创新工场人工智能工程院执行院长王咏刚打了个比方,如果说传统的机器学习或人工智能是在水下一米的深处探索,那么深度学习的出现将人们带到了一百米的深水区;而在Transformer、GPT等架构后,从业者们直接能抵达深度超过万米的马里亚纳海沟 。
过去5年中,大规模预训练语言模型受到业内越来越多的重视 。王帅指出,过去依靠人工标注和精巧设计的训练方法,数据量大幅增加以后,表现并不好;相反,大家逐渐意识到,不断扩大模型规模、不断用更多数据去训练模型,是提高算法能力非常有效的一个手段 。
“目前看起来,这种模型太有用了 。而且从ChatGPT的结果来看,超出了我们的预料 。”王帅说,可以认为这种不断增加规模的大模型已经是领域的一种范式,可能人工智能领域未来有很多地方都可以用类似方法推进 。
“今天,全世界的人工智能研究有很多方向,也产生了大量的成果 。但是严格来说,所有这些最令人惊艳的结果,90%以上是基于Transformer迭代来的这些大模型技术得到的 。”王咏刚也指出,目前几乎所有的AI任务和项目,都会和大语言模型技术有关联,它已经代表了AI界最主流的科研和技术迭代方向 。 
2022年7月,Alphabet旗下的DeepMind公司与欧洲生物信息研究所的团队合作公布了生物学领域的一项重大飞跃 。他们利用人工智能系统AlphaFold预测出超过100万个物种的2.14亿个蛋白质结构,几乎涵盖了地球上所有已知蛋白质 。许多研究人员表示,这一系列突破将加速新药开发,并为基础科学带来全新革命 。而Alphafold同样是基于Transformer结构的深度学习模型 。
OpenAI是一家非营利性的研究机构,于2015年成立,由特斯拉创始人马斯克、创业孵化器Y Combinator总裁山姆·奥特曼、PayPal联合创始人彼得·蒂尔等硅谷大亨们创建,其愿景是实现安全的通用人工智能,并向公众开放 。
多位受访业内人士指出,大规模语言模型并不是OpenAI的“独门技术”;再加上人才和资金的雄厚,谷歌、微软、百度等AI领域的巨头公司并不是无法复制下一个ChatGPT 。实际上,ChatGPT诞生之前,硅谷巨头们都意识到了大语言模型的重要性,比如,DeepMind也发布了人工智能聊天机器人Sparrow,Facebook母公司Meta也有自己的同类产品 。
然而,不同的是,这些年来,OpenAI一直将资源集中在这个方向上 。在微软等巨头公司的资金和技术支持下,它不断将这种方法论推向极致 。“规模至上的这种理念和方法论是OpenAI特别推崇的,相对来说,其他公司或者团队没有他们这么坚信 。”王咏刚说 。 
不过,王咏刚说,在ChatGPT出圈之后,从业者们的心态是比较微妙的 。一方面,业界可能会越来越重视这条路径,投入更多资源;另一方面,大家又希望它不是AI领域唯一核心的方法,还能够有空间探索更多的可能性 。
“仅仅靠数据驱动的路径,虽然能让AI在一些领域达到接近或者超过人类的水平,例如人脸识别,但在另一些领域,比如自动驾驶,我们需要的是接近100%的安全性 。”康奈尔大学计算机教授巴特·塞尔曼就认为,这最后的10%、5%的提升,可能不是深度学习本身能够解决的,需要不同的思路 。
对AI的理解落后于其发展速度
2022年9月,一位年轻人用Al绘画工具Midjourney生成的作品《太空歌剧院》,在美国科罗拉多州博览会的美术比赛中获得大奖,获奖类别是“数字艺术/数字修饰照片”组第一名 。不过,这引发了一场人文争议和反AI绘画的浪潮 。
有网友表示,我们眼睁睁地见证了艺术的死亡,“如果连艺术工作都无法避免被机器所吞没,那么高技能的工种也将面临被淘汰的危机 。到时候,我们又能剩下什么呢?”
刘少山谈到,AI科学家们最初的猜想是,AI大发展后,一些蓝领岗位、重复性的工作会首先被取代 。然而,ChatGPT、AlphaFold等工具出来后,人们发现,最先感受到AI冲击的,反而是创造性的工作,而送餐这一类涉及劳动力的工作却没能被取代 。他解释说,在机器人、自动驾驶等领域,机械与智能是两个基本的模块 。现实进展来看,机械部分有很多物理上的限制,很多技术目前尚未突破;得益于深度学习等模型的发展,智能部分反而突破更快 。
这些涉及创造力、知识探索、信息获取的行业,是人文领域的核心,是人类最担心被机器化的部分 。一直以来,AI在这些领域的重大突破都伴随着广泛的伦理争议 。 


推荐阅读