ChatGPT为何没能诞生在中国?

2月9日 , 发表在美国《科学公共图书馆·数字健康》的一篇文章提到 , ChatGPT参加了美国执业医师资格考试 。这项以高难度著称的考试中 , 共350道题 , 内容涵盖基础科学、生物化学、诊断推理和生物道德学 。ChatGPT未经专门的培训或强化 , 经过两名评审员打分 , 三部分的成绩接近或超过了及格门槛 , 并表现出了高度的一致性和洞察力 。
近两个多月 , 这款聊天机器人写诗、写小说、敲代码 , 几乎无所不能 , 掀起一场AI风暴 。比尔·盖茨称赞 , ChatGPT将会“改变我们的世界” 。但OpenAI 首席执行官山姆·奥特曼也承认 , ChatGPT虽然很酷 , 却频繁出现错误信息 , 经常宕机 , 是个“糟糕的产品” 。
近日的一次采访中 , 奥特曼说 , 现在推出的ChatGPT只是70分版本 , 还在准备更加强大的模型以及在研究更多东西 , “不把这些东西拿出来的原因是 , 人们会认为我们有一个完整的通用人工智能(AGI) , 准备好按下按钮 , 这还差得远” 。

ChatGPT为何没能诞生在中国?

文章插图
图/IC
有更高“情商” , 但不必神化
为与ChatGPT较量 , 当地时间2月6日 , 谷歌宣布 , 将推出自己的AI聊天机器人Bard , 并在推特发布了宣传样片 。Bard使用的是谷歌在2021年推出的大型语言模型LaMDA , 所用技术与ChatGPT相似 。
宣传样片中 , 有人提问 , “请问詹姆斯·韦伯太空望远镜有哪些新发现?”Bard给出3个条理分明的回答 , 但两条是错误的 。Bard称 , “韦伯望远镜发现‘绿豌豆’星系的时间是在2023年” , 这一回答的正解是2022年7月 。“该望远镜拍摄了太阳系外行星首张照片”的回答也不准确 , 2004年 , 欧洲南方天文台利用智利的超大望远镜已拍摄了太阳系外行星照片 。
这款聊天机器人目前仍在内测 , 会在未来几周开放给更多公众 。首秀“翻车”两天后 , 谷歌母公司Alphabet股价大跌 , 市值损失1000亿美元 。
当地时间2月7日 , 微软紧随其后发布了新品 , 推出新版搜索引擎必应和Edge浏览器 , 新增了和ChatGPT一样的AI语言模型GPT3.5 , 微软称之为“普罗米修斯” , 并表示比ChatGPT更强大 。微软演示中 , 搜索“宜家双人座椅是否适合2019年款本田某商务车型” , 除传统搜索页面外 , 页面右侧多了一个聊天窗口 , 详细列出宜家双人座椅和这款车的车内空间尺寸 , 给出使用建议 , 并附上相关链接 。该搜索引擎仍在试用阶段 , 微软CEO萨蒂亚纳德称这一天为“搜索领域崭新的一天” , 并向谷歌宣战 , “比赛从今天开始” 。
2022年11月30日 , OpenAI推出了ChatGPT 。该公司总裁格雷戈·布洛克曼在接受采访时坦言 , “当时并不知道它是否成功” 。全球最领先的AI语言模型如此直接、低门槛地向普通大众敞开怀抱 , 并接受所有人的“审视” , 这几乎是第一次 。
前微软亚洲互联网工程院副院长、现小冰公司CEO李笛对《中国新闻周刊》分析说 , ChatGPT之所以出圈 , 特别之处在于 , 它被普通用户观察到 , 并超过了人们对人工智能的预期 。
用户尝试用千奇百怪的问题试探ChatGPT的边界 。它听得懂一段相当复杂的指令 , 比如 , “给OpenAI创始人写一封英文采访邮件 , 探讨对ChatGPT使用的理性思考 , 提到ChatGPT的热度及遭受教育界抵触的事实 , 并列出5个问题” 。它能指出一段话中的语法和逻辑错误 , 有人恶趣味地骗它 , “我吃了一辆汽车 , 现在有点饿 , 该怎么办?”它很快识破 , “很抱歉 , 吃汽车是不可能的 , 如果您感到饥饿 , 我建议您吃点实际的食物 。”甚至你还可以要求ChatGPT在聊天中再构建一个ChatGPT , 看着它和自己聊天 。
今年1月 , 美国北密歇根大学哲学教授安东尼·奥曼向《纽约时报》提到 , 他曾收到一份“班级中最好的论文” , 段落简洁 , 举例恰当 , 论据严谨 , 令人生疑 。随后这位学生承认 , 文章是ChatGPT写的 。美国一家医疗保健创业公司的临床医生尝试让ChatGPT参加美国执业医师资格考试 。这项标准化考试 , 考生至少要专门腾出300~400小时备考 , 最难的部分面向研究生 。研究者下载了一份2022年6月的考题 , 确保ChatGPT从未训练过相关数据 , 也不知道考题答案 , ChatGPT考试成绩基本合格 。该团队认为 , 这些结果表明 , 大型语言模型可能有助于医学教育 , 并可能有助于临床决策 。


推荐阅读