内容不可信与交互成本高,是ChatGPT商业化最大阻碍

每经采访人员:可杨 每经编辑:董兴生
从吟诗作赋 , 到写代码 , 再到写剧本、做高数 , OpenAI发布的免费机器人对话模型ChatGPT回答处理多领域问题的能力之强悍 , 引发全球关注 。
尽管该模型目前仍处于测试阶段 , 但面世仅一周 , 便有超过一百万用户使用 。“明天ChatGPT就要抢走人类饭碗”的调侃也不绝于耳 。

内容不可信与交互成本高,是ChatGPT商业化最大阻碍

文章插图
视觉中国图
已拥有多个AI聊天机器人成功落地案例的国内顶尖人工智能公司小冰 , 如何看待风靡全球的ChatGPT?
带着这个问题 , 12月8日《每日经济新闻》采访人员专访了小冰公司CEO李笛 。他认为 , 市场对于ChatGPT取代搜索引擎 , 以及在其他各个领域实现商业化落地的畅想 , 短期内不太可能到来 , 成本将成为制约其实现商业化的重要阻碍 。他举例说 , 如果小冰用ChatGPT的方法来运行系统 , 现在小冰每天承载的交互量就需要花几亿人民币的对话成本 。
市场对ChatGPT热情过度
在李笛看来 , 目前 , 行业内对ChatGPT的关注与热潮已经有些过度 。
“人类为什么会感到激动?”李笛觉得 , 当人们普遍对一件事情有一种预期 , 进而去交互时 , 发现它远超大家的预期 , 人们就会惊讶 , “但即使是针对人工智能 , 在最近这些年惊讶的次数也很多了;稍微往前一点 , GPT3出来的时候大家就很惊讶 , 但是也没有发生什么;再往前 , AlphaGo下围棋赢过最好的人类棋手 , 大家也很惊讶 , 但是之后似乎也没有改变什么 。”
【内容不可信与交互成本高,是ChatGPT商业化最大阻碍】不过 , 李笛也提到 , 关于ChatGPT , 有三件事情需要相对理性来看 。
首先 , ChatGPT有非常好的创新 , 即证明了在原有的大模型基础之上 , 进行一些新的训练方法 , 可以更好地提高对话质量;其次 , ChatGPT并不构成一个大版本的迭代 , 而是对上一个版本的微调 , 在一定程度上弥补了极大参数量的大模型的一些缺陷 。“即便是OpenAI来讲 , 它也被定义为GPT3.5 , 而不是GPT4 。”此外 , 李笛认为 , ChatGPT的突破 , 主要是研究性质上的突破 。
对目前市场普遍想象的ChatGPT是否马上就会迎来商业化落地、产生颠覆性的影响 , 李笛认为不太可能 。“但是 , 这一点都不影响我们在最近这些年里 , 尤其是在大模型的思路出来以后 , 我们又一次看到在对话上的一个很大变化 , 在这条路上大家都在往前走 。”
ChatGPT在训练方法上 , 具体做了怎样的创新 , 以至于能够大大提升其作为聊天机器人的对话质量?
李笛分析称 , 很多人说ChatGPT的训练是基于人类反馈 , 这并不完全准确 。人类反馈至少有两个含义 , 一是指在训练中 , 通过反馈来实现;另外则是产品在与用户交互时 , 通过大量的用户与其交互形成的反馈 , 不停地让模型进步 。“这两者的价值是非常不一样的 , 更大的价值其实在于后者 , 即产品在交互过程中得到反馈 。”
李笛介绍 , 过去对于AI聊天机器人的训练主要是基于数据 , 即在机器进行对话后 , 针对对话内容进行训练 , 调整、优化对话内容的数据;而ChatGPT则是针对数据形成的模型进行训练 , 简单而言 , 具体的训练方式是:人先写出一些指导性的问与答 , 用这些问答对大模型进行训练 , 通过一系列反馈式的训练方法 , 让大模型逐渐沿袭人所给予的关于问答的指导性意见、逻辑 。“从这个角度讲 , 即使是进行多轮对话 , ChatGPT本质上来讲依旧是一个问答系统 。”
李笛认为 , 这样的训练方法背后的技术含量 , 通常不是算法模型上的技术含量 , 而是来自训练者本身的能力 , 包括团队自身的经验积累 。例如 , 由人来写问与答 , 让机器学习并给出结果 , 同时人要再对此给出评分 , 这其中有很多个体差异 , 这种个体差异则在一定程度上决定了其最后呈现的成果 。


推荐阅读