大模型心高气傲,没有AI Agents生死难料

文|脑极体
AI Agent,正在接棒大语言模型LLM,成为AI圈最火的话题 。
目前,AI创投圈的众生相,大概是这样的:
【大模型心高气傲,没有AI Agents生死难料】大厂俱乐部:OpenAI内部员工声称,AI Agent是OpenAI的新方向;微软尝试推动copilot,让AI以助理的角色落地,这是一种典型的AI Agent场景;英伟达推出了Voyager,这个AI Agent可以自主写代码,独霸游戏《我的世界》;国內商汤也推出了通才AI智能体;阿里推出了数字员工……
学术圈:今年四月,斯坦福创建了一个西部世界小镇,让25个AI Agents在虚拟小镇的沙盒环境中模拟人类,与其他AI Agents恋爱、派对、协作、约会等 。另外,也有学者开始利用AI Agents设计复杂科学实验,包括自动上网阅读论文、研究抗癌药物……这些前沿探索让人大开脑洞 。
创业圈:AI Agent并不只是顶级科学家的游戏,目前已经涌现出了Camel、AutoGPT、BabyAGI、AgentGPT等非常多的项目,并有一大批开源社区开发者和创业者,利用这些开源项目打造一些实用工具 。比如aomni,就是一个帮助用户抓取网络信息并邮件发送的AI Agent应用程序 。
投资圈:AI Agent被认为是“通往通用人工智能(AGI)时代的开始”,其爆发是“铁板钉钉”,有硅谷创业者表示,跟投资人聊到Generative Agents,大家都特别期待,并希望多了解、靠的更近,在后续爆发时反应更快 。
从这些判断来说,说“AI Agent开启大模型下半场”,还为时尚早,但“AI Agent是大模型的商业化标配”,应该是清晰的了 。
所以,接下来我们应该会看到,更多大厂和创业公司,都在AI Agent上有更多动作 。
那么,AI Agent究竟是什么?为什么说它是大模型商业化的必要条件?
大模型心高气傲,用户仍不买单
这里我们先把AI Agent放在一边,来看看大模型究竟是一个什么状况 。
相信大多数读者都认可,大模型是一个高愿景、高投入、高门槛的东西,往情怀说,可能实现通用人工智能,彻底改变社会;往世俗说,可以重构业务/产品,让科技企业业绩狂飙 。
但这些都有建立在,大模型能够真正商业化落地,回收研发成本,良性可持续发展的基础上 。
几个月下来,大模型的两个商业模式,是比较有效的:一个是各类行业政企对大模型的私有化本地部署;一个是通过云、AI服务器等售卖大模型所需要的算力 。
目前,已经有国內厂商发布了相应的业务报告,已经从行业私有化部署的需求中获得了千万级收入 。
但是,仅靠ToB业务,显然不能支撑起一个大模型的商业模式 。
一场技术革命,核心技术一定要流淌出去,让几十亿普通用户用起来,才能创造出经济价值 。家用PC、互联网、智能手机,都是在大众普及之后,诸多科技企业的市值一飞冲天 。
现在,巨头们都为训大模型投入了大量资源,尤其是基础模型,动辄千亿、万亿的参数规模,必须让大众用户用起来 。
那么,实际应用体验怎么样呢?
闲聊、画图、创意之类的场景容错率高,就算AI答错了用户还觉得“萌萌哒”,这部分应用已经很卷了,比如“AI证件照” 。而绝大多数场景,都是需要AI来自动帮助自己处理较为严肃的任务,与其他环境条件进行协作,应对长线条、连续性的业务,不要出现太多错误,不然人还得大量参与,并不能真的提高生产力 。
这类场景,显然目前,一个庞大且复杂的通用大模型,是不能很好地解决的 。
就拿我这种撰稿来说,让大模型帮我写稿子,它可能有幻觉,提到的事件/新闻/论文我都得再次复查确认一下,比我自己找资料还费事,不够精准,想一个创意还得我用提示词启发半天,都不一定有能用的,又慢又累,还不如自己写 。
不能一步到位,自动化地完成任务,需要大量人类参与干预review,是目前大模型在严肃场景中应用的一大难点,也直接影响到了大模型落地和商业化的进展 。
怎么办呢?大模型想要表现出色,急需一群帮手,那就是AI Agents 。
真·解放生产力,AI Agent为什么神奇?
试想一下,如果大模型能自己全天7*24小时工作,还不需要人工参与,自己就能完成各种任务,人只要偶尔回到电脑前、办公室看看它做的咋样,这才是大模型的正确打开方式啊 。
OpenAI在GPT-4发布会上,确实也展现了一些自动化完成任务的能力,比如让GPT4识别草图生成网页,step by step一步步修改自己代码中错误 。


推荐阅读