碾压GPT-4,微软最强AutoGen爆火!多个智能体协作,编码速度飙升4倍,GitHub狂揽10k星


碾压GPT-4,微软最强AutoGen爆火!多个智能体协作,编码速度飙升4倍,GitHub狂揽10k星

文章插图
新智元报道
编辑:桃子
【新智元导读】AutoGPT之后,AutoGen逆袭成功 。
AI智能体热度,只增不减 。
发布仅2周,微软、PSU和华盛顿大学等团队开发的智能体AutoGen瞬间登顶Github热榜,狂揽10k星 。
这是一个让LLM智能体相互聊天,进而解决任务的框架,可定制、可对话,并允许人类无缝参与 。
碾压GPT-4,微软最强AutoGen爆火!多个智能体协作,编码速度飙升4倍,GitHub狂揽10k星

文章插图
它还可以直接替代OpenAI.Completion或openai.ChatCompletion作为增强型推理 API 。
现在 , 你只需要几行代码,就能完成非常复杂的任务 。
对此,研究人员还发布了一份关于AutoGen的43页技术报告 。
碾压GPT-4,微软最强AutoGen爆火!多个智能体协作,编码速度飙升4倍,GitHub狂揽10k星

文章插图
论文地址:https://arxiv.org/pdf/2308.08155.pdf
接下来,一起来看看这个爆火项目背后的技术吧 。
动嘴做任务
若想使用,首先得安装AutoGen 。需要Python/ target=_blank class=infotextkey>Python版本>=3.8版本,只需一步,非常简单 。
  •  
pipinstall pyautogen
碾压GPT-4,微软最强AutoGen爆火!多个智能体协作,编码速度飙升4倍,GitHub狂揽10k星

文章插图
然后,就能上手用了 。
比如,我想要一个股价可视化图 , 首先自定义一个「编码智能体」 , 能够下载数据并绘制图表 。
碾压GPT-4,微软最强AutoGen爆火!多个智能体协作,编码速度飙升4倍,GitHub狂揽10k星

文章插图
然后,自定一个「user proxy agents」,去做跑代码、获取结果等任务 。
碾压GPT-4,微软最强AutoGen爆火!多个智能体协作,编码速度飙升4倍,GitHub狂揽10k星

文章插图
最后一步,给定明确任务——绘制一份Meta和微软当前YTD股价图 。
碾压GPT-4,微软最强AutoGen爆火!多个智能体协作,编码速度飙升4倍,GitHub狂揽10k星

文章插图
然后,两个智能体便开始对话,忙着去做表了 。
碾压GPT-4,微软最强AutoGen爆火!多个智能体协作,编码速度飙升4倍,GitHub狂揽10k星

文章插图
当然了,不仅2个智能体,你还可以添加更多AI帮你干活,比如再自定义一个「产品经理」,让它去脑暴想法 。
碾压GPT-4,微软最强AutoGen爆火!多个智能体协作,编码速度飙升4倍,GitHub狂揽10k星

文章插图
然后,使用它们一起查找最近一篇GPT-4的研究,以及关于其在软件中的应用 。
接下来,3个智能体就开始「密谋」了 。
碾压GPT-4,微软最强AutoGen爆火!多个智能体协作,编码速度飙升4倍,GitHub狂揽10k星

文章插图
以上的演示,仅是一个前菜 。
根据技术报告,给出了通过AutoGen6个应用的构建 , 可以解决数学问题,检索增强型聊天、ALF聊天、多智能体编码、动态群组聊天、国际象棋对弈 。
碾压GPT-4,微软最强AutoGen爆火!多个智能体协作,编码速度飙升4倍,GitHub狂揽10k星

文章插图
在自主解决数学问题上,研究人员通过AutoGen与AutoGPT、ChatGPT+Plugin、ChatGPT+Code Interpreter等进行了定性和定量评估 。
通过在对MATH数据集中的2个数学问题评估中,每个LLM系统都在每个问题上测试了3次 , 只有AutoGen的胜率最高 。
碾压GPT-4,微软最强AutoGen爆火!多个智能体协作,编码速度飙升4倍,GitHub狂揽10k星

文章插图
AutoGen框架
AutoGen背后的基本理念是,创建智能体,即由LLM(如GPT-4)驱动的编程模块 。
这些智能体通过自然语言交互,以完成各种任务 。
碾压GPT-4,微软最强AutoGen爆火!多个智能体协作,编码速度飙升4倍,GitHub狂揽10k星

文章插图
智能体可以通过提示工程 , 和外部工具对进行定制和增强,使其能够检索信息或执行代码 。
借助AutoGen,开发人员可以创建一个「智能体生态系统」 , 这些智能体可以专门从事不同的任务并相互协作 。
碾压GPT-4,微软最强AutoGen爆火!多个智能体协作,编码速度飙升4倍,GitHub狂揽10k星

文章插图
这一生态系统的一个简化视图是,将每个智能体视为一个单独的ChatGPT会话,并有独特的系统指令 。
例如 , 一个智能体可以作为编程助手,根据用户请求生成Python代码 。另一个智能体可以是代码审查员,负责获取Python代码片段并排除故障 。
第一个智能体的响应可以作为输入,传递给第二个智能体 。
其中一些智能体甚至可以访问外部工具 , 这相当于ChatGPT插件,如Code Interpreter或Wolfram Alpha 。
AutoGen在这里的作用就是,为创建这些智能体并使它们能够自动交互提供了必要工具 。
碾压GPT-4,微软最强AutoGen爆火!多个智能体协作,编码速度飙升4倍,GitHub狂揽10k星

文章插图
上图中 , 说明了如何使用AutoGen对多智能体对话进行编程 。


推荐阅读