
文章插图
整体来说,文心一言、讯飞星火、360 智脑在 AI 助理方面的表现都能够让人满意,通义千问虽然也有 AI 助理,但目前数量还略少 。这一环节,小编给四款大模型产品的评分分别为:
文心一言:10 分讯飞星火:10 分360 智脑:10 分通义千问:9 分结语本次横评,IT之家从终端支持、语言理解能力、知识丰富性、逻辑推理能力、内容生成能力、代码编写、多轮对话能力、实时搜索能力、多模态输入输出、AI 助手功能支持十个方面对文心一言、讯飞星火、通义千问和 360 智脑四款大模型做了详细的体验横评 。
整体测下来,如大家所见,讯飞星火、文心一言在产品体验的全面性方面是比较出色的 。特别是讯飞星火让IT之家感到惊喜,在很多项目中的表现还要更胜文心一言这样的明星选手一筹,突出一个“稳”,而且在实时搜索、代码编写方面优势明显,这也可以看出科大讯飞在自然语言理解方面的 AI 技术确实有深厚的积淀 。
当然,讯飞星火也不是完美的,主要就是目前多模态支持上略显单一,还有逻辑推理环节稍有不足 。
文心一言的整体体验也不错,它在内容生成、避坑能力、多模态输出等方面有优势,但是在逻辑推理环节有不足,对比讯飞星火则主要在实时搜索、内容生成和摘要提炼上略处下风,但整体上,也是很值得推荐给大家使用的国内大模型产品 。
360 智脑在多模态支持、AI 助手方面比较有亮点,但是在内容生成、语言理解、逻辑推理等比较基础的体验方面,能感觉到还有一些待完善的空间,特别是内容生成,成为 360 智脑在这次测试中的主要扣分项 。
通义千问目前在功能全面性、完善性和细节体验上差强人意,就本次测试过程来说,在多轮对话、语意理解、文案创作等方面表现不错,其他方面体验大多存在不足,总体来说也还是可以使用的水平,当然这也和通义千问目前侧重于在电商业务的探索、应用有关 。
下面再回顾一下每款产品的总分数:
讯飞星火:93 分文心一言:84 分360 智脑:75 分通义千问:71 分最后要说的是,本次横评所使用的问题样本毕竟有限,大家实际体验时的感受可能与IT之家横评的内容有出入,因此上述评分也仅供大家参考,实际选择时,大家还是要根据自身的感受来选用适合自己的 AI 大模型 。
同时,IT之家也期待随着云端、终端算力的增强,训练推理的轮数不断深入以及语料库的持续丰富,各家国产 AI 大模型产品能够千帆竞渡,在可用性、成熟度和使用体验方面能够以比想象中更快的速度进化,持续推动 AI 深刻变革我们的生产和生活 。
【国产AI大模型哪家强?十大维度横评四款主流大模型!】
推荐阅读
- 网易胡志鹏:从游戏到产业,AI大模型价值正显现
- 清华发布SmartMoE:一键实现高性能MoE稀疏大模型分布式训练
- 中科院:大模型一被夸智商就爆表!ChatGPT情商98分秒杀人类,Hinton预言成真?
- AI大模型下的人才竞争多激烈
- “被强制下架”的10部高分国产电影,最后一部至今都是童年阴影
- 华为HarmonyOS 4内置AI大模型,余承东:鸿蒙生态已过万重山
- 大模型上车,AI的又一个“狼来了”?
- 半年大模型,还在天上飞
- 数智商业技术2.0时代的新「三驾马车」,阿里妈妈郑波谈如何把握生成式大模型
- AI大模型能否继续扩展?
