国产AI大模型哪家强?十大维度横评四款主流大模型!( 七 )


国产AI大模型哪家强?十大维度横评四款主流大模型!

文章插图
整体来说,文心一言、讯飞星火、360 智脑在 AI 助理方面的表现都能够让人满意,通义千问虽然也有 AI 助理,但目前数量还略少 。这一环节,小编给四款大模型产品的评分分别为:
文心一言:10 分讯飞星火:10 分360 智脑:10 分通义千问:9 分
结语本次横评,IT之家从终端支持、语言理解能力、知识丰富性、逻辑推理能力、内容生成能力、代码编写、多轮对话能力、实时搜索能力、多模态输入输出、AI 助手功能支持十个方面对文心一言、讯飞星火、通义千问和 360 智脑四款大模型做了详细的体验横评 。
整体测下来,如大家所见,讯飞星火、文心一言在产品体验的全面性方面是比较出色的 。特别是讯飞星火让IT之家感到惊喜,在很多项目中的表现还要更胜文心一言这样的明星选手一筹,突出一个“稳”,而且在实时搜索、代码编写方面优势明显,这也可以看出科大讯飞在自然语言理解方面的 AI 技术确实有深厚的积淀 。
当然,讯飞星火也不是完美的,主要就是目前多模态支持上略显单一,还有逻辑推理环节稍有不足 。
文心一言的整体体验也不错,它在内容生成、避坑能力、多模态输出等方面有优势,但是在逻辑推理环节有不足,对比讯飞星火则主要在实时搜索、内容生成和摘要提炼上略处下风,但整体上,也是很值得推荐给大家使用的国内大模型产品 。
360 智脑在多模态支持、AI 助手方面比较有亮点,但是在内容生成、语言理解、逻辑推理等比较基础的体验方面,能感觉到还有一些待完善的空间,特别是内容生成,成为 360 智脑在这次测试中的主要扣分项 。
通义千问目前在功能全面性、完善性和细节体验上差强人意,就本次测试过程来说,在多轮对话、语意理解、文案创作等方面表现不错,其他方面体验大多存在不足,总体来说也还是可以使用的水平,当然这也和通义千问目前侧重于在电商业务的探索、应用有关 。
下面再回顾一下每款产品的总分数:
讯飞星火:93 分文心一言:84 分360 智脑:75 分通义千问:71 分
最后要说的是,本次横评所使用的问题样本毕竟有限,大家实际体验时的感受可能与IT之家横评的内容有出入,因此上述评分也仅供大家参考,实际选择时,大家还是要根据自身的感受来选用适合自己的 AI 大模型 。
同时,IT之家也期待随着云端、终端算力的增强,训练推理的轮数不断深入以及语料库的持续丰富,各家国产 AI 大模型产品能够千帆竞渡,在可用性、成熟度和使用体验方面能够以比想象中更快的速度进化,持续推动 AI 深刻变革我们的生产和生活 。

【国产AI大模型哪家强?十大维度横评四款主流大模型!】


推荐阅读