国产AI大模型哪家强？十大维度横评四款主流大模型！( 七 ) _AI大模型

文章插图
整体来说，文心一言、讯飞星火、360 智脑在 AI 助理方面的表现都能够让人满意，通义千问虽然也有 AI 助理，但目前数量还略少。这一环节，小编给四款大模型产品的评分分别为：

文心一言：10 分讯飞星火：10 分360 智脑：10 分通义千问：9 分

结语本次横评，IT之家从终端支持、语言理解能力、知识丰富性、逻辑推理能力、内容生成能力、代码编写、多轮对话能力、实时搜索能力、多模态输入输出、AI 助手功能支持十个方面对文心一言、讯飞星火、通义千问和 360 智脑四款大模型做了详细的体验横评。
整体测下来，如大家所见，讯飞星火、文心一言在产品体验的全面性方面是比较出色的。特别是讯飞星火让IT之家感到惊喜，在很多项目中的表现还要更胜文心一言这样的明星选手一筹，突出一个“稳”，而且在实时搜索、代码编写方面优势明显，这也可以看出科大讯飞在自然语言理解方面的 AI 技术确实有深厚的积淀。
当然，讯飞星火也不是完美的，主要就是目前多模态支持上略显单一，还有逻辑推理环节稍有不足。
文心一言的整体体验也不错，它在内容生成、避坑能力、多模态输出等方面有优势，但是在逻辑推理环节有不足，对比讯飞星火则主要在实时搜索、内容生成和摘要提炼上略处下风，但整体上，也是很值得推荐给大家使用的国内大模型产品。
360 智脑在多模态支持、AI 助手方面比较有亮点，但是在内容生成、语言理解、逻辑推理等比较基础的体验方面，能感觉到还有一些待完善的空间，特别是内容生成，成为 360 智脑在这次测试中的主要扣分项。
通义千问目前在功能全面性、完善性和细节体验上差强人意，就本次测试过程来说，在多轮对话、语意理解、文案创作等方面表现不错，其他方面体验大多存在不足，总体来说也还是可以使用的水平，当然这也和通义千问目前侧重于在电商业务的探索、应用有关。
下面再回顾一下每款产品的总分数：

讯飞星火：93 分文心一言：84 分360 智脑：75 分通义千问：71 分

最后要说的是，本次横评所使用的问题样本毕竟有限，大家实际体验时的感受可能与IT之家横评的内容有出入，因此上述评分也仅供大家参考，实际选择时，大家还是要根据自身的感受来选用适合自己的 AI 大模型。
同时，IT之家也期待随着云端、终端算力的增强，训练推理的轮数不断深入以及语料库的持续丰富，各家国产 AI 大模型产品能够千帆竞渡，在可用性、成熟度和使用体验方面能够以比想象中更快的速度进化，持续推动 AI 深刻变革我们的生产和生活。

【国产AI大模型哪家强？十大维度横评四款主流大模型！】