国产AI大模型哪家强?十大维度横评四款主流大模型!( 四 )

文章插图
③ 文章写作
学生朋友们也可以利用大模型的文章生成能力,来生成范文,学习如何写好对应题材的文章 。这里IT之家以 "家庭环境对人成长的影响" 为主题,让四款大模型写一篇高考水平的作文,看看他们的写作能力如何吧 。
首先是文心一言写的作文,文章整体逻辑通畅,结构清晰,论点有条有理,可以成为学生写作时用以参考的素材,但是也有不足,首先是缺少论据,其次文章篇幅较短,扣 2 分 。

文章插图
通义千问的作文整体文笔看起来和文心一言差不多,语言也比较平实,缺少论据,但是它的文章字数是合格的,可以扣 1 分 。

文章插图
360 智脑方面,生成的结果不像是作文,字数、文笔等方面都不太能让人满意,扣 3 分 。

文章插图
最后是讯飞星火,它的文章和通义千问的差不多,条理清晰,观点明确,字数也合格,就是也没有论据来增加文章的可读性,扣 1 分 。

文章插图
④ 方案企划
身处职场的朋友经常会需要写一些方案、活动计划之类的,这时候也可以借助大模型的内容生成能力来帮助自己更快地完成任务 。这里IT之家以“我司计划开展一个读书活动,帮我写一个活动方案”为需求,来进行测试 。
文心一言给出的计划很完整,有条有理,可以成为一个不错的模板来使用 。

文章插图
通义千问设计的是一个大规模、长时间的读书活动,也可以执行,但是方案缺少足够的细节,有点笼统,可以扣 1 分 。

文章插图
360 智脑比通义千问还笼统,缺乏流程细节,这样的方案领导可能不会满意,这里就扣 2 分吧 。

文章插图
讯飞星火给出的方案则是比较完整的,时间、地点、目标、流程、前期准备、结果评估等环节都有,而且不缺细节,和文心一言一样是可用的方案 。

文章插图
小结,在内容生成方面,IT之家围绕文案创作、故事续写、作文写作和方案企划四个主题进行了测试,整体看下来讯飞星火和文心一言在内容生成方面是比较出色的,其中讯飞星火还要稍好一些 。本环节它们各自的评分为:
讯飞星火:9 分(作文 - 1)文心一言:8 分(作文 - 2)通义千问:7 分(文案 - 1,作文 - 1,企划 - 1)360 智脑:3 分(文案 - 1,故事 - 1,作文 - 3,企划 - 2)六、代码编写能力AI 大模型出圈时能写代码的技能也吸引了很多人的眼球,这也可以视为大模型内容生成能力的重要组成 。因此IT之家也测试了四款大模型产品的写代码能力 。
测试时,小编用下面这个问题来考验四款大模型:
请用 c# 语言生成以下代码:给你一个字符串 s,找到 s 中最长的回文子串 。如果字符串的反序与原始字符串相同,则该字符串称为回文字符串 。代码请遵循以下模板:public class Solution { public string LongestPalindrome(string s) { }}我们以代码能直接拿来使用为准则,将大模型生成的代码用程序运行工具进行检测,看是否能直接完美运行,若能运行就不扣分,不能运行就扣 3 分 。这个过程中,由于小编自己不懂代码,因此也找到IT之家的程序员同学来辅助评价 。
首先看文心一言的结果,它生成的代码看起来是有模有样的,有注释也有简介,格式也比较清晰规范 。

文章插图
不过在运行检测时,可以看到这个代码出现了执行错误,也就是不能直接运行,具体是代码上出现了数组越位的错误 。

文章插图
通义千问生成的代码,在 C# 语言下,代码格式没有缩进,观感不佳,而且出现了把题目中的括号错误识别到生成的代码中的问题 。

文章插图
推荐阅读
- 网易胡志鹏:从游戏到产业,AI大模型价值正显现
- 清华发布SmartMoE:一键实现高性能MoE稀疏大模型分布式训练
- 中科院:大模型一被夸智商就爆表!ChatGPT情商98分秒杀人类,Hinton预言成真?
- AI大模型下的人才竞争多激烈
- “被强制下架”的10部高分国产电影,最后一部至今都是童年阴影
- 华为HarmonyOS 4内置AI大模型,余承东:鸿蒙生态已过万重山
- 大模型上车,AI的又一个“狼来了”?
- 半年大模型,还在天上飞
- 数智商业技术2.0时代的新「三驾马车」,阿里妈妈郑波谈如何把握生成式大模型
- AI大模型能否继续扩展?