人工智能时代的中文和英文,谁能成为AI的母语?

人工智能是当前最热门的技术 , 各国都在投入资金和人力进行研究 。 谁错过了人工智能 , 谁就丢掉了未来 。
一、语音识别
虽然我不想承认 , 但英文语音识别确实比中文更准确、高效 。
英文由26个字母构成 , 逻辑结构更简单 , 发音以字母为基础 , 音标和音标区之间区分比较明显 , 只要说的不是很快 , AI能比较容易、准确识别每一个字母 , 加上同音单词比较少 , 所以英文的语音识别效率领先中文许多 。
语音识别 , 英文胜 。
二、文字识别
到文字识别环节 , 我们终于可以扬眉吐气了 , 中文文字识别的效率和准确度比英文更胜一筹 。
中文有几个特点 , 让AI识别更高效:
1、汉字信息密度高 , 更少的字数可以承载更多的信息 , 中文文章永远比英文短 , 综合来看 , 中文信息密度比英文高37.5% 。
3、汉字独立表意能力强 。 比如“他去吃早饭” , 你看一个字就能多明白一个字的意思 。 而英文“Hewenttohavebreakfast” , 你即使看到“have”这个词 , 你依然不明大概的意思 , 只有到“breakfast”你才知道原来have是吃 , wentto是去 , 整句是去吃早饭 。 英文表意比较依赖“短语” , 甚至整句 , 不看完整句话 , 你往往不能知道句意 。 这就给AI识别造成了难度 , 因为AI跳跃识别能力较差 。
文字识别 , 中文胜 。
三、同音字词
中文发展人工智能最大障碍就是同音字词现象!比如 , 他姓zhang , 到底是“张”还是“章”呢?如果是口语的话 , 还要补一句弓长张 , 或立早章 。 中文里有多少同音字、同音词 , 很难准确的统计 。 同音字词也是英语使用者攻击中文表意不清最大的借口 。
AI现在不能准确处理多音字 , 出错在所难免 。 难道为了AI准确 , 人类只能通过语言文字改革消灭多音字词?这工程也太大了 , 人类也很难适应这么大的改革!
同音字词 , 英文胜 。
四、多义字词
一词多义 , 是每种成熟语言都难免的 , 世间万事万物这么多 , 情感这复杂 , 如果每个词汇只表达一个准确的意思 , 那几百万字词都收不住 。 无论是中文还是英文 , 一个字词不会只表达一个意思 , 通常有很多意思 , 有时候区别还很大!
现在人工智通过上下文识别词义的能力还比较弱 , 遇到多义词的时候经常出错 , 这也是人工智能发展的难关 。
多义字词 , 中文和英文彼此彼此 。
五、整段识别
原文如下:
"Thingsthattrendinthesetwocountriesareinsanelydifferent.Forexample:knowledge-basedcontentisextremelypopularinChina,andlesssointheU.S.Also,thiswaswildtome:thosecreatorsthatdidthemostdancevideosinChinaareusersborninthe60s(!!),whereasintheUS,itseemsthatit'smostlyteenagerswhoarecreatingthedances,"shewrote.
她写道:“这两个国家的趋势截然不同 , 比如:知识性内容在中国很流行 , 但在美国稍差一些 。 而且 , 这一点对我来说很疯狂:中国最喜欢拍舞蹈视频的是60后(!!) , 但在美国 , 好像是年轻人最喜欢拍舞蹈视频 。 ”
AI将“英文原文”翻译成中文如下:
“这两个国家的趋势截然不同 。 例如:以知识为基础的内容在中国非常受欢迎 , 而在美国却很少 。 此外 , 这对我来说很疯狂:在中国制作舞蹈视频最多的创作者是她出生于60年代(!!)的用户 , 而在美国 , 似乎是大多数年轻人在创作舞蹈 。 ”她写道 。
有一句失真比较严重:“在中国制作舞蹈视频最多的创作者是她出生于60年代(!!)的用户 。 ”
这句话的英文原文是:“thosecreatorsthatdidthemostdancevideosinChinaareusersborninthe60s” 。 这是一句英语长句 , 词序比较复杂 , 又夹杂了乱七八糟的介词 , 导致人工智能的大脑错乱 , 没能准确识别!
AI将“中文原文”翻译成英文如下:
"Thetrendsinthesetwocountriesarequitedifferent.Forexample,intellectualcontentisverypopularinChina,butabitworseintheUnitedStates.Moreover,thisiscrazytome:China’sfavoritedancevideoisborninthe60s(!!),butintheUnitedStates,itseemsthatyoungpeopleliketoshootdancevideosthemost,"shewrote.
中文翻译非常精准 , 和原文在表意上几乎没有任何差别 , 如实还原了原文的意思!可见 , 在整段话、整篇文章的识别上 , 中文比英文更有优势!
中文是由一个个汉字构成 , 长句很少 , 语法简单 , 词序简单 , 在语句结构上比线性的英语简单的多 , 更有利于AI识别 。
六、谁才是人工智能的未来?
城市、经济、科技、地理、人文 , 欢迎关注猴军集!


    推荐阅读