#栈外#我们还要多久才能拥有?,钢铁侠的AI助理贾维斯( 二 )
Google为机器翻译悄悄研究了十年循环神经网络 , 之后Google翻译运用了经庞大的数据集训练的神经网络 , 迎来了商业规模翻译领域的质变飞跃 。
Google翻译的引擎 , 被称为Google神经机器翻译系统(GNMT) , 在2016年就可以轻松翻译10,000组语言 。
自NMT出现以来 , 人们一直在尝试混合翻译方法 , 利用短语或基于规则的机器翻译来弥补NMT的不足 。
文章图片
这是垃圾邮件吗?
被广泛使用的电子邮件作为当前一种数字通信形式 , 常伴随着垃圾邮件的问题 。 最初 , 人们使用IP黑名单和邮件标题检查来识别垃圾邮件 , 但是这些方法在单独部署时很容易被绕开 。
因此 , 对电子邮件内容以及非文本元素进行分析的需求随之提高 , 这意味着NLP进入了垃圾邮件领域 。 1998年 , 有人提出使用Bayesian方法来过滤垃圾邮件 。 2002年 , 同一战线的保罗·格雷厄姆提出了一项商业上可行的垃圾邮件处理计划 。
Bayesian方法是统计NLP的最早方法之一 , 与通常的基于文本的过滤器不同 , 它可以自动从可能为垃圾邮件的内容中学习新词 , 并使用其不断扩大的词汇量更好地对邮件进行分类 。
Bayesian过滤器通过仔细检查邮件标题内容、词组和短语 , 降低了误报率 , 并提高了识别垃圾邮件的准确性 , 运用于许多现代电子邮件客户端 。
为了进一步减少垃圾邮件的数量 , Google在2015年宣布要在垃圾邮件过滤器中运用神经网络 , 使垃圾邮件率降到0.1% 。
文章图片
嗨 , Siri , 今天天气怎么样?
NLP领域的重要运动有1962年IBM的Shoebox以及20世纪70年代的Harpy , 它们代表数字语音识别的前身 。 直到20世纪80年代中期 , HiddenMarkov被认为是语音建模中的高效方法 。
IBM开发的Watson在问答节目Jeopardy!中取得了胜利 。 2011年 , 智能虚拟助手势头强劲 , 苹果在同年的iPhone4S上推出Siri 。
2014年 , Amazon在智能扬声器Echo中引入了Alexa 。 GoogleAssistant(最初称为GoogleNow)和Microsoft的Cortana也紧随其后 。
AI语音助手迅速入驻应用程序和设备(例如GoogleHome) 。 截止2019年1月 , Amazon销售了超过1亿台配备Alexa的设备 。
文章图片
聊天机器人的降临
虚拟助手有了一个近亲——聊天机器人 , 由AI驱动 , 可以通过通讯App和在线聊天来进行近似人类的对话 。
ELIZA(1966)、PARRY(1972)和试图讲笑话的Jabberwacky(1988)之类的聊天机器人 , 提出了人机对话的概念 。 随着计算机语言和自然语言处理技术的进步 , AI聊天机器人现在可以通过了解用户意图、提供相关输入来与用户进行顺畅的对话 。
因AI聊天机器人能够提供全天候服务 , 解决客户投诉等简单问题 , 客户服务得到了极大的提高 。 到2021年 , 由NLP支持的AI聊天机器人可以完成全球15%的客户交互服务 。
文章图片
察觉言语背后的情绪
除了单纯的文本分析之外 , 研究人员还在努力识别高度非结构化内容以及语境意义 。 波·庞等人于2002年完成了早期关于辨别网络上电影评论的消极还是积极的计算机语言技术(NaiveBayes、SVM和MaxEnt)的研究 。
随后 , 波·庞和莉莲·李在2004年发表论文 , 探讨了将“主观性”(表达作者自己的观点和特定词语的相关性)带入情感分类的根本影响 。
这些文章 , 以及彼得·T·特尼的文章 , 在NLP领域掀起了一场革命 , 因为网络上日益增长的语言交流(社交媒体、博客、新闻推送)都是为了理解人们的想法而开发的 。
推荐阅读
- 【银河系】银河系或早已死亡,我们看到的只是几亿年前的光芒,听听科学家怎么说!
- 「旗鱼」游泳速度比最快的人类还要快几十倍,这种鱼不仅快,而且十分之贵
- 广州美合传祺我们的成功是因为客户的成功——李真
- ##“双鱼玉佩”之谜,罗布泊核爆试验的真相,地球真的像我们认知的那么简单?
- 小文频道5G将临!我们准备好了吗
- 『陨石』中国“最美陨石”,比地球还要古老,发现者隐瞒专家偷偷卖到美国
- 一萌娱乐未来会怎样?我们每个人都需要做视频号吗,微信视频号来了
- 科学家▲《我们的脑子够用吗》:与剑桥脑科学家一起探索稀奇古怪的脑知识
- 联想▲vivo极力向上游布局:不仅通吃三大5G供应商,还要自研芯片?
- 「华为荣耀」马化腾超越马云成新首富,却引发争议,家长:那是我们的血汗钱!