如何让机器更懂你?是时候了解NLP了!( 二 )


微软的Power BI业务分析服务和Salesforce.com的Tableau均提供NLP自己生成语言对结果进行解释的功能 。当用户可以输入有关其数据的问题后 , 这些服务可以提供相应的图表或自动分析 。
 了解企业知道什么
NLP可帮助企业了解其已经知道了哪些知识 。ABBY的合同文本分析、Exigent的合同管理解决方案、Seal的合同发现与分析等由AI支持的专用工具可从合同中提取条款和期限 , 从而帮助企业了解自己承诺了哪些内容 。XML联合发明者Jean Paoli创立了一家名为Docugami的初创企业 。该公司成立的初衷是让结构化程度较低的文档实现这一功能 。
Paoli 说:“企业的数据只有15%被存储在了数据库当中 。我们在交流中都会用到文本、电子邮件和文档 。结构化数据库不会告诉我们问题的真相 , 但是文档会 。对于像商业房地产这类的文件密集型业务 , 一线业务用户平均每周要撰写15份租赁协议 。每到周一 , 经理会发出一连串提问:‘你做了哪些工作?截止日期是哪天?有没有谈到停车位的问题?他们是否希望我们保留所有权?’一旦签署文件 , 公司就必须要遵守 , 不幸的是这些信息往往会被淹没在大量的文件当中 。”
无论是星巴克要求房东就租赁协议重新展开谈判 , 还是餐厅需要了解其保险政策的内容 , 许多事情现如今已经变得举足轻重 。而这些“隐性数据”可以取代星期一上午的例会 , 提高业务敏捷性 。
Paoli说:“由于企业目前正在重新考虑自己的业务模式 , 这时使用NLP来分析业务文档就变得尤为重要 。企业可能不得不就所有的事情重新进行谈判 , 他们需要了解自己的义务和风险 。”专业的服务公司Accenture就是这样做的 , 他们通过NLP对100多万份合同进行了分析 , 以了解自己的承诺和责任 。
对于那些没有自己NLP专家的企业而言 , Docugami的SaaS产品是一个不错的选择 , 其有30个示例文档可供使用 , 并且可自动从存放业务文档的文件夹中进行选择 , 在30分钟内即可向创建文档的业务用户进行反馈 。随后Docugami会将信息存入数据库中 , 以帮助创建可通过浏览器查阅的仪表板 , 或是与Excel和Tableau进行集成 。
让会议传递的信息变得更加明确
虽然一些企业的电话已按要求被记录下来 , 但是却很少被分析 , 问题的症结在于从会议和对话中提取有用信息是一项繁重的人力劳动 。又有多少企业会通过会议上的发言内容了解项目进度或截止日期呢?
尽管员工花在会议上的时间在30% , 甚至更多 , 但是会议中的大量信息却无法像其他的业务数据那样被捕获 。PowerPoint幻灯片和Teams会议中的实时字幕以及Azure Streams广播平台中可搜索的实时会议转录功能也都可以不需要人工记录就可以提供颇具效率的转录 。
除了图像识别外 , 这些平台未来还会使用转录和文档分析总结提炼会议中的主要内容 , 以便团队在会议结束后的后续工作中能够查阅这些内容 。在过去15年中 , 桥水基金(Bridgewater Associates)记录了所有的内部会议 , 所有员工都可查阅这些会议记录 。尽管如此 , 还是很少有人去翻阅 , 其中一个原因是这些记录难以被检索到 。为了解决这个问题 , 桥水基金开始使用Otter提取这些会议内容 。
具备语音转文本功能的Azure Cognitive Services API不久将开通转录上传至OneDrive上的音频文件的功能 。虽然使用这些API的转录应用程序已经被开发人员开发出来了 , 但是如果直接将这一功能内置到平台中无疑可以得到更广泛的使用 。
分析与准确性
虽然用户可以通过时间轴的方式在内容中进行检索 , 但是NLP的最佳使用方法并不是一字不差的完整转录 。
Otter会将提取的标签作为摘要 , 以方便用户了解文本中的内容 。自动编写的文档摘要正在在成为工具 , 例如IBM Watson的自然语言理解 。虽然Otter也在研发 , 但是用户仍必须要记住相关内容才能查阅 。NLP未来会加入会议分析功能 。例如同一主题是否会被继续讨论 , 截止日期是否会被不断推迟等等 。
转录的准确性是这一切的生命线 , 而准确性的衡量非常复杂 。虽然NLP系统在许多方面的准确性已经可与人类媲美 , 但是它们还是存在短板 , 例如无法对你还未着手做的工作进行准确比较 , 没有一个统一的衡量标准 。


推荐阅读