『NLP』数据之战:NLP迈向实用阶段的核心所在( 五 )

文章图片
- 语音识别库(ASR)64种语言, 21,000小时
- 合成语音库(TTS)3种语言4种音色
- 发音词典98种语言,460万词条
- 词性词典21种语言,190万词条
- 命名实体库(NER)8种语言
- 词形分析器3种语言
- 黑人面部图片1000人13万张
- 中国人带口罩面部图片1000人7000张
- OCR图片泰语、芬兰语、中文各5000张
- 婴儿啼哭音频数据300人300分钟
- 家猫表情动作视频1000只
AI 科技评论注:欲了解澳鹏在成品数据库方面的工作,可以访问此链接, https://www.appen.com.cn/off-the-shelf-linguistic-resources/
推荐阅读
- “一部手机读云南”上线力争建成国家方志大数据中心西南中心
- 联合国大数据全球平台中国区域中心在杭州成立
- 银行的数据中心可以跳槽去互联网公司吗
- |大数据赋力 半个多月前拉客的“黑车”精准落网
- 数据采集终端|
- 关于用phpfsocket 写Post, 模拟http 报文怎样写入要传输的处理数据
- 假如把中国电信监测到的3亿人一个月每天上网的所有行为打个包,哪些数据应该被提出从这些数据能得到啥
- 游戏公司一般咋识别游戏脚本
- 城市数据团是怎么样一个团队
- 上海或苏州有没有比较好的大数据培训机构
