科大讯飞发布智能录音笔和智能TWS耳机,搭载核心AI转写能力

9月1日 , 科大讯飞在京召开以“声来即王者”为主题的消费类新品发布会 , 科大讯飞轮值总裁胡郁、科大讯飞副总裁李传刚出席此次发布会 , 并在现场发布了讯飞智能录音笔SR901、SR702、SR101 , 讯飞首款智能TWS耳机iFLYBUDS四款新品 。
科大讯飞发布智能录音笔和智能TWS耳机,搭载核心AI转写能力
文章图片
科大讯飞轮值总裁胡郁表示 , 科大讯飞坚持“ToB+ToC''双轮驱动战略 , 让AI应用服务大众 。 秉承着助力用户高效办公、智慧生活的理念 , 讯飞消费者业务连续三年保持超过30%的高增速 。 随着讯飞智能硬件产品体系不断完善 , C端营收占比在2020年上半年达37.59% 。 在AI转写赛道上 , 我们希望讯飞消费者产品不仅为文字工作者的记录场景赋能 , 更成为每个人的知识管理工具 , 开启高效记录新时代 。
目前 , 全新发布的讯飞智能录音笔SR702、SR101 , 讯飞智能耳机iFLYBUDS已在9月1日0点开启预售 , 9月9日0点在天猫京东等电商平台同步现货开售 。 而SR901将在9月下旬开启预售 。 新品预售期享有不同程度分期免息计划、预定金充抵、赠品等多重优惠 , 参与预售有机会赢得讯飞智能录音笔SR301 。
讯飞智能录音笔全系列布局完成 , 继续领跑AI录音笔市场
科大讯飞此次发布三款智能录音笔新品 , 补全了智能录音笔全系列 , 覆盖了从入门、旗舰再到尊享版全线机型 , 为不同需求的消费者提供最满意的选择 。
讯飞智能录音笔SR101是面向职场新人和学生推出的入门级新品 , 融便携体验、高性价比和智能体验于一身 。 其拥有星空灰、深海蓝、象牙白三种配色可选 , 标配1.4英寸触摸屏使得转写实时可见 , 同时搭载1颗定向麦克风+2颗矩阵麦克风的组合 , 四核处理芯片 , 8GB存储空间和1500mAh电池容量 , 在硬件配置上毫不妥协 。 SR101售价599元 , 转写终身免费并享有3年5GB云空间服务 。
讯飞智能录音笔SR702则是讯飞继SR701之后的旗舰之作 。 SR702采用星空灰配色 , 一体设计的3D陶瓷背板和航空级铝合金 , 其采用高密度2600mAh大容量电池 , 搭载2颗定向麦克和6颗矩阵麦克风 , 配置3.5英寸高清屏幕 , 并配备800万像素数字变焦后置摄像头 。 而讯飞智能录音笔SR901尊享版采用钢琴黑全陶瓷机身 , 搭载6.01英寸AMOLED屏幕 , 64GB存储空间及4000mAh支持18W快充大容量聚合物锂电池 。 讯飞智能录音笔SR901拥有豪华三摄配置和2颗哈曼MEMS定向麦克风+10颗全向麦克风 。 通过全面升级的转写引擎 , SR702和SR901搭载了行业首发的离线转写、OCR图文识别、视频字幕等新功能 , 再次拓宽了转写记录的易用性和使用场景 。 SR702售价3699元 , SR901售价5999元 , 两款产品购买随硬件赠送终身免费会员服务 , 包含转写和翻译服务等 , 同时自激活之日起 , 另赠3年20GB云空间服务 。
科大讯飞发布智能录音笔和智能TWS耳机,搭载核心AI转写能力
文章图片
上述三款新品均沿袭了讯飞智能录音笔的四大标准——识别准、录得远、录得清、语种全 。 识别准方面 , 讯飞智能录音笔新品语音识别模块采用基于深度全序列卷积神经网络的语音识别框架 , 识别准确率达98%;录得远方面 , 讯飞智能录音笔新品最远拾音距离均可达15米;录得清方面 , 讯飞智能录音笔新品采用AI算法降噪处理前端语音信号 , 保证拾音的准确性 , 并提供高清无损音质的音频格式;语种全方面 , 讯飞智能录音笔新品同样支持粤语、河南话、四川话、重庆话、云南话、贵州话、天津话、河北话、东北话、甘肃话、山东话、太原话12种方言转写、藏语、维吾尔语2种少数民族语言转写、中、英、日、韩、俄、法、越南、西班牙8种语言转写和IT科技、财经贸易、文化体育、医疗、政法、运营商、教育7大专业领域转写优化 。 同时 , 中英文混读识别功能也可在转写时自动识别夹杂着中英文的语音内容 。
而得益于全新升级的转写引擎 , 讯飞智能录音笔SR901和SR702两款新品在行业率先搭载了离线转写功能 。 无需4G/WIFI网络 , 用户也能实现语音实时转文字、转写后的文字内容即刻保存 , 离线转写准确率高达95% , 无惧断网环境 。 同时离线转写也防止了高度机密信息的泄露 , 保障了用户信息安全和特有转写需求的实现 。 同时 , 通过SR901和SR702的摄像头可将图片上的文字内容提取出来并实时呈现 , 便于用户实现重要音频和图文信息的混合记录 , 用于后期记录及整理 。 同时 , 这两款新品还支持录制视频、实时收音并实时生成字幕 , 同时后期也可编辑字幕 , 打造多场景重要信息记录的全新AI交互体验 。
在讯飞智能录音笔前端降噪处理上 , 通过讯飞原创神经网络与传统信号处理深度结合的降噪算法(SSA-IME) , 可以有效降低环境干扰噪声 , 并有效消除干扰说话人的声音 , 从而大幅降低语音识别的处理难度 。 在无喇叭的情况下3-10米远距离提升相对30% , 有喇叭的情况超远距离(20-50m)演讲场景效果达到90%以上 。 而为了满足用户快速出稿的需求 , 讯飞大力投入语音识别后处理技术并运用到讯飞智能录音笔上 , 先后上线语气过滤词、口语规整、文本语义分段、文本智能摘要等文本理解能力 。 针对多人交谈会议场景 , 上线了分离与ASR联合建模的说话人分离方案 , 说话人分离的准确率达到95%让用户能够快速检索到目标说话人数据 , 提升编辑体验 。
讯飞首款TWS智能耳机发布 , 语音实时转写打造移动商务新标配
与讯飞智能录音笔三款新品同时发布的还有讯飞首款TWS智能耳机iFLYBUDS 。 凭借通话实时转写、智能拨号识别、通话译文对照三大核心AI功能 , 能够轻松满足商务人士在自驾、通勤、会议等多场景中 , 解放双手、重要信息记录和从容沟通的需求 。
讯飞智能耳机iFLYBUDS采用珍珠白配色 , 弧形美学设计 , 耳机单只仅重4.6g , 半入耳仿生设计 , 持久佩戴也舒适 。 该设备搭载旗舰级芯片 , 保证了连接的稳定性和超低延迟 。 此外 , iFLYBUDS还拥有悦耳音质 , 通过智能降噪在机场、健身房等嘈杂环境也能带来清晰流畅的通话体验 。 iFLYBUDS支持智能语音助手 , 只要说“小飞小飞”即可快速唤醒语音助手 。 同时iFLYBUDS的特点还包括:支持轻击耳机交互 , 并且支持自定义功能;佩戴检测 , 摘下耳机时暂停播放 , 再次戴上音乐继续 。 不仅如此 , 讯飞智能耳机iFLYBUDS续航可以满足日常商务沟通 。
讯飞智能耳机iFLYBUDS的核心功能之一通话实时转写支持常规电话和网络电话(微信语音、腾讯会议、钉钉语音、Skype、Zoom等) , 随时随地可以接听网络电话会议 。 且对于多人会议还支持自动区分讲话人 , 查找通话内容更加方便 。 通话开始时一键录音 , 通话过程转成文字 , 转写准确率在98%以上 。 而在通话结束后可以形成智能摘要 , 自动提炼重点内容 , 还支持对通话内容进行快速查找、多终端分享(手机端和电脑端)和编辑 。
智能拨号识别则让讯飞智能耳机iFLYBUDS解决了商务人士的通讯录里联系人繁多 , 并且多重名、同音联系人的痛点 , 针对拨号对象重名、同音等情况 , iFLYBUDS可通过多种方式区分 , 例如章子怡的章、立早章;归属地名称区分 , 例如北京的李总、科大讯飞的李总 。 避免复杂查找 , 拨号效率成倍提升 。 与Siri等语音助手相比 , iFLYBUDS的语音拨号功能专注拨号 , 更智能、精准 , 具备明显的优势:说法更自然 , 只说姓名即可拨号;纯语音交互 , 无需看屏;一句搞定 , 避免重复 。
而在外语电话交流场景中 , 面对行业术语、俚语等生僻的专业词汇 , 经常会遇到语言沟通障碍 , 针对这一点 , iFLYBUDS专为商务人士打造的核心功能之三就是通话译文对照 。 它在英语通话时 , 可将通话内容实时转译为汉字 , 辅助英语沟通 , 是你耳朵上的助理翻译官 , 沟通更加自信、简单 。 未来将会支持更多的语种 。
二十一年AI技术深厚积累 , 讯飞消费者新品让消费者买的放心
在发布会现场 , 科大讯飞副总裁李传刚表示“技术革新与消费升级双轮驱动 , 将出现巨大的颠覆式创新机会 , 并催生新的领导品牌 。 讯飞智能录音笔和讯飞智能耳机均是这一理念的实践 。 通过顶尖的AI语音技术、优质的硬件和软件三位一体 , 打造极致便捷的体验 , 帮助用户有效提升效率 , 享受高品质智慧生活 。
科大讯飞发布智能录音笔和智能TWS耳机,搭载核心AI转写能力
文章图片
【科大讯飞发布智能录音笔和智能TWS耳机,搭载核心AI转写能力】除了优秀的市场成绩外 , 讯飞消费者产品也在业界获得高度认可 , 这和科大讯飞在智能语音领域二十一年的深耕分不开 。 以语音转写功能应用到的语音识别技术为例 , 早在2016年9月 , 在业界影响力最大、参赛队伍最多、水平最高的国际多通道语音分离和识别大赛CHiME-4中 , 科大讯飞包揽了全部三个项目的冠军;2018年再次包揽CHiME-5大赛全部四个项目的冠军并大幅刷新了各项目的最好成绩;2020年的CHiME-6 , 在被称为“史上最难的语音识别任务”中 , 科大讯飞不仅在给定说话人边界的多通道语音识别两个参赛任务上夺冠 , 更一鼓作气刷新自己在CHiME-5中46.1%的语音识别错误率冠军成绩 , 直降至30.5% 。
而在说话人识别技术方面 , 近期在VoxSRC国际说话人识别比赛限定训练数据任务中(公开刷榜阶段) , 科大讯飞刷新世界纪录 , 等错误率(EER)降低到0.81% 。 同时 , 科大讯飞在学术界公开测试集合VoxCeleb1上取得0.63%的EER , 是截止目前的StateOfTheArt(最好结果) , 上述两个新纪录表明科大讯飞说话人识别技术站在了世界前列 。


    推荐阅读