人工智能训练师:让机器更“懂”人类
文章插图
图为付聪在路边采集声音数据 。
张嘉幸/摄
打开电脑,将采集的风声、雨声、溪流声等声音数据输入,“清洗”掉夹杂其间的噪音,对助听器数据模型进行“训练”,测试模型在真实场景的灵敏度……伴随着手指敲击键盘的“啪嗒啪嗒”声,腾讯天籁实验室人工智能训练师付聪一天的工作就此开始 。
近几年,随着人工智能技术不断发展,这个被称为人工智能训练师的职业逐渐壮大 。作为“数字职业”之一,人工智能训练师的出现,加速了人工智能由技术研发走向行业应用的过程,将产生较高的经济价值和社会价值 。
为模型不断“喂”数据
每次出门时,付聪总会在耳朵上戴一个大“耳环” 。
这个“耳环”其实是一个测试版的助听器 。“耳环”里的声音各式各样,有呼呼的噪声,有尖锐刺耳的吵闹声……这些经过助听器放大后产生的噪声,是很多佩戴助听器的听障人士长期面临的困扰 。
付聪和他的团队正在尝试利用算法设计、通过人工智能技术“训练”数据模型,让助听器更加“智慧”地降低噪声,让听障人群听得清、听得懂、听得舒服 。
付聪解释说,助听器数据模型很小,因此需要针对不同场景进行优化,很多场景充满挑战,“比如一个听障人士在餐厅吃饭,周围有很多人说话,他想跟对面的人聊天,四周声音特别嘈杂,作为一个正常人都可能听不清楚,更何况一个有听力障碍的人?我们希望利用模型,把需要的声音提取出来,降低噪声,帮助更多听障人群” 。
理想很丰满,但是实际的模型算法研发过程却像是一场反复进行的“战役” 。
模型的研发过程大致分为以下几步:数据采集、数据“清洗”、模型训练、场景测试、调整算法,经过几次迭代之后再测试、调整,“如果测试结果不理想,需要把这个过程再走一遍,直到得到最优效果” 。付聪说 。
数据采集要有针对性 。为了让模型更“聪明”,需要针对不同场景采集各种特殊数据 。付聪和团队成员不仅需要到早晚高峰的地铁、热闹喧天的餐厅、人来人往的马路等场景,采集数百个小时的声音数据,还要戴上助听器体验这些声音的差别,“比如风声,正常人听到是呼呼声,但戴上助听器以后,是很吵的噗噗声,像是去KTV唱歌,声音使劲砸到麦克风上” 。道路骑行、海边风浪……为了采集各种风噪数据,付聪录制了多种场景的风声 。
数据“清洗”是将不需要的数据“洗掉” 。付聪举了一个例子——风声,真实场景下会夹杂汽车鸣笛、人交谈等声音 。在整理时要把这些数据剔除出来,保留一个比较纯粹的风声,这样模型才会“认识”风 。
模型训练是将“清洗”好的数据“喂”给模型 。除了采集的特殊数据,付聪和他的同事们还会加入诸如世界各国的语言和一些非语音声音等数据,“基本涵盖了人们生活中遇到的所有噪声和语音” 。
和人类不同,人工智能模型在训练过程中,不会疲惫、烦躁、发脾气,它们的“智慧”取决于模型参数、训练策略、数据量等 。“它们就像一个‘孩子’,会越来越‘聪明’,识别到越来越多的声音,我特别有成就感 。”付聪说 。
考验耐心、细致和忍受力
模型训练完成后,并不意味立刻能应用到听障人群的助听器上,还要经历较长时间的迭代、调整过程 。
比如,为了让听障人群适配到合适的助听器,传统方式是患者反复到线下的验配店去试戴,过程繁杂 。付聪解释说,一般情况下,根据发病原因不同可以将听力下降分为三类:感音神经性、传导性、混合性耳聋;根据听力下降的程度不同,分为轻度、中度、重度及极重度耳聋 。针对不同的类型,助听器的适配方式有所不同 。
有没有可能把适配过程搬到“线上”,利用人工智能算法和深度学习能力,让听障人群在线上就能做准确的听力验配?带着这个疑问,付聪开始研发适配算法 。他将这个过程比喻为做应用题,需要查询国内外文献、检索现有方案,根据具体的使用环境,利用现有知识开展合理想象、设计实验、寻找答案 。
这个过程考验人工智能训练师的耐心、细致 。在测试助听器音质时,不同的佩戴方式,对应不同的测试结果 。付聪和同事需要以“N×N”排列组合设计不同的佩戴方式,并且不断重复试验,来研究其对音质产生的影响 。
推荐阅读
- 人工智能尚无法完成的5件事
- 大型语言模型和人工智能代码生成器的兴起
- 生成式人工智能浅论
- 关于人工智能的5个常见误解
- AI大模型能否继续扩展?
- 人工智能为时尚艺术产业的原创性带来了多少隐忧?
- 不费妈的电影来了,《巨齿鲨2》让全场的小朋友都安静了
- 张雪峰诚不欺我!让孩子学医的父母都“自私”,家族喜益子女受苦
- 谢霆锋国外与女子亲密,狠心让儿子搬运行李,自己却两手空空耍帅
- 如何逼自己瘦下来?8个方法让你从168瘦到104斤