AI数据标注的未来( 二 )

标注工具可以自动识别语音内容
这在很大程度上可以提升标注效率,减轻数据标注员的压力。但是以目前的技术发展水平而言,算法完全替代标注员并不现实,至少在可预见的范围内,数据标注工作的主体仍然是数据标注员,算法起到的更多是辅助作用。
■网友
谢邀,很好的问题,引人思考。不妨参考AI的字面意思,人工智能狭义上是人类制造的仿人类的智能体。那么,数据标注在人类发展史上是怎样的过程和怎样的未来?想清楚了这个问题,也就知道了AI数据标注的未来。比如说人类对医疗的认识过程中,数据标注是必不可少的。比如说早期的中医先辈,依靠神农尝百草的精神不断尝试,产生了本草纲目这样的巨著,其中结论都是一个一个标记出来的。这个时候我们对客观世界一无所有,所有东西都需要标注,甚至包括吞金能否自杀,待标记的样本无穷无尽。(我认为,现在的AI就是处于这个状态,只不过AI是通过人来进行数据标注的。少量号称迁移学习的AI,本身并不理解迁移的源和目标,只是人工设定而已)后来,随着科学技术的发展,我们有了药理学、化学、生物等科学知识,进而理解了人体内的生化反应。很多疾病表象通过逻辑推理可以找出内在原因,并在一定程度上进行验证。表象变换多端,内在原因往往就那么多。由于医生开处方只需针对内在原因即可,我们所需的数据标记就大大减少了。举个例子,懂得了疾病和基因的关系,可以提前采取措施预防疾病,像安吉丽娜朱莉切除乳腺以预防家传的癌症那样。这时候,我们只需标注非常有限的基因。(这个阶段的AI应该属于strongAI了,参考本人技术专栏,strongAI依靠对科学技术的语义理解,只需少量数据标注就能解决新问题)那么,有没有可能将来不需要数据标注?我认为有这种可能。当AI达到人类智能,同时拥有探索和感知能力时,他们可以自行通过不断尝试和碰壁(增强学习)积累新知识,进而帮人类解决新问题。这个时候的AI就不需人类做数据标注了。
■网友
数据标注的本质是将我们的知识作为先验知识注入人工智能,这种需求在短期内不会减弱,当然最终,随着ai的进化我们的知识会变得越来越不重要。
■网友
AI数据标注就是使用自动化工具通过分类、画框、注释等等对收集来的数据进行标记以形成可供计算机识别分析的优质数据的过程。对于这一波因为深度学习而兴起的数据标注行业来说,最大的潜在威胁很可能来自于增强学习、迁移学习等算法,后者仅需要少量的数据即可以达到一定的效果。笔者认为,迁移学习确实是将来的趋势,就单个模型来说,积累越久,数据需求量肯定会越少,但对于新模型来说,前期的需求量不会少,而模型是在增加的,所以对于“AI数据标注”这个正处在上升期的行业,暂时不会有明显影响。而等到不需要AI数据标注时,想必AI已经具有了真正的智能,而那一天,距离现在还有很长一段时间。
From:星尘数据 stardust
■网友
重复劳动的岗位必将被取代,如果把数据标注归类为重复劳动,那么这项本身为机器学习做数据服务的工作也一定会被取代,但是,我认为数据标注其实门槛很高,这个门槛是需要深厚的行业积累和沉淀,一定是机器无法替代的工作,所以一旦你开始担心机器会取代你的工作时,你就需要反思你的专业深度是否不够,沉淀是否还太少...
■网友
【AI数据标注的未来】 说实话现在的所谓人工智能,都是伪智能,本质上还是依托人类事先编纂的程序,只是复杂程度不同而已
推荐阅读
- “一部手机读云南”上线力争建成国家方志大数据中心西南中心
- 联合国大数据全球平台中国区域中心在杭州成立
- 银行的数据中心可以跳槽去互联网公司吗
- 汽车知识|荣威新车规划曝光 未来将推5款狮标车型
- 趣头条|大众ID.3外观设计风格极具未来感,太好看了
- |大数据赋力 半个多月前拉客的“黑车”精准落网
- 未来汽车日报|拟高位增发港股,受资本追捧的比亚迪也“缺钱”?
- 子李汽车|未来可期 东风雪铁龙11月环比增长33%,连续三月正增长
- 宝马7系|可以说,这款数字化高尔夫,让人看到了未来大众所有车型的样子
- 汽车公社|江淮大众或生产大众ID.2,未来出口欧洲
