AR眼镜可“同声传译” 人工智能现在能有多“聪明”?

人工智能现在能有多“聪明”?
柔性物流四向车“一车跑全仓”AR眼镜可“同声传译”

AR眼镜可“同声传译” 人工智能现在能有多“聪明”?

文章插图
【AR眼镜可“同声传译” 人工智能现在能有多“聪明”?】全尺寸人形仿生机器人,其身高达1.77米,重量为52公斤 摄影/本报采访人员 李娜
正在召开的2023中关村论坛上,“人工智能”无疑是最热门的关键词 。无论是自动驾驶还是智能穿戴,是量子计算还是5G通信,甚至碳中和,众多前沿科技的背后都离不开人工智能技术的支持 。可以说,未来十年,人工智能将继续改变各行各业以及普通人的生活 。在本次论坛国际技术交易大会板块、科博会展览板块,以及人工智能相关平行论坛上,北京青年报采访人员注意到,各大公司都带来了最新人工智能科技成果,包括视觉通用分割模型SegGPT、5G音视频交互应用、双语数智人等等 。
5G通信新应用
可视自助服务带来交互新体验
最新数据显示,我国5G用户已达5.61亿,我国累计建成开通5G基站 231.2万个,全球占比均超过60% 。而一季度全国平均5G下载网速为334.98Mbps,峰值下载速率为472.92Mbps 。如此快的网速,再加上人工智能的支持,除了用来刷社交网络、日常办公学习,还可以用来做什么?
中国联通此次展出的“5G新通信智能交互平台”,就应用了5G“大带宽、低时延、泛连接”的特点,运用5G音视频交互与AI原子能力,结合AR&VR、三维建模、智能交互等先进技术,做到了5G内生服务下的音视频交互应用 。平台运用多媒体、三维建模、实时跟踪、传感、智能交互等技术,实现端到端的可视化、智能化新通信服务,为企业、政府等提供5G音视频交互、智慧虚拟形象等功能 。
如金融行业应用版平台,用户可以远程接入银行柜台服务,享受与现场办理同等的体验及个人隐私保护;能源行业应用版平台则重构了井场智能联动系统应用体系,实现了井场资源数字化管理、井场巡护数字化编制 。交通行业版平台以5G新通信为基础提供无障碍智能通信服务,为老年乘客提供可视化交互的智慧助老服务 。
值得一提的是,该平台在国产化适配与自主可控方面实现了平台与国产手机芯片适配;平台端支持国产化系统,手机侧适配华为麒麟芯片、联发科天玑芯片,支持华为、小米、OPPO、VIVO、魅族系列国产手机 。
“数智人”更聪明
与大模型融合能“听懂你的话”
数智人,简单来说就是虚拟人,借助拟人化的外表、人工智能的内核,数智人已经开始在众多行业中商业化落地,辅助人工服务,提升企业运行效率 。例如,数智人在金融、文旅、传媒、公共服务、医疗、零售等行业场景中,可担任坐席客服、理财顾问、播报主持、导游导览角色;在文化娱乐场景,可以作为虚拟偶像、虚拟歌手等形成IP资产;在智能车载、智能交通、智能家居等场景,可以通过与智能设备结合,为用户提供智能化服务 。
腾讯云智能小样本数智人生产平台近日首次对外发布,只需要3分钟真人口播视频、100句语音素材,平台便可通过音频、文本多模态数据输入,实时建模并生成高清人像,在24小时内制作出与真人近似的“数智人” 。相较于照片生成、仅能呈现面部形态的数字人,小样本数智人可根据文本设计手势,唇动、口型、表情复现真人风格 。
本届中关村论坛,北青报采访人员也尝试用数智人虚拟主播,代替真人主播出镜,进行7×24小时的直播服务,吸引了诸多观众关注 。
不过,以往的数智人,比起真人来,他们的思考能力明显更弱 。此次中关村论坛上,由智谱AI推出的 “智谱AI脑数智人”则更加聪明,它不再拘泥于固定的互动方式,而是初具理解人类指令意图的能力 。智谱AI由清华大学计算机系的技术成果转化而来,公司于2022年合作研发了双语千亿级超大规模预训练模型GLM-130B,并主导构建了高精度通用知识图谱,把两者有机融合为数据与知识双轮驱动的认知引擎,并基于此千亿基座模型打造ChatGLM 。通过认知大模型链接物理世界的亿级用户、赋能元宇宙数字人、成为具身机器人的基座,赋予机器像人一样“思考”的能力 。此外,它还是一个既会中文又会英文的双语数智人 。
“无人驾驶”上街
最新行人预测模型呼之欲出
如今在亦庄等地,已经可以打到百度自动驾驶的车辆 。未来,随着技术发展和政策批准后,车上的安全员将会撤出,自动驾驶车辆会实现真正的无人化 。


推荐阅读