揭秘华为行业大模型:不作诗的盘古,只做哪些事?

“华为盘古大模型不作诗,只做事 。”7月7日,华为开发者大会2023(Cloud)上,华为常务董事、华为云CEO张平安在主题发言环节如是说道 。

揭秘华为行业大模型:不作诗的盘古,只做哪些事?

文章插图
图源:直播视频截图他提到,今年全球已发布数百个大模型,中国发布超80个大模型,这些大模型的共性是基本都会“对话作诗”,而华为大模型要深入到各行各业,帮助其创造价值 。
当日,华为盘古大模型3.0正式对外发布,这是一个面向行业的大模型系列 。“盘古为行业而生,就要为行业着想,”张平安表示,如今,盘古大模型已在气象、金融、制造、医药研发等诸多行业发挥巨大价值 。
重塑千行百业
“去年年底,ChatGPT的出现把人工智能推到了一个新风口,当前,通用人工智能已经成为人类社会最热门的话题 。”7月6日,华为轮值董事长胡厚崑在2023世界人工智能大会的主题演讲中表示,并透露华为将在7月7日的华为云开发者大会上推出盘古大模型3.0 。
次日,华为对外发布盘古大模型3.0,这是一个面向行业的大模型系列,包括“5+N+X”三层架构:
L0层包括自然语言、视觉、多模态、预测、科学计算五个基础大模型,提供满足行业场景中的多种技能需求 。
揭秘华为行业大模型:不作诗的盘古,只做哪些事?

文章插图
图源:企业供图L1层是N个行业大模型,华为云既可以提供使用行业公开数据训练的行业通用大模型,包括政务、金融、制造、矿山、气象等大模型;也可以基于行业客户的自有数据,在盘古大模型的L0和L1层上训练自己的专有大模型 。
L2层为客户提供更多细化场景的模型,更加专注于政务热线、网点助手、先导药物筛选、传送带异物检测、台风路径预测等具体行业应用或特定业务场景 。
比如,在气象领域,盘古气象大模型是首个精度超过传统数值预报方法的AI预测模型,同时预测速度也有大幅提升 。原来预测一个台风未来10天的路径,需要在3000台服务器的高性能计算机集群上花费5小时进行仿真 。现在基于预训练的盘古气象大模型,通过AI推理的方式,研究者只需单台服务器上单卡配置,10秒内就可以获得更精确的预测结果 。
在金融领域,盘古金融大模型可以通过银行的各种操作、政策、案例文档进行预训练,根据客户的问题,为柜台工作人员自动生成流程和操作指导,将原来需要平均5次的操作降低为1次,办结时间缩短5分钟以上 。
对于制造领域,过去单产线制定器件分配计划,往往要花费3个小时以上才能做齐1天的生产计划 。盘古制造大模型学习华为产线上各种器件数据、业务流程及规则以后,对业务需求进行准确的意图理解,并调用天筹AI求解器插件,1分钟即可做出未来3天的生产计划 。
至于药物研发领域,张平安在现场举了一个例子,原来一款新药研发平均需要10年时间、花费10亿美金 。盘古药物分子大模型助力西安交通大学第一附属医院刘冰教授团队发现全球40年来首个新靶点、新类别的抗生素,并将先导药物研发周期缩短至1个月、研发成本降低70% 。
张平安在华为开发者大会2023(Cloud)媒体沟通环节表示,“华为在AI大模型领域投入非常大,而在商业化落地方面也为客户提供了多样化的服务模式,但现在谈AI大模型收益还为时过早 。”
人工智能开启新黄金10年
2021年4月,盘古大模型正式对外发布 。盘古大模型发布以来,已经发展出L0、L1、L2三大阶段的成熟体系持续进化 。
去年9月,华为轮值董事长胡厚崑在世界人工智能大会上表示,华为云盘古预训练大模型已完成从学术大模型到产业大模型的转变,形成“基础大模型-行业大模型-细分场景大模型”的发展路径,并在医疗、互联网、金融、煤矿、农业、气象等领域中实现降本增效 。
今年,胡厚崑则在世界人工智能大会上提出,人工智能的发展,关键要走深向实 。围绕这个目标,华为表示,一方面要打造强有力的算力底座 。另一方面,从通用大模型到行业大模型,真正让人工智能使能行业,助力科研 。
算力是训练大模型的基础 。在本次华为开发者大会2023(Cloud)上,张平安宣布单集群2000P Flops算力的昇腾AI云服务在华为云的乌兰察布和贵安AI算力中心同时上线 。昇腾AI云服务除了支持华为全场景AI框架昇思MindSpore外,还支持Pytorch、Tensorflow等主流AI框架 。
揭秘华为行业大模型:不作诗的盘古,只做哪些事?


推荐阅读