作者:蛋酱
2023 上半年,海内外经历了一场「百模大战」 。从科技巨头、科研机构、创业公司到各传统行业,纷纷掀起了炼大模型的热潮 。
当大模型成为新的风口,我们却发现,相比于上一波 AI 爆发浪潮,AI 创业的门槛其实明显被拉高了 。
对于任何想要入局的创业者来说,大模型首先是「体量大」,需要顶尖的研发技术,且投入极高的前期训练成本 。以 1750 亿参数的 GPT-3 为例,海外媒体曾做出估计,GPT-3 的存储需求高达 350GB、训练成本超过 1200 万美元 。至于今年的 GPT-4,参数量仍是秘密,训练成本想必只增不减 。
其次,自研大模型的成本不会止于训练 。从算力消费的角度来说,第一条增长曲线是模型训练,第二条增长曲线则是模型的应用和调优,而且在不久的将来,第二条增长曲线必然会超过第一条 。
文章插图
说到底,大模型技术想要广泛落地,最终还是要过成本关:对于大模型提供商来说,怎样才能让大模型以真正具有性价比的方式融入千行百业?对于每个行业来说,如何「多快好省」地用好大模型这一利器?
在这样的背景下,AI 领域形成了一种全新的商业模式:Model as a Service(MaaS),模型即服务 。「模型即服务」能够将大模型、工具平台、应用场景三者联合起来 。对于行业来说,这是一种无需巨额前期投入即可完成大模型训练、推理的途径;对于大模型提供商来说,这是一种探索商业化落地、获得资金回报的可靠方法 。
最近,这个赛道又迎来了一位重磅玩家 。6 月 28 日,在北京举行的火山引擎体验创新科技峰会上,「火山方舟」MaaS 平台正式启航 。
文章插图
火山引擎总裁谭待 。
「火山方舟」面向企业提供模型精调、评测、推理等全方位的 MaaS 平台服务 。基于其独特的多模型架构,企业可通过「火山方舟」同步试用多个大模型,选用更适合自身业务需要的模型组合 。此外,「火山方舟」实现了大模型安全互信计算,更加注重为企业客户确保数据资产安全 。
「火山方舟」到底怎么用?好不好用?仅通过发布会的 PPT 内容,还不足了解到产品全貌 。为了全面、深入地了解「火山方舟」,机器之心对其进行了一次「摸底」 。
体验「火山方舟」
首先,登陆火山引擎机器学习平台账号,你会看到产品界面顶端上线了「大模型平台」入口:
文章插图
目前,火山方舟提供了「模型广场」、「体验中心」、「模型精调」、「模型测评」等版块 。
模型广场:从选择、体验到真正落地
发布会上,火山方舟公布了模型广场的首批入驻大模型,包括百川智能、出门问问、复旦大学 MOSS、IDEA 研究院、澜舟科技、MiniMax、智谱 AI(以拼音首字母排序)等多家 AI 科技公司及科研院所的大模型,并已启动邀测 。
我们可以将「模型广场」理解为一家「商店」,模型供应方可以在模型广场进行模型创建、上传、部署等,模型使用方可以在模型广场查看模型、快捷体验 。
比如我们选择「ChatGLM-130B」,任务就是帮我们写这篇文章的提纲:
文章插图
除了 AI 对话类的应用,火山方舟现在还提供 AI 绘画类的应用体验 。这里我们以「文生图」为例,让它帮我们生成一张「符合前沿科技调性的文章插图」:
文章插图
通过火山方舟大模型服务平台,企业可一站式接入各种大模型产品和服务,同时也可以在火山方舟平台上训练自己的大模型,进行对比之后再决定,为自己的业务场景找到最合适的解决方案 。
在未来的规划中,火山方舟平台将为用户提供跨越多个模态的大模型选择,包括当下最火的大型语言模型、图像生成类模型,以及语音识别类模型 。
模型精调:百尺竿头更进一步
当然,在选定大模型之后,企业客户仍然可以根据自己的业务需求进行精调 。
鉴于一些垂直场景对大模型的要求较高,客户需要利用自有数据或领域非公开数据进行持续训练,以及建设和积累自己的精调数据集 。对精调手段的良好运用,能够帮助企业客户利用更小的模型尺寸,在特定任务上达到媲美通用大模型的水平,由此进一步降低推理成本 。
推荐阅读
- AI 正在杀死旧 Web?
- 爬虫解析HTML动态JS,技术应用揭秘
- 电影每秒播放的帧数一直停留在24帧,而不继续向更高的帧数发展
- 文章原创度在线检测工具有哪些?
- 十个图像处理的Python库
- 女人是否在乎你,看这3个方面就知道了
- 《长风渡》停播,让我看到影视圈一股隐藏的“乱象”,在野蛮生长
- 1韩元等于多少人民币——30亿韩元在韩国能用多久
- 三星掌门李在镕:毁掉胞妹,逼死女星,肆意操纵韩国的影子总统
- 这些人,在潜意识里就瞧不起你!