国内大模型市场又迎来了一个新的「选手」,这次是数学专用大模型 。
8 月 24 日,机器之心获悉,在好未来 20 周年直播活动中,CTO 田密宣布好未来自研的数学领域千亿级大模型 MathGPT 开启内测 。即日起,用户可通过官网(www.mathgpt.com)申请注册账号免费试用体验 。
今年 5 月,好未来曾公布正在进行自研数学大模型的研发,命名为 MathGPT 。MathGPT 是面向全球数学爱好者和科研机构,以解题和讲题算法为核心的数学垂直领域的大模型,也是国内首个专为数学打造的大模型 。
使用方式也很简单 。用户使用 MathGPT 时,用文字或图片方式上传数学题,即可得到对话式的解答反馈,也可以通过 “随机来一题” 的按钮,随机生成数学题目并由系统给出解答 。
文章插图
目前,MathGPT 支持中文、英文版本的 PC 端和移动端体验 。
领先的数学解题能力
MathGPT 汇集了好未来多年教育教研数据积累,专注于数学领域 。千亿级大模型的训练、推理、部署框架,为模型赋予了强大能力 。通过优质教育数据,实现题目计算、讲解、问答等多任务持续训练和有监督微调,呈现出卓越表现 。此外,借助人类反馈对齐,还将进一步提升模型综合素养 。MathGPT 在解题准确率、稳定性及用户体验方面均有明显的优势 。
据了解,MathGPT 的数学计算能力已覆盖小学、初中、高中的数学题,题目类型涵盖计算题、应用题、代数题等多个类型,还可以针对题目进行追问 。不过暂未开放数学之外的问答互动 。
文章插图
MathGPT 技术报告
具体效果如何呢?在 CEval-Math、AGIEval-Math、APE5K、CMMLU-Math、高考数学和 Math401 等 6 个公开数学评测集合的测试结果中,MathGPT 取得了多项测试的最高分数 。同时,MathGPT 在 C-Eval 的初高中的全科测试集合上也均有不错的表现 。
文章插图
MathGPT 在 C-Eval 榜单初高中各科成绩
此外,在解题稳定性、讲解友好度方面,MathGPT 基于海量名师解题过程的数据进行模型训练,模型的解题步骤专业清晰 。
我们以一道数列题为例,MathGPT 给出的答案包含 “分析”、“详解”、“点睛” 三个部分,比通用大模型的粗略讲解方式更为细致 。其中“分析” 提供了题目的解题思路、思考方式,帮助用户更好地理解题目;“详解” 则给出具体的计算方式和答案;最后 “点睛” 的环节对题目的考点、难点、关键点进行提示,帮助用户回顾反思出题意图、举一反三 。
文章插图
对于使用者而言,研究数学问题不仅在于得到答案本身,更在于答案背后的解题原理、思路逻辑 。与其他通用大模型相比,MathGPT 能实现更高准确度的解题,也能把答案解析得更清楚、讲解得更明白,更好地满足用户使用 AI 产品解答数学问题的核心需求 。
在 MathGPT 发布同时,好未来也更新了一个具有代表性和挑战性的数学任务评测集,供全球人工智能专家、数学爱好者体验和测评 。好未来希望让 MathGPT 在数学教育领域发挥更大作用,并愿意把基于大规模、高质量的内容的千亿级大模型研发经验方法和业内分享,和行业共同进步 。
好未来 AI 的厚积薄发
在 AI 浪潮的推动下,今年以来多家科技公司宣布推出通用大语言模型产品,而好未来选择了另一个方向,不基于将现有大语言模型做微调和接口调用、不做通用大语言模型,而是深入数学的垂直领域研发大模型,致力于打造自主、稳定、可持续、高质量的数学解决方案 。
通用大模型 “重文轻理”,在数学问题的解决、讲解、问答和推荐方面则存在明显的短板 。而在另一个层面,在通往通用人工智能的路上,数学推理能力很重要,全球有很多大型公司在做这方面的研究 。
“好未来在数学的数据和业务上有 20 年的积累,有大量的教育数据的积累和持续生产教育数据的能力,所以选择做这个难而正确的事情 。” 田密称,好未来希望用自己在数学和 AI 上的多年积累,做好 AI 大模型时代的数学基础工作 。
其实早在 2017 年,好未来便成立了 AI lab 人工智能实验室 。基于智慧教育人工智能开放创新平台助力,好未来 AI lab 获得各类顶级学术会议比赛冠军 16 项,亚军 6 项,发表国际期刊和会议高水平学术论文近百篇 。
推荐阅读
- 柑橘专用叶面肥 柑橘苗叶面肥施药方法
- 螺丝断在孔内取出技巧 取断头螺丝专用工具
- 国内专用语音是什么意思 国内专用语音和国内通用语音有什么区别
- 数学物理学的好可以选哪些专业 数学物理好的人选什么专业
- 教资认定条件 小学数学教资认定条件
- 趣味数学谜语 趣味数学谜语六年级及答案
- 网名男生专用泡妞符号 网名男生专用泡妞
- 有内涵的微信名字男 有内涵的微信名男士专用
- 数学的来原 数学的来历是什么
- 玻璃碗可以用微波炉吗 微波炉专用玻璃器皿