科学出版社|陆培丽: 从统计世界走向人工智能
本文插图
技术的发展推动商业的前进道路 。 从数据驱动到人工智能算法再到自动匹配出用户需求 , 并进行反馈 , 这才是数据与人工智能算法的灵魂 。
本文插图
20 年前 , 我进入了上海交通大学数学系 , 在懵懂中选择了数学专业 。 大数据、神经网络与建模等名词是我在大学时就已经听到的 。 从那时候在讨论班上有几个研究生做数学理论的推导 , 到现在每个人都知道的人工智能 , 这个积累过程 , 我们走了20 年 。
我的工作生涯一直在金融投资领域 , 并且绝大多数时间和数学、量化、程序化交易相关 。 我的第一份工作是在高盛 , 部门就叫作program trading , 隶属高盛东京 。 这份工作一干就是十几年 。 我工作生涯最初是从和程序化交易打交道开始的;除此之外 , 我的工作也包括长期看盘投资和研究金融领域的二级市场 。 在我的职业生涯中 , 除了金融 , 数学和统计占了很重要的一部分 。
本文插图
目前 , 我主要致力于金融量化的投资领域 , 并且发展了金融和科技交叉领域 。 从我的工作中 , 我越来越感受到科技在金融中发挥的力量 , 尤其是人工智能在金融研究和投资领域发挥出的神奇力量 。 复杂的深度算法超越了一般的统计计量方法 , 在大数据的领域发挥了无可替代的作用 。
陆培丽
上海交通大学数学科学学院统计系讨论班业界导师
2019 年6 月于上海
本文插图
本文插图
统计与人工智能 统计和人工智能都是从数据中创建模型 , 但目的不同 。 统计学家非常注重使用数据缩减形式 , 使得原始数据被转换为更低维度的统计数据 。 这类统计数据的两个常见例子是均值和标准差 。 统计学家将这些统计数据用于不同的目的 , 将该领域划分为描述性统计和推理统计 。
人工智能最主要的任务是预测建模:创建用于预测新示例标签的模型 。 训练集是从静态总体中独立且等概率选择的 , 是该总体的代表;测试集是从感兴趣的总体中随机抽取的样本 。 如果总体发生变化 , 即产生概念漂移 , 可以使用一些技术来对此进行测试和调整 。
概率统计方法的突破增强了人工智能从原始数据中提取高级特征的能力 , 从而对状态空间进行有效的表示 。
人工智能的算法核心是数学 , 如神经刺激模型sigmoid , 它模仿的是到临界时刻的变化点 , 直观地说 , 它可以理解为:到达某个临界点 , 就爆发了 。 可以想象为人的情绪在到达某个临界点会爆发 , 这是每个人都能够体会到的 。 而在数学领域就是以下的这个函数:
本文插图
▲ sigmoid 函数
大家可以通过书本或者最新的科研成果查询到统计领域的算法和人工智能的算法 , 比如AlphaGo 算法公开发表在《自然》上 。 人工智能的算法目前处于开源状态 , 像谷歌这样的公司和站在前沿领域的科学家在引领算法 。 我们认为算法将成为一种基础设施 , 大部分应用只需要自己设定参数即可 。 未来人工智能算法在应用领域将会快速发展 , 所以理解算法在什么场景中可以应用将会更加重要 。
本文插图
人工智能的开端作为当代最主要的前沿技术之一 , 人工智能已经有数十年的发展历程 。
推荐阅读
- cnBeta|麻省理工学院科学家们改进了软机械手的感知能力
- 人群中国科学家通过古人基因组数据探寻中国文明源流
- 环球科学猫|二氧化碳水平超过2300万年最高纪录,对人类有什么影响?
- 兰州新闻网|创新驱动 情报先行——记兰州市科学技术情报研究所
- 科学技术宅六六|华为高端手机将至,售价近八千元,跑分不足五十万!
- 简明科学指南|微软用人工智能取代新闻工作者
- 科学探索007|星际旅行真的有可能实现吗?听完科学家的解释恍然大悟
- 科学纪元|打破国外对芯片的垄断局面?阿里巴巴AI芯片实用性强
- 环球科学猫|太阳爆发“M耀斑”,是3年以来最强的,对生命是否有影响?
- 中科院之声|液体高次谐波理论研究获进展