文章插图
机器学习
人工智能,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎,而机器学习是人工智能的核心 。
“机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能
01 机器学习分类
- 传统机器学习
- 机器学习可以理解成是生产算法的算法 。需要人来先做特征提取,然后在把特征向量化后交给机器去训练 。
- 传统机器学习分为 监督学习 和 无监督学习 。
- 深度学习
- 深度学习是基于深度神经网络的学习(DNN) 。深度学习可以自动提取特征 。深度学习可以采用 End-to-End 的学习方式,只需要进行很少的归一化和白化,就可以将数据交给模型去训练 。
- 训练样本
- 就是用于训练的数据 。包括了现实中的一些信息数据,以及对应的结果,也就是标签 。
- 训练
- 对训练样本的特征进行统计和归纳的过程 。
- 分类模型
- 总结出的特征,判断标准 。
- 验证
- 用测试数据集验证模型是否正确的过程 。这个过程是在模型训练完后进行的,就是再用另外一些样本数据,代入到模型中去,看它的准确率如何 。
聚类 是一种典型的 无监督学习 ,是把数据进行分类的过程 。进行聚类的基本思想是,利用向量之间的距离 —— 空间中的欧式距离或曼哈顿距离 ,根据距离的大小判断对象是否应该归为同一类别 。
文章插图
上图是对3个一维向量分类的例子 。明显的能看到,离得近的两个们可以近似的认为它们属于同一类别 。
2.2 回归
回归简单的说就是一个 由果索因 的过程 。这是机器学习中很常用的一个手段 。
回归分为:
1. 线性回归
【什么是机器学习?】2. 非线性回归
实际使用那种回归模型,需要根据情况而定 。
2.2.1 线性回归
线性回归模型:
文章插图
其中 w 是一个特征张量,储存着与每个变量x中元素对应的特征元素,x 就是输入的训练数据张量,b 是一个偏置量 。
这其实就是高中概率与统计章节中常见的一个公式 。就像解那时候的应用题一样,我们需要根据一堆 (x,y)求解一个合适的 w 和 b 。
文章插图
看看上面这个应用题,是否想起了高中时代的数学课?
2.2.2 损失Loss函数
损失函数是用来评估模型预测结果和真实情况差距的,差距越小,说明我们的模型越好,越准确 。这就是损失函数的公式!
文章插图
当我们假设一个w和b后,循环计算每一个 x 所得的值和真实 x 所对应的值相减,然后将每一个差相加求和,得到一个差值之和,就是当前的损失 。
损失越小,说明所寻找到的 w 和 b 就越合适,当 Loss 为 0 时,说明此时模型的准确率为 100%。
事实上,这和高中概率与统计应用题,给你一堆 x,y ,然后求一个 系数w 和 常量b 出来是一样的一样的 。只不过在计算机中,由于算力比手算强大太多了,所以我们可以一遍一遍的调整 w 和 b 这两个参数,使 Loss 一直向趋于 0 的方向移动 ,从而使模型的准确率趋于 100%。
通常,为了使 Loss 始终保持为正 ,也会有如下损失函数:
文章插图
求平方使得结果横为正数 。
比如这个函数的图像可能是一个三维的碗,那么我们的任务就是找到碗底的位置,也就是极值,因为在该点有解,即损失最小 。
文章插图
2.2.3 梯度下降法寻找最优解
对于复杂函数,我们要直接求解是巨困难的,甚至有时可以说是处于不可解的状态 。我们需要寻找损失函数的极值,可以使用牛顿迭代法的思想进行迭代寻找 。
推荐阅读
- 美国为什么乱成一锅粥
- 什么是防火墙?防火墙的作用?
- 梦见坟墓有火是什么预兆 梦见坟墓火烧得很旺
- 梦见老鼠往自己身上爬是什么意思 做梦小老鼠爬到自己的身上
- PS图片磨皮技巧
- 梦见家中被盗是怎么回事儿? 梦见家被盗了预示什么
- 梦见和老婆的姐姐有情感是什么意思 梦见老公的姐姐是什么意思
- 胰腺炎不能吃什么
- 怀孕后不能吃什么
- 胆囊炎不能吃什么