「机器学习」机器学习中的判别式模型和生成式模型( 二 )


2. 判别式模型和生成式模型的特点判别式模型特点:
判别式模型直接学习决策函数Y=f(X) , 或者条件概率P(Y|X) , 不能反映训练数据本身的特性 , 但它寻找不同类别之间的最优分裂面 , 反映的是异类数据之间的差异 , 直接面对预测往往学习准确度更高 。 具体来说有以下特点:

  1. 对条件概率建模 , 学习不同类别之间的最优边界 。
  2. 捕捉不同类别特征的差异信息 , 不学习本身分布信息 , 无法反应数据本身特性 。
  3. 学习成本较低 , 需要的计算资源较少 。
  4. 需要的样本数可以较少 , 少样本也能很好学习 。
  5. 预测时拥有较好性能 。
  6. 无法转换成生成式 。
生成式模型的特点:
生成式模型学习的是联合概率密度分布P(X,Y) , 可以从统计的角度表示分布的情况 , 能够反映同类数据本身的相似度 , 它不关心到底划分不同类的边界在哪里 。 生成式模型的学习收敛速度更快 , 当样本容量增加时 , 学习到的模型可以更快的收敛到真实模型 , 当存在隐变量时 , 依旧可以用生成式模型 , 此时判别式方法就不行了 。 具体来说 , 有以下特点:
  1. 对联合概率建模 , 学习所有分类数据的分布 。
  2. 学习到的数据本身信息更多 , 能反应数据本身特性 。
  3. 学习成本较高 , 需要更多的计算资源 。
  4. 需要的样本数更多 , 样本较少时学习效果较差 。
  5. 推断时性能较差 。
  6. 一定条件下能转换成判别式 。
总之 , 判别式模型和生成式模型都是使后验概率最大化 , 判别式是直接对后验概率建模 , 而生成式模型通过贝叶斯定理这一“桥梁”使问题转化为求联合概率 。
03 二者所包含的算法
「机器学习」机器学习中的判别式模型和生成式模型
本文插图
原文作者:Microstrong
原文链接:https://zhuanlan.zhihu.com/p/
本文由 @Microstrong 授权发布于人人都是产品经理 , 未经作者许可 , 禁止转载 。
题图来自Unsplash , 基于CC0协议


推荐阅读