[算法]收藏!机器学习算法优缺点综述


[算法]收藏!机器学习算法优缺点综述
本文插图

来源:七月在线
本文约2700字 , 建议阅读5分钟
本文为你介绍机器学习算法的优缺点 。
标签:机器学习、深度学习、算法
目录

  • 正则化算法(Regularization Algorithms)
  • 集成算法(Ensemble Algorithms)
  • 决策树算法(Decision Tree Algorithm)
  • 回归(Regression)
  • 人工神经网络(Artificial Neural Network)
  • 深度学习(Deep Learning)
  • 支持向量机(Support Vector Machine)
  • 降维算法(Dimensionality Reduction Algorithms)
  • 聚类算法(Clustering Algorithms)
  • 基于实例的算法(Instance-based Algorithms)
  • 贝叶斯算法(Bayesian Algorithms)
  • 关联规则学习算法(Association Rule Learning Algorithms)
  • 图模型(Graphical Models)

[算法]收藏!机器学习算法优缺点综述
本文插图

正则化算法(Regularization Algorithms)
【[算法]收藏!机器学习算法优缺点综述】[算法]收藏!机器学习算法优缺点综述
本文插图

它是另一种方法(通常是回归方法)的拓展 , 这种方法会基于模型复杂性对其进行惩罚 , 它喜欢相对简单能够更好的泛化的模型 。
例子:
  • 岭回归(Ridge Regression)
  • 最小绝对收缩与选择算子(LASSO)
  • GLASSO
  • 弹性网络(Elastic Net)
  • 最小角回归(Least-Angle Regression)
优点:
  • 其惩罚会减少过拟合
  • 总会有解决方法
缺点:
  • 惩罚会造成欠拟合
  • 很难校准
集成算法(Ensemble algorithms)
[算法]收藏!机器学习算法优缺点综述
本文插图

集成方法是由多个较弱的模型集成模型组 , 其中的模型可以单独进行训练 , 并且它们的预测能以某种方式结合起来去做出一个总体预测 。
该算法主要的问题是要找出哪些较弱的模型可以结合起来 , 以及结合的方法 。 这是一个非常强大的技术集 , 因此广受欢迎 。
  • Boosting
  • Bootstrapped Aggregation(Bagging)
  • AdaBoost
  • 层叠泛化(Stacked Generalization)(blending)
  • 梯度推进机(Gradient Boosting Machines , GBM)
  • 梯度提升回归树(Gradient Boosted Regression Trees , GBRT)
  • 随机森林(Random Forest)
优点:
  • 当先最先进的预测几乎都使用了算法集成 。 它比使用单个模型预测出来的结果要精确的多
缺点:
  • 需要大量的维护工作
决策树算法(Decision Tree Algorithm)
[算法]收藏!机器学习算法优缺点综述
本文插图

决策树学习使用一个决策树作为一个预测模型 , 它将对一个 item(表征在分支上)观察所得映射成关于该 item 的目标值的结论(表征在叶子中) 。
树模型中的目标是可变的 , 可以采一组有限值 , 被称为分类树;在这些树结构中 , 叶子表示类标签 , 分支表示表征这些类标签的连接的特征 。
例子: