一文看懂随机森林 - Random Forest（4个构造步骤+10个优缺点）他在很多情况下都能有不错的

【一文看懂随机森林 - Random Forest（4个构造步骤+10个优缺点）】本文将介绍随机森林的基本概念、4个构造步骤、4种方式的对比评测、10个优缺点和4个应用方向。
什么是随机森林？
随机森林属于集成学习中的Bagging（BootstrapAGgregation的简称）方法。如果用图来表示他们之间的关系如下：
详细了解决策树，可以看看《一文看懂决策树–Decisiontree（3个步骤+3种典型算法+10个优缺点）》
随机森林–RandomForest|RF
当我们进行分类任务时，新的输入样本进入，就让森林中的每一棵决策树分别进行判断和分类，每个决策树会得到一个自己的分类结果，决策树的分类结果中哪一个分类最多，那么随机森林就会把这个结果当做最终的结果。
构造随机森林的4个步骤
优点
它可以出来很高维度（特征很多）的数据，并且不用降维，无需做特征选择它可以判断特征的重要程度可以判断出不同特征之间的相互影响不容易过拟合训练速度比较快，容易做成并行方法实现起来比较简单对于不平衡的数据集来说，它可以平衡误差。如果有很大一部分的特征遗失，仍可以维持准确度。缺点
随机森林已经被证明在某些噪音较大的分类或回归问题上会过拟合。对于有不同取值的属性的数据，取值划分较多的属性会对随机森林产生更大的影响，所以随机森林在这种数据上产出的属性权值是不可信的随机森林4种实现方法对比测试
随机森林是常用的机器学习算法，既可以用于分类问题，也可用于回归问题。本文对scikit-learn、SparkMLlib、DolphinDB、XGBoost四个平台的随机森林算法实现进行对比测试。评价指标包括内存占用、运行速度和分类准确性。
测试结果如下：
随机森林的4个应用方向
对离散值的分类对连续值的回归无监督学习聚类异常点检测

一文看懂随机森林 - Random Forest（4个构造步骤+10个优缺点）

推荐阅读

##100%胜率的妖股见顶信号！

玉林新闻网|重要文件随车被盗，民警火速帮失主寻回

梦到死去的亲人哭梦见死去的亲人哭是什么意思_梦到死去的亲人哭代表...

小雪|今日小雪，曼舞盼君来

价格发现功能|[快讯]上交所阙波：注册制的本质是厘清政府和市场的基本关系

松柏的象征意义作文松柏的象征意义

能源|广汇能源：申能集团将受让恒大集团所持广汇集团相应股权成为广汇集团二股东

「资深娱乐家」MAX提车及用车分享，选择了我就不后悔全新荣威RX5

退休：国内适合退休后生活的3座城市，每一个都很舒适，你会选哪一个？

『青岛』报复性运动！青岛大爷摔断腿，济南和重庆都有人猝倒

少女|母亲离世后，张爱玲喃喃自语：来日，我一定会去找她赔罪的

每日互联网■10nm++处理器曝光追赶友商步伐，告别14nm+++！英特尔不再挤牙膏

「成都英博口腔医生」未成年人矫正牙齿，利多还是弊多？看这篇全面分析就够了

「流行病」世卫组织强调新冠肺炎疫情仍未构成“大流行病”

火影之伊邪那岐小说火影之伊邪那岐

中国|勃林格殷格翰启动中国外部创新中心，未来5年投4.5亿欧元

周星驰|周星驰曾经问过，当时很红的女明星：阿姐，你说将来我会不会红？

柠檬精啊|2大“援军”齐齐出招，这次连富士康也出手了，华为不是孤军奋战

华佗学医中华佗是一个什么样的人华佗学医让我们明白了什么道理

乘联会：预估7月主要厂商乘用车零售同比增长6%，环比下降6%