ID3算法为啥先要通过最高信息增益来确定最佳分类属性而不是直接根据属性的最小熵值如果是以info

如果是以information gain为标准来选择分类属性，那么确实没有必要计算H(D)。但有的时候我们会以Information gain ratio为标准来选择分类属性，这时就需要计算H(D)和G(D,A)了。以information gain ratio为标准的好处是可以保证分类属性所携带的信息被充分利用，避免倾向于类别多的属性。这样一是避免了“高射炮打蚊子”，二是也能在一定程度上避免overfitting。
■网友
第一步在根节点分裂时确实如你所说，但在多个叶子节点中选择应该对哪一个叶子节点进行继续分裂时，此时计算每个叶子节点信息增益的第一项H（D）就不一样了
■网友
【ID3算法为啥先要通过最高信息增益来确定最佳分类属性而不是直接根据属性的最小熵值】 因为这个算法本身就是依赖信息熵的计算得到属性的最大分类，最小熵值只是中间某个环节，不是最后结果，通过计算每个属性的信息增益率，对属性值进行排序和比较，从而选择最合适的属性节点进行分裂。

ID3算法为啥先要通过最高信息增益来确定最佳分类属性而不是直接根据属性的最小熵值

推荐阅读

江苏新闻广播|知名早教机构突然宣布破产！

不赴时光|时光街拍；身材丰腴，婀娜动人，穿长裙的性感美女

中年小桔房车与Go Fun出行达成战略合作，加速房车产业发展

更添|街拍：丰腴性感时尚的美女，身材有型更添清新气质感!

外星人来自月球背面宇航员在太空发现外星人

北京九眼楼长城生态展示区开放

本人户口不在北京，大学在北京上学，身份证丢失咋办

海宁|“繁殖这么快，有点吓人”，市民发现海宁这里一大片...急了

工科计算机二级考哪个科目比较好计算机二级考哪个科目比较好

[宁静]闺话丨宁静决赛第一，却被骂上热搜：她到底是暴脾气，还是真性情？

造型|秋天试试喇叭裤，休闲个性，让造型轻松远离路人感

腰背肌锻炼法是什么？

数学|民国才女张充和：数学0分被北大破格录取，定居美国传播中国文化

股民|历史首次！两只创业板股票要被ST，3万股民中招

『小和』这次跟不明飞行物没关系，巨型“红色水母”在美国上空一闪而逝

手机芯片荣耀30pro+深度测评

春联到底怎么贴-冷知识了解一-春联到底怎么贴-冷知...-

张若昀 |梦回《明侦》！何炅张若昀惊喜加盟《密逃》，两大天团实力碰撞

环球网|美国民主党全国代表大会第二天，克林顿猛烈抨击特朗普：他一直在推卸责任！

退赛|一人复出两人退赛！西部格局被改变，两队将面临淘汰出局