数据挖掘中做（n-floder）交叉验证时，如果根据测试结果选取相应的模型?( 三 ) 写过一篇文章

在设置好了测试集和训练集之后，你需要做的是找出一个指标，来帮助你快速的评价不同的方法/参数，以实现迅速的迭代。但问题是评价的标准往往有很多个，且往往不再一个维度。对于不同的应用领域和问题，这个用来评价的指标应该考虑多个因素。还用推荐萌猫的神经网络作为例子，你评价时不止要考虑分类的准确度，还要考虑这个神经网络的运行所需的时间和资源，毕竟你的APP每天都会给用户推荐猫的照片，是一个持续的需求，再细想，如果你的APP 每天不止给用户推荐一张猫的照片，而是推荐一组，那么这一组照片中最好能够不全是小猫或者某一组猫。如何将这些评价标准组合成一个一维的指标，是需要用户去在摸透了实际需求后去考虑的。
对一个模型的评价，也会如同对测试数据的分布一样存在多个维度。有的是眼前要解决的需求，有的是立足长远的考量。还是萌猫照片推荐的问题，另一个评价的标准是模型的迁移能力，你的模型能否在不做大修改的前提下应用到推荐狗的照片。这是横向的迁移，你的模型能否应用到只推荐某一种狗，比如只推荐雪橇犬或者牧羊犬的照片，这是纵向的迁移。只有在模型一开始的设计和选择时就考虑到了这些未来的应用场景，才能在一开始不做出短视的选择。

■网友
交叉验证应该结合一个特定评价指标来使用，比如MSE（均方差）、AUC（ROC曲线下的面积）等等。对于每一个模型，交叉验证会计算出一个关于该指标的均值。如果你选的是MSE（越小越好），那么最好的模型就是对应交叉验证算出来MSE的均值最低的那个。如果你选的是AUC（越接近1越好），那么最好的模型就是对应的AUC的均值最接近1的那个。

数据挖掘中做（n-floder）交叉验证时，如果根据测试结果选取相应的模型?( 三 )

推荐阅读

南瓜饼最简单的做法南瓜饼怎么做好吃又简单

#驾照#一个人开车还得被罚？HOV车道都不知道，驾照迟早被扣光

笑声快车|脖子怕风的女人，瞧瞧新款的堆堆领打底衫，保暖又洋气

#奔跑吧兄弟#跑男史上最被冷落的两位嘉宾，不仅没有自我介绍，全程都站在最边上！

#罗集食#豆腐怎么做都易碎？下锅前泡一泡，条形完整不易碎

明朝那些事儿万历朝鲜战争,万历朝鲜战争明军表现-

减肥|产后一直水桶腰、大肚腩？不一定是纯胖，警惕是这里没恢复好

张一山|张一山踩缝纫机？团队疑似操作他的账号做辟谣

千锋郑州：没有基础能学UI吗，目前UI设计前景真的好吗

火腿虾皮蒸蛋

「一周新闻」一周新闻丨母婴行业大事件（6.10—6.16）

谈车工坊|滴滴造车？噱头大于实际

白冰为生计频繁走穴，也比精修能打，重新回到京城四美时期

企业|上市佛企研发实力：佛燃能源研发投入同比增幅近300%

「洋哥爱生活」思念成灾，主动说爱，反复求和，爱情开花结果，未来1周

一民营医院宣称不手术不放化疗治疗肿瘤当地卫健委已介入调查

河智苑|河智苑新剧《谢幕》首播！收视率破7%，3位老戏骨作配有号召力

花糖熬糖配方▲花糖熬糖配方

如何避免淘宝商品违规淘宝劣质预警什么意思

我们老得太快，却明白得太晚（推荐细读）