技术编程|机器学习之Hyperparameter Tuning |AI人工智能|

机器学习时模型训练非常简单，将数据分成训练集（training set）和测试集（testing set），用training set训练模型，然后将模型应用到testing set上评估模型的好坏。
怎么优化模型，使得模型更加稳定有效呢？
方法是超参数优化（Hyperparameter tuning）。比如我们有3个hyperparameter ，每个Hyperparameter可以设置3个数值，这样我们就可以得到3X3X3=27个组合，然后用相同的训练集分别训练27个模型，将这27个模型分别应用在testing set上，就可以比较出那组Hyperparameter组合比较好。
但是，当我们把模型应用到真实场景的时候，往往会发现模型效果比在testing set上差很多。为什么会出现这样的问题呢？原因是我们调整参数的时候都是用的一套testing set ，所以我们选择的参数只是适应这个特殊的数据集。这时候validation set就该上场了！
这次数据就不能只分为训练集和测试集了，而是在训练集和测试集之外再分出验证集（validation set）。在Hyperparameter tuning时将训练的模型应用到validation set上挑选出最好的Hyperparameter 组合，然后将最好组合的模型应用到testing set上，得到模型的最终效果。
这时候另外一个问题出现了，由于我们这次将模型应用在一个固定validation set上，而validation set 有可能太大或者太小，这次得到的模型很有可能不是模型的最优解，怎么办呢？我们可以用k fold cross validation来解决这个问题。如下图，首先将数据分为训练集和测试集，训练集再分为k份（例子中是5份），模型训练的时候用其中的k-1份作为训练集，用剩下的一份数据作为验证集，这样训练k个模型，将k次建模结果的平均数作为这个Hyperparameter组合的最终结果，这样得到模型的最优解。

本文插图
【技术编程|机器学习之Hyperparameter Tuning】

技术编程|机器学习之Hyperparameter Tuning

推荐阅读

?冯提莫家中COS提莫，意外暴露真实身高，抬腿那一刻不止一米五

光明网|西固关山降水量57.4毫米

中国医学科学院肿瘤医院|如何远离乳腺癌

Go娱美人娱|李宇春同届，超女姐妹花15年的苦涩人生：事业波折，感情挫败

钱币|盒子币成为主流乱象丛生该如何收藏盒子币

北京商报网中国戏曲文化周主场活动收官，12场云直播观看人次突破千万

人民网|韩国新增61例新冠确诊病例累计23106例

司马迁写史记的故事！司马迁的故事

纽约时报|连续两月竞选筹款落后于拜登，特朗普将办“大金主”筹款晚宴

搞笑大喇叭|蛋是跑不了的，搞笑GIF：锅：我已结网

还有谁能打败哆啦A梦吗?

贺卡内容送老师10个字贺卡内容送老师20个字

奇闻每日说|家长们要记牢！，4种食物对孩子好

墨兰空根换盆视频墨兰空根怎么办

「国青」实锤打脸！恒大小将接连爆发，01国青踢中乙真是笑话

卡哇伊天生敏感，洞察力很强的三大星座，平时总是装傻充愣

穿搭|47岁苏有朋越活越年轻，减肥瘦成筷子腿，穿白衬衫气质秒赢小鲜肉

「下营」脱贫攻坚一线见闻丨郧西“淘宝村”用上5G网络

光遇礼花先祖兑换图光遇各个先祖兑换图鉴

看不同版本的影视作品是不是存在先入为主的心理