机器学习的机器|Tuning，机器学习之Hyperparameter 机器学习时模型训练非常简单

机器学习时模型训练非常简单，将数据分成训练集（trainingset）和测试集（testingset），用trainingset训练模型，然后将模型应用到testingset上评估模型的好坏。
【机器学习的机器|Tuning，机器学习之Hyperparameter】怎么优化模型，使得模型更加稳定有效呢？
方法是超参数优化（Hyperparametertuning）。比如我们有3个hyperparameter ，每个Hyperparameter可以设置3个数值，这样我们就可以得到3X3X3=27个组合，然后用相同的训练集分别训练27个模型，将这27个模型分别应用在testingset上，就可以比较出那组Hyperparameter组合比较好。
但是，当我们把模型应用到真实场景的时候，往往会发现模型效果比在testingset上差很多。为什么会出现这样的问题呢？原因是我们调整参数的时候都是用的一套testingset ，所以我们选择的参数只是适应这个特殊的数据集。这时候validationset就该上场了！
这次数据就不能只分为训练集和测试集了，而是在训练集和测试集之外再分出验证集（validationset）。在Hyperparametertuning时将训练的模型应用到validationset上挑选出最好的Hyperparameter组合，然后将最好组合的模型应用到testingset上，得到模型的最终效果。
这时候另外一个问题出现了，由于我们这次将模型应用在一个固定validationset上，而validationset有可能太大或者太小，这次得到的模型很有可能不是模型的最优解，怎么办呢？我们可以用kfoldcrossvalidation来解决这个问题。如下图，首先将数据分为训练集和测试集，训练集再分为k份（例子中是5份），模型训练的时候用其中的k-1份作为训练集，用剩下的一份数据作为验证集，这样训练k个模型，将k次建模结果的平均数作为这个Hyperparameter组合的最终结果，这样得到模型的最优解。

文章图片

机器学习的机器|Tuning，机器学习之Hyperparameter

推荐阅读

宋朝的文化有多昌盛呢？建立了世界上最早的少数民族学校

[法尔兹七大最美葡萄酒节]法尔兹七大最美葡萄酒节

建材|浴室地垫材质有哪些浴室地垫如何清洗

硅胶|刘志强燕语湖比赛复盘，第一天细节制胜，最后因挂底痛失好局

时尚酵父|身材发福肩背壮硕，胳膊比老公还粗，54岁巩俐为72岁老公庆生

「北京女子核酸阳性崩溃大哭」北京女子核酸阳性崩溃大哭，现场已封锁

怎么做简单的手链，一根红绳怎么编简单的手链

「富士康」立讯精密超过富士康，郭台铭悔不当初

隔离霜和防晒霜的使用顺序怎么样呢

19年，农村这3类人将被严查，一经核实，严惩不贷！绝不手软！

豆飞科技：常程补充两句，雷军我也补充两句，卢伟冰首谈加入小米

「历史大爆炸了」本出身地主家庭却心向革命，他是以八路军的身份牺牲的国民党员

骑士网|屏幕支持手机互联功能，隆鑫无极双缸500AC复古实车曝光

南方|中国最有趣的省份，名字带北字却是属于南方的，本地人都解

mini西里美搭TB|穿间条长衫配长裤去买菜，手挎俩包包好像贵妇，赵丽颖防晒很到位

八只爪的猫|李宇春华丽转身，穿西装裙配过膝靴，1米75身高比例优越

每天晚上跑步20分钟能减肥吗

疫情|大连疫情被传系海产品公司非法接收俄籍船只产品，官方辟谣

达达集团蒯佳祺：京东到家履约成本低于社区团购，获客能力相当

『昆明警方发布』| 监守自盗谎报现金失窃，民警察言观色起获赃款，治庸·铁军