基础通俗讲解集成学习算法( 四 ) _集成学习算法

十折交叉验证用来测试算法准确性。将数据集分成十份，轮流将其中九份作为训练数据，一份作为测试数据，进行试验。每次试验都会得出相应的正确率（或差错率）。十次的结果的正确率（或差错率）的平均值作为对算法精度的估计，一般还需要进行多次十折交叉验证（例如十次十折交叉验证），再求其均值，作为对算法准确性的估计。
下面假设构建了十折交叉验证，训练得到十个CNN模型。

文章插图

那么在十个CNN模型可以使用如下方式进行集成：

对预测的结果的概率值进行平均，然后解码为具体字符；
对预测的字符进行投票，得到最终字符。

深度学习中的集成学习此外在深度学习中本身还有一些集成学习思路的做法，值得借鉴学习：

丢弃法Dropout
测试集数据扩增TTA
Snapshot

1. 丢弃法Dropout
Dropout可以作为训练深度神经网络的一种技巧。在每个训练批次中，通过随机让一部分的节点停止工作。同时在预测的过程中让所有的节点都起作用。

文章插图

Dropout经常出现在在先有的CNN网络中，可以有效的缓解模型过拟合的情况，也可以在预测时增加模型的精度。加入Dropout后的网络结构如下：

# 定义模型class SVHN_Model1(nn.Module):def __init__(self):super(SVHN_Model1, self).__init__()# CNN提取特征模块self.cnn = nn.Sequential(nn.Conv2d(3, 16, kernel_size=(3, 3), stride=(2, 2)),nn.ReLU(),nn.Dropout(0.25),nn.MaxPool2d(2),nn.Conv2d(16, 32, kernel_size=(3, 3), stride=(2, 2)),nn.ReLU(),nn.Dropout(0.25),nn.MaxPool2d(2),)#self.fc1 = nn.Linear(32*3*7, 11)self.fc2 = nn.Linear(32*3*7, 11)self.fc3 = nn.Linear(32*3*7, 11)self.fc4 = nn.Linear(32*3*7, 11)self.fc5 = nn.Linear(32*3*7, 11)self.fc6 = nn.Linear(32*3*7, 11)def forward(self, img):feat = self.cnn(img)feat = feat.view(feat.shape[0], -1)c1 = self.fc1(feat)c2 = self.fc2(feat)c3 = self.fc3(feat)c4 = self.fc4(feat)c5 = self.fc5(feat)c6 = self.fc6(feat)return c1, c2, c3, c4, c5, c6

2. 测试集数据扩增TTA
测试集数据扩增（Test Time Augmentation，简称TTA）也是常用的集成学习技巧，数据扩增不仅可以在训练时候用，而且可以同样在预测时候进行数据扩增，对同一个样本预测三次，然后对三次结果进行平均。

文章插图

def predict(test_loader, model, tta=10):model.eval()test_pred_tta = None# TTA 次数for _ in range(tta):test_pred = []with torch.no_grad():for i, (input, target) in enumerate(test_loader):c0, c1, c2, c3, c4, c5 = model(data[0])output = np.concatenate([c0.data.numpy(), c1.data.numpy(),c2.data.numpy(), c3.data.numpy(),c4.data.numpy(), c5.data.numpy()], axis=1)test_pred.Append(output)test_pred = np.vstack(test_pred)if test_pred_tta is None:test_pred_tta = test_predelse:test_pred_tta += test_predreturn test_pred_tta

Snapshot
本章的开头已经提到，假设我们训练了10个CNN则可以将多个模型的预测结果进行平均。但是加入只训练了一个CNN模型，如何做模型集成呢？
在论文Snapshot Ensembles中，作者提出使用cyclical learning rate进行训练模型，并保存精度比较好的一些checkopint，最后将多个checkpoint进行模型集成。

文章插图

由于在cyclical learning rate中学习率的变化有周期性变大和减少的行为，因此CNN模型很有可能在跳出局部最优进入另一个局部最优。在Snapshot论文中作者通过使用表明，此种方法可以在一定程度上提高模型精度，但需要更长的训练时间。

文章插图

写到最后在不同的任务中可能会有不同的解决方案，不同思路的模型不仅可以互相借鉴，同时也可以修正最终的预测结果。
在本次赛题中，可以从以下几个思路对预测结果进行后处理：

统计图片中每个位置字符出现的频率，使用规则修正结果；
单独训练一个字符长度预测模型，用来预测图片中字符个数，并修正结果。

延伸阅读：

书籍：《深度实践OCR：基于深度学习的文字识别》
作者：刘树春阿里巴巴本地生活研究院算法专家，前复旦七牛云联合实验室OCR算法负责人

编辑：黄继彦
校对：林亦霖
—完—

【基础通俗讲解集成学习算法】

上一页
1
2
3
4
5
下一页

推荐阅读

黄渤|全球悬疑烧脑经典高分电影榜（上），一次推七部，悬疑惊悚又烧脑

《跑男》开拍在即，baby回归呼声低，白鹿李晨挑大梁，新常驻成迷

还在热衷推4G手机的品牌！三星A52 4G现身跑分网

芯片|对华芯片出口猛增80%！中以又传好消息：2021年将达成自贸协议

「演员谢园去世」演员谢园去世曾出演过《孩子王》《上海一家人》

『fun娱乐』鹿晗背心忍了，热巴烤自己的皮裤过分了，“笑到失禁”穿帮镜头

燕鸣|违章建筑摇身一变成为健身场所

移动互联网■美国十年十倍科技股全览！

（文化·时讯）中国文联、中国音协奏响“小康之歌”

北京不同区的人恋爱是不是就和异地恋一样的

球盲黄|今日CBA前瞻：青岛vs吉林

周到|“全民健身日”：上海近400场活动点燃市民运动热情

广西|大学教授与丈夫在家遇害！警方最新通报

扒友看娱乐大事林生斌高调回归，网友：你变了，保姆纵火失去妻儿1046天后

高级程序员和普通程序员有哪些区别？

今年北京公积金月缴存基数上限不变，你的缴存额会变吗？

Sangfor VPN 实验

新华网：援黔医疗对口帮扶大力提升贵州县级医院综合能力

懂车▲堪称颜控福利，10万内最漂亮的三款SUV

今日事|这个位置真的太棒了，钱用得真值！哈哈哈哈哈，买了一个卧铺

把计算机“防火墙”说的通俗易懂，这篇文章做到了

淘宝如何做到月销几千淘宝新店怎么做基础销量

太厉害了！总算有人把“串行通信”的基础知识讲的明明白白了

超全的Python图像处理讲解，小白也能懂

混淆矩阵-不再那么令人混淆了

做淘宝店铺最基础的运营技巧淘宝运营注意事项

新手淘宝开店入门基础新手开淘宝店怎么操作

自己在家不知道练什么？推荐8个可以每天练习的瑜伽基础动作

初学瑜伽基础知识有哪些需要注意的？

淘宝基础优化怎么做淘宝基础优化指的是哪些方面