中年机器学习项目必备:端到端机器学习项目开发过程的任务表( 二 )


· 使用默认参数 , 训练一些常用的机器学习模型 , 如朴素贝叶斯、线性回归、支持向量机(SVM)等 。
· 利用基线和其他模型 , 测量并比较每个模型的性能 。
· 每个模型部署N折交叉验证(N-fold cross-validation) , 并计算N个折叠上性能指标的平均值和标准差 。
· 研究对目标影响最大的特征 。
· 分析模型在预测时出错的类型 。
· 以不同的方式设计特征 。
· 多次重复上述步骤(反复试验) , 确保以正确的格式使用正确的特征 。
· 基于性能衡量标准列出最佳模型 。
6.微调入围模型 , 检查集成方法
这是关键步骤之一 , 在此步骤中将更接近最终解决方案 。 主要步骤应包括:
· 使用交叉验证进行超参数调整 。
· 使用自动调整方法 , 如随机搜索或网格搜索 , 为最佳模型找到最佳配置 。
· 测试集成方法 , 如投票分类器等 。
· 用尽可能多的数据测试模型 。
· 完成后 , 使用一开始抛之一侧的测试样本 , 来检查是否过拟合或欠拟合 。
7.记录代码并传达解决方案
沟通的过程是多方面的 , 请时刻牢记所有现有的和潜在的利益相关者 。 主要步骤包括:
· 记录代码以及整个项目的完成方法和过程 。
· 创建一个简明的仪板或一个具有深刻见解的演示文稿 , 其应具有接近自我解释的可视化效果 。
· 撰写博客/报告 , 记录如何分析特征、测试不同的转换等 , 记录学习成果(失败和有效的技巧) 。
· 总结主要成果和未来蓝图(如有) 。
8.在生产中部署模型和监视器
如果项目需要在实时数据上测试部署 , 应该创建一个web应用程序或REST API , 以便在所有平台(web、android、iOS)上使用 。 主要步骤(因项目而异)包括:
· 将最终训练的模型保存到h5或pickle文件中 。
· 使用web服务为模型服务 , 可以使用Flask开发这些web服务 。
· 连接输入数据源并设置ETL管道 。
· 使用pipenv、docker/Kubernetes(基于扩展需求)管理依赖关系 。
· 可以使用AWS、Azure或Google云平台来部署服务 。
· 监控实时数据的性能 , 或让人们将你的模型与他们的数据一起使用 。
中年机器学习项目必备:端到端机器学习项目开发过程的任务表
本文插图
图源:unsplash
不要照本宣科 , 你的检查表可以根据项目的复杂性进行调整 。 以此为基础 , 一个完美的机器学习项目正向你招手 。
留言点赞关注
我们一起分享AI学习与发展的干货
如转载 , 请后台留言 , 遵守转载规范
声明:转载此文是出于传递更多信息之目的 。 若有来源标注错误或侵犯了您的合法权益 , 请作者持权属证明与本网联系 , 我们将及时更正、删除 , 谢谢 。邮箱地址:newmedia@xxcb.cn
【中年机器学习项目必备:端到端机器学习项目开发过程的任务表】


推荐阅读