机器之心:几行代码搞定ML模型,低代码机器学习Python库正式开源( 四 )



predict_model 函数还可以用来预测未见过的数据集 。 现在 , 将训练时所使用的数据集用作新的未见过数据集的代理(proxy) 。 在实践中 , predict_model 函数会被迭代地使用 , 每次使用都会有一个新的未见过的数据集 。
predictions = *predict_model*(rf, data = http://news.hoteastday.com/a/diabetes)
机器之心:几行代码搞定ML模型,低代码机器学习Python库正式开源
本文插图
此外 , 对于使用 stack_models 和 create_stacknet 函数创建的模型 , predict_model 函数可以预测它们的序列链 。 不仅如此 , 借助于 deploy_model 函数 , predict_model 函数还可以直接基于托管在 AWS S3 上的模型进行预测 。
模型部署
我们可以使用以下方法让训练好的模型在未见过的数据集上生成预测:在训练模型的同一个 notebook 或 IDE 中使用 predict_model 函数 。 但是 , 在未见过的数据集上执行预测是一个迭代的过程 。 其中 , 基于用例的不同 , 预测可以分为实时预测和批量预测 。
PyCaret 的 deploy_model 函数允许部署整个 pipeline , 包括云端训练的模型 。
*deploy_model*(model = rf, model_name = 'rf_aws', platform = 'aws',
authentication ={'bucket': 'pycaret-test'})
模型/实验保存
训练完成后 , 包含所有预处理转换和训练模型对象在内的整个 pipeline 能够以二进制 pickle 文件的格式保存 。
# creating model
adaboost = *create_model*('ada')# saving model*
save_model*(adaboost, model_name = 'ada_for_deployment')
机器之心:几行代码搞定ML模型,低代码机器学习Python库正式开源
本文插图

用户也能够以二进制文件的格式保存整个实验 , 包括所有中间输出(intermediary output) 。
*save_experiment*(experiment_name = 'my_first_experiment')
机器之心:几行代码搞定ML模型,低代码机器学习Python库正式开源
本文插图

最后 , 通过 PyCaret 所有模块中可用的 load_model 和 load_experiment 函数 , 用户还可以下载保存的模型和实验 。
机器之心 CVPR 2020 线上分享的第一期 , 我们邀请到北京大学智能科学系陈汉亭(论文一作)为我们分享主题《加法神经网络:在深度学习中我们是否真的需要乘法?》 , 欢迎读者报名学习 。
机器之心:几行代码搞定ML模型,低代码机器学习Python库正式开源
本文插图


推荐阅读