人工智能用于可解释机器学习的 Python 库
本文插图
字幕组双语原文:用于可解释机器学习的 Python 库
英语原文:Python Libraries for Interpretable Machine Learning
翻译:雷锋字幕组(ZeroJ)
本文插图
由于对人工智能偏见的担心日益凸显 , 从业者解释模型产出的预测结果的能力以及解释模型自身运作机制的能力变的越来越重要 。 幸运的是 , 已经有许多python工具集被开发出来 , 用以解决上述问题 。 下文我将对现有4个建立的比较完善的翻译和解释机器学习模型的工具包做简要的指导性描述 。
这些工具包都可以通过pip来进行安装 , 拥有完善的文档 , 并且强调通过可视化来提升可解释性 。
yellowbrick
这个工具包本质上 , 是scikit-learn的一个扩展 , 提供了一些非常实用且好看的机器学习模型可视化工具 。 `visualiser`对象是核心接口 , 是一个scikit-learn估计器 , 所以如果你之前熟悉scikit-learn的工作流程 , 那么将对此非常熟悉 。
这个可视化工具覆盖了模型选择 , 特征重要性和模型性能分析等方面 。
让我们看几个简短的例子 。
该工具包可以通过pip安装 ,
pip install yellowbrick为了展示工具包中的一些特性 , 我们将利用scikit-learn中的红酒识别数据集 。 这个数据集包含13个特征以及3个目标类别 。 可以通过scikit-learn直接加载 。 在下面的代码里我引入数据集 , 并把转换成pandas dataframe 。 数据集可以直接被用来训练模型 , 并不需要其他的数据处理 。
import pandas as pd
from sklearn import datasets
【人工智能用于可解释机器学习的 Python 库】wine_data = http://news.hoteastday.com/a/datasets.load_wine()
df_wine = pd.DataFrame(wine_data.data,columns=wine_data.feature_names)
df_wine["target"] = pd.Series(wine_data.target)
利用scikit-learn进一步将数据分为测试集合和训练集 。
import pandas as pd
from sklearn import datasets
wine_data = http://news.hoteastday.com/a/datasets.load_wine()
df_wine = pd.DataFrame(wine_data.data,columns=wine_data.feature_names)
df_wine["target"] = pd.Series(wine_data.target)
接下来 , 我们用yellowbrick的visualiser观察特征之间的相关性 。
import pandas as pd
from sklearn import datasets
wine_data = http://news.hoteastday.com/a/datasets.load_wine()
df_wine = pd.DataFrame(wine_data.data,columns=wine_data.feature_names)
df_wine["target"] = pd.Series(wine_data.target)
本文插图
现在 , 我们拟合一个随机森林分类器 , 并通过另一个visualiser评价其性能 。
from yellowbrick.classifier import ClassificationReport
from sklearn.ensemble import RandomForestClassifier
model =RandomForestClassifier()
visualizer = ClassificationReport(model, size=(1080, 720))
visualizer.fit(X_train, y_train)
visualizer.score(X_test, y_test)
visualizer.poof()
本文插图
ELI5
ELI5是另一个可视化工具包 , 在模型机器学习模型调试和解释其产出的预测结果方面非常有用 。 它能够同大多数通用的python机器学习工具包一起使用 , 包括scikit-learn和XGBoost , 以及Keras 。
推荐阅读
- IT168|用于取代将下架的机型,4G版苹果12曝光
- 央视新闻客户端|直通服贸会|服贸会上的“科技范儿”人工智能服务
- 【】服贸会上的“科技范儿”人工智能服务
- 直通服贸会|服贸会上的“科技范儿”人工智能服务
- 内分泌疾病|什么人不适合吃褪黑素
- 多国科学家强调:基因组编辑技术尚不能安全用于人类
- 草莓味的棉花糖|陈根:当人工智能与猜拳狭路相逢,石头剪刀布还随机吗?
- 科技日报|多国科学家强调:基因组编辑技术尚不能安全用于人类
- 中新网|多国科学家强调: 基因组编辑技术尚不能安全用于人类
- |知名女星前男友被限制高消费
