强烈安利这款功能强悍的机器学习可视化工具-阿里云开发者社区

强烈安利这款功能强悍的机器学习可视化工具

2022-12-09 169

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 强烈安利这款功能强悍的机器学习可视化工具

Yellowbrick是由一套被称为"Visualizers"组成的可视化诊断工具组成的套餐，其由Scikit-Learn API延伸而来，对模型选择过程其指导作用。总之，Yellowbrick结合了Scikit-Learn和Matplotlib并且最好得传承了Scikit-Learn文档，对你的模型进行可视化！ Juan L. Kehoe

Yellowbrick主要包含的组件如下：

特征可视化

Rank Features: 对单个或者两两对应的特征进行排序以检测其相关性

Parallel Coordinates: 对实例进行水平视图

Radial Visualization: 在一个圆形视图中将实例分隔开

PCA Projection: 通过主成分将实例投射

Feature Importances: 基于它们在模型中的表现对特征进行排序

Scatter and Joint Plots: 用选择的特征对其进行可视化

分类可视化

Class Balance: 看类的分布怎样影响模型

Classification Report: 用视图的方式呈现精确率，召回率和F1值

ROC/AUC Curves: 特征曲线和ROC曲线子下的面积

Confusion Matrices: 对分类决定进行视图描述

回归可视化

Prediction Error Plot: 沿着目标区域对模型进行细分

Residuals Plot: 显示训练数据和测试数据中残差的差异

Alpha Selection: 显示不同alpha值选择对正则化的影响

聚类可视化

K-Elbow Plot: 用肘部法则或者其他指标选择k值

Silhouette Plot: 通过对轮廓系数值进行视图来选择k值

文本可视化

Term Frequency: 对词项在语料库中的分布频率进行可视化

t-SNE Corpus Visualization: 用随机邻域嵌入来投射文档

Yellowbrick仅能运行于python3.4以上版本，安装十分简单。

$ pip install yellowbrick

使用方法也很简单，以特征选择为例

from sklearn.linear_model import Lasso
from yellowbrick.datasets import load_concrete
from yellowbrick.model_selection import FeatureImportances
# Load the regression dataset
dataset = load_concrete(return_dataset=True)
X, y = dataset.to_data()
# Title case the feature for better display and create the visualizer
labels = list(map(lambda s: s.title(), dataset.meta['features']))
viz = FeatureImportances(Lasso(), labels=labels, relative=False)
# Fit and show the feature importances
viz.fit(X, y)
viz.poof()

强烈安利这款功能强悍的机器学习可视化工具

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

强烈安利这款功能强悍的机器学习可视化工具

热门文章

最新文章

相关课程

相关电子书

相关实验场景