载入数据集, 查看数据属性,可视化

简介: 【8月更文挑战第8天】载入数据集, 查看数据属性,可视化。

载入数据集, 查看数据属性,可视化

载入波士顿房价数据集

boston = load_boston()

x是特征,y是标签

x = boston.data
y = boston.target

查看相关属性

print('特征的列名')
print(boston.feature_names)
print("样本数据量:%d, 特征个数:%d" % x.shape)
print("target样本数据量:%d" % y.shape[0])

输出:
特征的列名
['CRIM' 'ZN' 'INDUS' 'CHAS' 'NOX' 'RM' 'AGE' 'DIS' 'RAD' 'TAX' 'PTRATIO'
'B' 'LSTAT']
样本数据量:506, 特征个数:13
target样本数据量:506

转化为dataframe形式

x = pd.DataFrame(boston.data, columns=boston.feature_names)
x.head()

相关文章
|
4月前
|
XML 存储 数据处理
python绘制热力图-数据处理-VOC数据类别标签分布及数量统计(附代码)
python绘制热力图-数据处理-VOC数据类别标签分布及数量统计(附代码)
117 0
|
机器学习/深度学习 存储 PyTorch
【14】自定义宝可梦数据集
【14】自定义宝可梦数据集
237 0
【14】自定义宝可梦数据集
|
1天前
|
数据采集 JSON 数据处理
加载数据模型:在数据采集中实现动态数据处理
在现代网络爬虫技术中,动态数据处理对于提升采集效率和准确性至关重要。本文以拼多多为例,探讨了如何通过加载数据模型实现动态数据处理,并结合代理IP、Cookie、User-Agent设置及多线程技术提升数据采集效率。文中详细分析了动态数据模型的必要性、代理IP的应用、Cookie和User-Agent的设置,以及多线程技术的实现。通过Python代码示例展示了如何加载拼多多的商品数据模型,并实时获取商品信息,显著提升了数据采集的速度和稳定性。此方法在面对复杂网站结构和防爬虫机制时表现出色,适用于多种应用场景。
加载数据模型:在数据采集中实现动态数据处理
|
14天前
|
数据采集 存储 数据处理
通过load->model()加载数据模型:在采集中实现动态数据处理
本文介绍了在现代网络爬虫技术中,动态数据处理的重要性和实现方法。文章以采集小红书短视频为例,详细讲解了如何通过`load->model()`方法加载数据模型来处理动态数据。首先,强调了动态数据处理在爬虫技术中的必要性,尤其是对于需要实时更新或用户交互的网页。接着,通过安装必要的Python库,使用代理IP技术,设置User-Agent和Cookie,以及动态加载数据模型的步骤,展示了如何构建一个高效的爬虫系统。文章还提供了完整的代码示例,包括环境准备、代理IP配置、请求头设置、数据模型加载和数据解析等关键步骤,成功应用于小红书短视频数据的采集。
42 13
通过load->model()加载数据模型:在采集中实现动态数据处理
|
1月前
|
数据可视化 Linux
载入数据集, 查看数据属性,可视化
【8月更文挑战第7天】载入数据集, 查看数据属性,可视化
35 1
|
4月前
|
SQL 存储 开发框架
C# DataSet结合FlyTreeView显示树状模型数据
C# DataSet结合FlyTreeView显示树状模型数据
|
11月前
|
数据采集 机器学习/深度学习 数据处理
类别数据处理:你必须知道的技巧与方法
类别数据处理:你必须知道的技巧与方法
110 0
|
定位技术
ArcGIS镶嵌数据集的创建与数据导入方法
本文介绍基于ArcMap软件,建立镶嵌数据集(Mosaic Datasets)、导入栅格图像数据,并调整像元数值范围的方法~
307 1
ArcGIS镶嵌数据集的创建与数据导入方法
|
数据可视化 数据格式
Echart开发数据格式dataset数据集的使用
Echart开发数据格式dataset数据集的使用
69 0
|
存储
Seurat 对象添加任意低维嵌入数据
本文分享了一种将任意来源的低维嵌入数据添加到 Seurat reductions数据槽中的实现方法
175 0