【数据预处理】爬取房地产的数据并进行数据清洗

简介: 爬取房地产的数据并进行数据清洗

文章目录

  • 一、爬取数据
  • 二、用kettle清洗数据
  • 三、可视化


一、爬取数据

1.先在pycharm编写代码爬虫,并得到相应数据

image.png

image.png

二、用kettle清洗数据

1.统计各个区域的房屋上架数量

Kettle步骤

image.png

image.png

2.统计各个区的房价,并统一化为面积单位

Kettle步骤

image.png

处理结果

image.png

3.统计各种类型的房屋比例

Kettle步骤

image.png

 处理结果

image.png

三、可视化

1.用饼状图展示各个区域的房屋上架数量

image.png

2.柱状图展示各个区的房价

image.png

3.饼状图展示各种类型的房屋比例

image.png

目录
相关文章
|
9月前
|
数据采集 存储 数据挖掘
使用Python实现高效的数据清洗
数据清洗是数据分析和挖掘中必不可少的一环,但手动清洗大量数据非常繁琐,容易出错且耗费时间。本文将介绍如何使用Python编写高效的数据清洗程序,通过代码实现数据清洗过程,提高清洗效率和数据准确性。
|
9月前
|
数据采集 存储 自然语言处理
【数据挖掘】数据清洗、数据集成、数据标准化的详解(超详细 附源码)
【数据挖掘】数据清洗、数据集成、数据标准化的详解(超详细 附源码)
706 0
|
SQL 自然语言处理 算法
数据挖掘-数据的预处理(三)
数据挖掘-数据的预处理(三)
210 0
数据挖掘-数据的预处理(三)
|
数据采集 数据可视化 数据挖掘
数据分析案例-旅游景点票价预测
数据分析案例-旅游景点票价预测
344 0
数据分析案例-旅游景点票价预测
|
数据采集 数据可视化 安全
|
数据采集 消息中间件 NoSQL
数据预处理-数据清洗需求分析|学习笔记
快速学习数据预处理-数据清洗需求分析
586 0
数据预处理-数据清洗需求分析|学习笔记
|
数据采集 SQL 数据挖掘
数据清洗_剪除反常数据|学习笔记
快速学习数据清洗_剪除反常数据
152 0
数据清洗_剪除反常数据|学习笔记
|
数据采集 机器学习/深度学习 数据挖掘
玩转数据分析——快速掌握 清洗代码!!!
玩转数据分析——快速掌握 清洗代码!!!
345 1
|
数据采集 消息中间件 分布式计算
数据预处理-数据清洗-效果与总结|学习笔记
快速学习数据预处理-数据清洗-效果与总结
221 0