【数据预处理】爬取房地产的数据并进行数据清洗

简介: 爬取房地产的数据并进行数据清洗

文章目录

  • 一、爬取数据
  • 二、用kettle清洗数据
  • 三、可视化


一、爬取数据

1.先在pycharm编写代码爬虫,并得到相应数据

image.png

image.png

二、用kettle清洗数据

1.统计各个区域的房屋上架数量

Kettle步骤

image.png

image.png

2.统计各个区的房价,并统一化为面积单位

Kettle步骤

image.png

处理结果

image.png

3.统计各种类型的房屋比例

Kettle步骤

image.png

 处理结果

image.png

三、可视化

1.用饼状图展示各个区域的房屋上架数量

image.png

2.柱状图展示各个区的房价

image.png

3.饼状图展示各种类型的房屋比例

image.png

目录
相关文章
|
2月前
|
数据采集 存储 JSON
基于网络爬虫的天气数据分析
本文介绍了一个基于Python网络爬虫的天气数据分析项目,详细阐述了爬虫的设计原理、程序架构、整体执行流程及相关技术,包括数据爬取、解析、存储以及反爬虫策略,并展示了爬虫程序框架和流程图。
基于网络爬虫的天气数据分析
|
数据采集 数据可视化 数据挖掘
数据分析案例-旅游景点票价预测
数据分析案例-旅游景点票价预测
306 0
数据分析案例-旅游景点票价预测
|
数据采集 数据可视化 安全
|
数据可视化 数据挖掘 Python
COVID-19数据分析实战:统计分析及可视化
COVID-19数据分析实战:统计分析及可视化
COVID-19数据分析实战:统计分析及可视化
|
数据挖掘
数据分析——RFM模型
RFM模型是网点衡量当前用户价值和客户潜在价值的重要工具和手段。
427 0
数据分析——RFM模型
|
数据采集 机器学习/深度学习 数据挖掘
玩转数据分析——快速掌握 清洗代码!!!
玩转数据分析——快速掌握 清洗代码!!!
306 1
|
机器学习/深度学习 数据挖掘 数据处理
ML之FE:对爬取的某平台二手房数据进行数据分析以及特征工程处理
ML之FE:对爬取的某平台二手房数据进行数据分析以及特征工程处理
ML之FE:对爬取的某平台二手房数据进行数据分析以及特征工程处理
|
数据采集 机器学习/深度学习 数据可视化
数据分析--数据预处理
数据分析--数据预处理
149 0
|
数据采集 数据挖掘 API
3_数据分析—数据清洗及特征处理
3_数据分析—数据清洗及特征处理
459 0
3_数据分析—数据清洗及特征处理