Python训练营笔记 从0完成一个数据分析实战 Day10

简介: 学习笔记 - 天池龙珠计划 - Python 训练营 Task4 Day10(数据分析基本介绍、数据准备及读取、数据探索)

天池龙珠计划 Python训练营

所记录的知识点

  1. pd.read_csv
  2. pd.merge
  3. pd.DataFrame
  4. shape info describe

1、pd.read_csv

pd.read_csv读取csv文件中的数据

CSV文件内容

a_0|b_0|c_0|d_0
a_1|b_1|c_1|d_1
a_2|b_2|c_2|d_2
a_3|b_3|c_3|d_3
import pandas as pd
pd.read_csv("untitled.txt",sep="|",names=["a_col","b_col","c_col","d_col"])
# 分隔符 |
# 因为csv文件中,未添加无表头。所以,names=["a","b","c","d"]是表头
a_col    b_col    c_col    d_col
0    a_0    b_0    c_0    d_0
1    a_1    b_1    c_1    d_1
2    a_2    b_2    c_2    d_2
3    a_3    b_3    c_3    d_3

2、pd.merge

pd.merge 合并数据
import pandas as pd
csv_untitled = pd.read_csv("untitled.txt",sep="|",names=["a_col","b_col","c_col","d_col"])
# 分隔符 |
# 因为csv文件中,未添加无表头。所以,names=["a","b","c","d"]是表头
csv_untitled1 = pd.read_csv("untitled1.txt",sep="|",names=["a_col","e_col"])

print("csv_untitled\n",csv_untitled,"\n")

print("csv_untitled1\n",csv_untitled1,"\n")

# 通过a_col来合并
csv_merge = pd.merge(csv_untitled,csv_untitled1)
print("csv_merge\n",csv_merge,"\n")
csv_untitled
   a_col b_col c_col d_col
0   a_0   b_0   c_0   d_0
1   a_1   b_1   c_1   d_1
2   a_2   b_2   c_2   d_2
3   a_3   b_3   c_3   d_3 

csv_untitled1
   a_col e_col
0   a_0   e_0
1   a_1   e_1
2   a_2   e_2
3   a_3   e_3 

csv_merge
   a_col b_col c_col d_col e_col
0   a_0   b_0   c_0   d_0   e_0
1   a_1   b_1   c_1   d_1   e_1
2   a_2   b_2   c_2   d_2   e_2
3   a_3   b_3   c_3   d_3   e_3 

3、pd.merge

pd.DataFrame 提取指定名称的列
import pandas as pd
csv_untitled = pd.read_csv("untitled.txt",sep="|",names=["a_col","b_col","c_col","d_col"])
csv_untitled1 = pd.read_csv("untitled1.txt",sep="|",names=["a_col","e_col"])

# 通过a_col来合并
csv_merge = pd.merge(csv_untitled,csv_untitled1)
print("csv_merge\n",csv_merge,"\n")

# 提取指定名称的列
csv_col_a_b_e = pd.DataFrame(csv_merge,columns=["a_col","b_col","e_col"])
print("csv_col_a_b_e\n",csv_col_a_b_e)
csv_merge
   a_col b_col c_col d_col e_col
0   a_0   b_0   c_0   d_0   e_0
1   a_1   b_1   c_1   d_1   e_1
2   a_2   b_2   c_2   d_2   e_2
3   a_3   b_3   c_3   d_3   e_3 

csv_col_a_b_e
   a_col b_col e_col
0   a_0   b_0   e_0
1   a_1   b_1   e_1
2   a_2   b_2   e_2
3   a_3   b_3   e_3

4、shape info describe

shape 数据规模
info 整体数据信息
describe 数据分布情况
print("csv_col_a_b_e\n",csv_col_a_b_e,"\n")

# 数据规模
print("csv_col_a_b_e.shape\n",csv_col_a_b_e.shape,"\n")

# 整体数据信息
print("csv_col_a_b_e.info()")
csv_col_a_b_e.info()

# 数据分布情况
print("\ncsv_col_a_b_e.describe\n",csv_col_a_b_e.describe(),"\n")
csv_col_a_b_e
   a_col b_col e_col
0   a_0   b_0   e_0
1   a_1   b_1   e_1
2   a_2   b_2   e_2
3   a_3   b_3   e_3 

csv_col_a_b_e.shape
 (4, 3) 

csv_col_a_b_e.info()
<class 'pandas.core.frame.DataFrame'>
Int64Index: 4 entries, 0 to 3
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype 
---  ------  --------------  ----- 
 0   a_col   4 non-null      object
 1   b_col   4 non-null      object
 2   e_col   4 non-null      object
dtypes: object(3)
memory usage: 128.0+ bytes

csv_col_a_b_e.describe
        a_col b_col e_col
count      4     4     4
unique     4     4     4
top      a_0   b_2   e_0
freq       1     1     1 


欢迎各位同学一起来交流学习心得!

目录
相关文章
|
9天前
|
机器学习/深度学习 数据可视化 数据挖掘
使用Python进行数据分析和可视化
【10月更文挑战第42天】本文将介绍如何使用Python进行数据分析和可视化。我们将从数据导入、清洗、探索性分析、建模预测,以及结果的可视化展示等方面展开讲解。通过这篇文章,你将了解到Python在数据处理和分析中的强大功能,以及如何利用这些工具来提升你的工作效率。
|
15天前
|
数据采集 机器学习/深度学习 人工智能
Python编程入门:从基础到实战
【10月更文挑战第36天】本文将带你走进Python的世界,从基础语法出发,逐步深入到实际项目应用。我们将一起探索Python的简洁与强大,通过实例学习如何运用Python解决问题。无论你是编程新手还是希望扩展技能的老手,这篇文章都将为你提供有价值的指导和灵感。让我们一起开启Python编程之旅,用代码书写想法,创造可能。
|
17天前
|
数据库 Python
异步编程不再难!Python asyncio库实战,让你的代码流畅如丝!
在编程中,随着应用复杂度的提升,对并发和异步处理的需求日益增长。Python的asyncio库通过async和await关键字,简化了异步编程,使其变得流畅高效。本文将通过实战示例,介绍异步编程的基本概念、如何使用asyncio编写异步代码以及处理多个异步任务的方法,帮助你掌握异步编程技巧,提高代码性能。
51 4
|
16天前
|
机器学习/深度学习 数据可视化 数据处理
Python数据科学:从基础到实战
Python数据科学:从基础到实战
25 1
|
17天前
|
机器学习/深度学习 JSON API
Python编程实战:构建一个简单的天气预报应用
Python编程实战:构建一个简单的天气预报应用
33 1
|
18天前
|
机器学习/深度学习 数据采集 数据挖掘
解锁 Python 数据分析新境界:Pandas 与 NumPy 高级技巧深度剖析
Pandas 和 NumPy 是 Python 中不可或缺的数据处理和分析工具。本文通过实际案例深入剖析了 Pandas 的数据清洗、NumPy 的数组运算、结合两者进行数据分析和特征工程,以及 Pandas 的时间序列处理功能。这些高级技巧能够帮助我们更高效、准确地处理和分析数据,为决策提供支持。
35 2
|
19天前
|
前端开发 API 开发者
Python Web开发者必看!AJAX、Fetch API实战技巧,让前后端交互如丝般顺滑!
在Web开发中,前后端的高效交互是提升用户体验的关键。本文通过一个基于Flask框架的博客系统实战案例,详细介绍了如何使用AJAX和Fetch API实现不刷新页面查看评论的功能。从后端路由设置到前端请求处理,全面展示了这两种技术的应用技巧,帮助Python Web开发者提升项目质量和开发效率。
33 1
|
8天前
|
数据采集 数据可视化 数据挖掘
掌握Python数据分析,解锁数据驱动的决策能力
掌握Python数据分析,解锁数据驱动的决策能力
|
12天前
|
数据采集 存储 数据处理
探索Python中的异步编程:从基础到实战
【10月更文挑战第39天】在编程世界中,时间就是效率的代名词。Python的异步编程特性,如同给程序穿上了一双翅膀,让它们在执行任务时飞得更高、更快。本文将带你领略Python异步编程的魅力,从理解其背后的原理到掌握实际应用的技巧,我们不仅会讨论理论基础,还会通过实际代码示例,展示如何利用这些知识来提升你的程序性能。准备好让你的Python代码“起飞”了吗?让我们开始这场异步编程的旅程!
27 0
|
16天前
|
并行计算 数据挖掘 大数据
Python数据分析实战:利用Pandas处理大数据集
Python数据分析实战:利用Pandas处理大数据集
下一篇
无影云桌面