spss、R语言、Python数据分析系列(4):python读取外部数据

简介: spss、R语言、Python数据分析系列(4):python读取外部数据

Python读取外部数据也比较简单,最常用的有pandas 和numpy模块


1、读取txt格式

import pandas as pd
 df1=pd.read_table('C:/Users/Administrator/Desktop/spss/数据/SPSS练习数据/data02-02a.txt')
  06 0 10 1.46 38
0  15 0 10 1.48 39
1  04 0 11 1.52 42
2  03 0 11 1.55 44
3  11 1 11 1.55 55
4  18 1 11 1.56 48



2、读取csv格式

df2=pd.read_csv('C:/Users/Administrator/Desktop/spss/数据/SPSS练习数据.csv')
df2
 2008/1/7  11.97  12.14   11.7   11.9  11.9.1
0    2008/1/8  11.90  12.75  11.80  12.21   12.21
1    2008/1/9  12.10  13.03  12.05  12.94   12.94
2   2008/1/10  13.04  13.32  12.71  13.10   13.10
3   2008/1/11  13.15  14.15  13.15  13.93   13.93
4   2008/1/14  13.96  14.45  13.60  14.03   14.03
5   2008/1/15  14.00  14.18  13.70  13.97   13.97
6   2008/1/16  13.80  13.85  13.11  13.32   13.32
7   2008/1/18  13.27  13.73  12.20  12.80   12.80
8   2008/1/21  12.75  13.34  12.35  13.22   13.22
9   2008/1/22  13.08  13.20  11.90  11.90   11.90
10  2008/1/23  11.00  11.40  10.71  10.71   10.71
11  2008/1/24  11.30  11.47  11.00  11.17   11.17
12   2008/1/7  11.97  12.14  11.70  11.90   11.90
13   2008/1/8  11.90  12.75  11.80  12.21   12.21
14   2008/1/9  12.10  13.03  12.05  12.94   12.94
15  2008/1/10  13.04  13.32  12.71  13.10   13.10
16  2008/1/11  13.15  14.15  13.15  13.93   13.93
17  2008/1/14  13.96  14.45  13.60  14.03   14.03
18  2008/1/15  14.00  14.18  13.70  13.97   13.97
19  2008/1/16  13.80  13.85  13.11  13.32   13.32
20  2008/1/18  13.27  13.73  12.20  12.80   12.80
21  2008/1/21  12.75  13.34  12.35  13.22   13.22
22  2008/1/22  13.08  13.20  11.90  11.90   11.90
23  2008/1/23  11.00  11.40  10.71  10.71   10.71
24  2008/1/24  11.30  11.47  11.00  11.17   11.17
25   2008/1/7  11.97  12.14  11.70  11.90   11.90
26   2008/1/8  11.90  12.75  11.80  12.21   12.21
27   2008/1/9  12.10  13.03  12.05  12.94   12.94
28  2008/1/10  13.04  13.32  12.71  13.10   13.10
29  2008/1/11  13.15  14.15  13.15  13.93   13.93
..        ...    ...    ...    ...    ...     ...
47  2008/1/21  12.75  13.34  12.35  13.22   13.22
48  2008/1/22  13.08  13.20  11.90  11.90   11.90
49  2008/1/23  11.00  11.40  10.71  10.71   10.71
50  2008/1/24  11.30  11.47  11.00  11.17   11.17
51   2008/1/7  11.97  12.14  11.70  11.90   11.90
52   2008/1/8  11.90  12.75  11.80  12.21   12.21
53   2008/1/9  12.10  13.03  12.05  12.94   12.94
54  2008/1/10  13.04  13.32  12.71  13.10   13.10
55  2008/1/11  13.15  14.15  13.15  13.93   13.93
56  2008/1/14  13.96  14.45  13.60  14.03   14.03
57  2008/1/15  14.00  14.18  13.70  13.97   13.97
58  2008/1/16  13.80  13.85  13.11  13.32   13.32
59  2008/1/18  13.27  13.73  12.20  12.80   12.80
60  2008/1/21  12.75  13.34  12.35  13.22   13.22
61  2008/1/22  13.08  13.20  11.90  11.90   11.90
62  2008/1/23  11.00  11.40  10.71  10.71   10.71
63  2008/1/24  11.30  11.47  11.00  11.17   11.17
64   2008/1/7  11.97  12.14  11.70  11.90   11.90
65   2008/1/8  11.90  12.75  11.80  12.21   12.21
66   2008/1/9  12.10  13.03  12.05  12.94   12.94
67  2008/1/10  13.04  13.32  12.71  13.10   13.10
68  2008/1/11  13.15  14.15  13.15  13.93   13.93
69  2008/1/14  13.96  14.45  13.60  14.03   14.03
70  2008/1/15  14.00  14.18  13.70  13.97   13.97
71  2008/1/16  13.80  13.85  13.11  13.32   13.32
72  2008/1/18  13.27  13.73  12.20  12.80   12.80
73  2008/1/21  12.75  13.34  12.35  13.22   13.22
74  2008/1/22  13.08  13.20  11.90  11.90   11.90
75  2008/1/23  11.00  11.40  10.71  10.71   10.71
76  2008/1/24  11.30  11.47  11.00  11.17   11.17
[77 rows x 6 columns]


3、读取excel格式

df3=pd.read_excel('C:/Users/Administrator/Desktop/spss/数据/SPSS练习数据.xlsx')
df3 2008-01-07 00:00:00  11.97  12.14   11.7   11.9  11.9.1
0           2008-01-08  11.90  12.75  11.80  12.21   12.21
1           2008-01-09  12.10  13.03  12.05  12.94   12.94
2           2008-01-10  13.04  13.32  12.71  13.10   13.10
3           2008-01-11  13.15  14.15  13.15  13.93   13.93
4           2008-01-14  13.96  14.45  13.60  14.03   14.03
5           2008-01-15  14.00  14.18  13.70  13.97   13.97
6           2008-01-16  13.80  13.85  13.11  13.32   13.32
7           2008-01-18  13.27  13.73  12.20  12.80   12.80
8           2008-01-21  12.75  13.34  12.35  13.22   13.22
9           2008-01-22  13.08  13.20  11.90  11.90   11.90
10          2008-01-23  11.00  11.40  10.71  10.71   10.71
11          2008-01-24  11.30  11.47  11.00  11.17   11.17
12          2008-01-07  11.97  12.14  11.70  11.90   11.90
13          2008-01-08  11.90  12.75  11.80  12.21   12.21
14          2008-01-09  12.10  13.03  12.05  12.94   12.94
15          2008-01-10  13.04  13.32  12.71  13.10   13.10
16          2008-01-11  13.15  14.15  13.15  13.93   13.93
17          2008-01-14  13.96  14.45  13.60  14.03   14.03
18          2008-01-15  14.00  14.18  13.70  13.97   13.97
19          2008-01-16  13.80  13.85  13.11  13.32   13.32
20          2008-01-18  13.27  13.73  12.20  12.80   12.80
21          2008-01-21  12.75  13.34  12.35  13.22   13.22
22          2008-01-22  13.08  13.20  11.90  11.90   11.90
23          2008-01-23  11.00  11.40  10.71  10.71   10.71
24          2008-01-24  11.30  11.47  11.00  11.17   11.17
25          2008-01-07  11.97  12.14  11.70  11.90   11.90
26          2008-01-08  11.90  12.75  11.80  12.21   12.21
27          2008-01-09  12.10  13.03  12.05  12.94   12.94
28          2008-01-10  13.04  13.32  12.71  13.10   13.10
29          2008-01-11  13.15  14.15  13.15  13.93   13.93
..                 ...    ...    ...    ...    ...     ...
47          2008-01-21  12.75  13.34  12.35  13.22   13.22
48          2008-01-22  13.08  13.20  11.90  11.90   11.90
49          2008-01-23  11.00  11.40  10.71  10.71   10.71
50          2008-01-24  11.30  11.47  11.00  11.17   11.17
51          2008-01-07  11.97  12.14  11.70  11.90   11.90
52          2008-01-08  11.90  12.75  11.80  12.21   12.21
53          2008-01-09  12.10  13.03  12.05  12.94   12.94
54          2008-01-10  13.04  13.32  12.71  13.10   13.10
55          2008-01-11  13.15  14.15  13.15  13.93   13.93
56          2008-01-14  13.96  14.45  13.60  14.03   14.03
57          2008-01-15  14.00  14.18  13.70  13.97   13.97
58          2008-01-16  13.80  13.85  13.11  13.32   13.32
59          2008-01-18  13.27  13.73  12.20  12.80   12.80
60          2008-01-21  12.75  13.34  12.35  13.22   13.22
61          2008-01-22  13.08  13.20  11.90  11.90   11.90
62          2008-01-23  11.00  11.40  10.71  10.71   10.71
63          2008-01-24  11.30  11.47  11.00  11.17   11.17
64          2008-01-07  11.97  12.14  11.70  11.90   11.90
65          2008-01-08  11.90  12.75  11.80  12.21   12.21
66          2008-01-09  12.10  13.03  12.05  12.94   12.94
67          2008-01-10  13.04  13.32  12.71  13.10   13.10
68          2008-01-11  13.15  14.15  13.15  13.93   13.93
69          2008-01-14  13.96  14.45  13.60  14.03   14.03
70          2008-01-15  14.00  14.18  13.70  13.97   13.97
71          2008-01-16  13.80  13.85  13.11  13.32   13.32
72          2008-01-18  13.27  13.73  12.20  12.80   12.80
73          2008-01-21  12.75  13.34  12.35  13.22   13.22
74          2008-01-22  13.08  13.20  11.90  11.90   11.90
75          2008-01-23  11.00  11.40  10.71  10.71   10.71
76          2008-01-24  11.30  11.47  11.00  11.17   11.17
[77 rows x 6 columns]


4、读取spss格式

import savReaderWriter
df4=savReaderWriter.SavReader('C:/Users/Administrator/Desktop/spss/数据/SPSS练习数据/data02-01.sav')
目录
相关文章
|
1月前
|
存储 机器学习/深度学习 数据可视化
数据集中存在大量的重复值,会对后续的数据分析和处理产生什么影响?
数据集中存在大量重复值可能会对后续的数据分析和处理产生多方面的负面影响
115 56
|
29天前
|
机器学习/深度学习 算法 数据挖掘
数据分析的 10 个最佳 Python 库
数据分析的 10 个最佳 Python 库
83 4
数据分析的 10 个最佳 Python 库
|
9天前
|
数据采集 监控 数据挖掘
常用电商商品数据API接口(item get)概述,数据分析以及上货
电商商品数据API接口(item get)是电商平台上用于提供商品详细信息的接口。这些接口允许开发者或系统以编程方式获取商品的详细信息,包括但不限于商品的标题、价格、库存、图片、销量、规格参数、用户评价等。这些信息对于电商业务来说至关重要,是商品数据分析、价格监控、上货策略制定等工作的基础。
|
2月前
|
数据采集 数据可视化 数据挖掘
R语言与Python:比较两种数据分析工具
R语言和Python是目前最流行的两种数据分析工具。本文将对这两种工具进行比较,包括它们的历史、特点、应用场景、社区支持、学习资源、性能等方面,以帮助读者更好地了解和选择适合自己的数据分析工具。
56 2
|
2月前
|
机器学习/深度学习 人工智能 搜索推荐
某A保险公司的 数据图表和数据分析
某A保险公司的 数据图表和数据分析
67 0
某A保险公司的 数据图表和数据分析
|
1月前
|
SQL 数据挖掘 Python
数据分析编程:SQL,Python or SPL?
数据分析编程用什么,SQL、python or SPL?话不多说,直接上代码,对比明显,明眼人一看就明了:本案例涵盖五个数据分析任务:1) 计算用户会话次数;2) 球员连续得分分析;3) 连续三天活跃用户数统计;4) 新用户次日留存率计算;5) 股价涨跌幅分析。每个任务基于相应数据表进行处理和计算。
|
2月前
|
机器学习/深度学习 数据采集 数据可视化
数据分析之旅:用Python探索世界
数据分析之旅:用Python探索世界
37 2
|
3月前
R语言基于表格文件的数据绘制具有多个系列的柱状图与直方图
【9月更文挑战第9天】在R语言中,利用`ggplot2`包可绘制多系列柱状图与直方图。首先读取数据文件`data.csv`,加载`ggplot2`包后,使用`ggplot`函数指定轴与填充颜色,并通过`geom_bar`或`geom_histogram`绘图。参数如`stat`, `position`, `alpha`等可根据需要调整,实现不同系列的图表展示。
|
2月前
|
机器学习/深度学习 数据采集 数据可视化
如何理解数据分析及数据的预处理,分析建模,可视化
如何理解数据分析及数据的预处理,分析建模,可视化
66 0
|
3月前
|
机器学习/深度学习 数据挖掘 TensorFlow
🔍揭秘Python数据分析奥秘,TensorFlow助力解锁数据背后的亿万商机
【9月更文挑战第11天】在信息爆炸的时代,数据如沉睡的宝藏,等待发掘。Python以简洁的语法和丰富的库生态成为数据分析的首选,而TensorFlow则为深度学习赋能,助你洞察数据核心,解锁商机。通过Pandas库,我们可以轻松处理结构化数据,进行统计分析和可视化;TensorFlow则能构建复杂的神经网络模型,捕捉非线性关系,提升预测准确性。两者的结合,让你在商业竞争中脱颖而出,把握市场脉搏,释放数据的无限价值。以下是使用Pandas进行简单数据分析的示例:
51 5