spss、R语言、Python数据分析系列(4):python读取外部数据

简介: spss、R语言、Python数据分析系列(4):python读取外部数据

Python读取外部数据也比较简单,最常用的有pandas 和numpy模块


1、读取txt格式

import pandas as pd
 df1=pd.read_table('C:/Users/Administrator/Desktop/spss/数据/SPSS练习数据/data02-02a.txt')
  06 0 10 1.46 38
0  15 0 10 1.48 39
1  04 0 11 1.52 42
2  03 0 11 1.55 44
3  11 1 11 1.55 55
4  18 1 11 1.56 48



2、读取csv格式

df2=pd.read_csv('C:/Users/Administrator/Desktop/spss/数据/SPSS练习数据.csv')
df2
 2008/1/7  11.97  12.14   11.7   11.9  11.9.1
0    2008/1/8  11.90  12.75  11.80  12.21   12.21
1    2008/1/9  12.10  13.03  12.05  12.94   12.94
2   2008/1/10  13.04  13.32  12.71  13.10   13.10
3   2008/1/11  13.15  14.15  13.15  13.93   13.93
4   2008/1/14  13.96  14.45  13.60  14.03   14.03
5   2008/1/15  14.00  14.18  13.70  13.97   13.97
6   2008/1/16  13.80  13.85  13.11  13.32   13.32
7   2008/1/18  13.27  13.73  12.20  12.80   12.80
8   2008/1/21  12.75  13.34  12.35  13.22   13.22
9   2008/1/22  13.08  13.20  11.90  11.90   11.90
10  2008/1/23  11.00  11.40  10.71  10.71   10.71
11  2008/1/24  11.30  11.47  11.00  11.17   11.17
12   2008/1/7  11.97  12.14  11.70  11.90   11.90
13   2008/1/8  11.90  12.75  11.80  12.21   12.21
14   2008/1/9  12.10  13.03  12.05  12.94   12.94
15  2008/1/10  13.04  13.32  12.71  13.10   13.10
16  2008/1/11  13.15  14.15  13.15  13.93   13.93
17  2008/1/14  13.96  14.45  13.60  14.03   14.03
18  2008/1/15  14.00  14.18  13.70  13.97   13.97
19  2008/1/16  13.80  13.85  13.11  13.32   13.32
20  2008/1/18  13.27  13.73  12.20  12.80   12.80
21  2008/1/21  12.75  13.34  12.35  13.22   13.22
22  2008/1/22  13.08  13.20  11.90  11.90   11.90
23  2008/1/23  11.00  11.40  10.71  10.71   10.71
24  2008/1/24  11.30  11.47  11.00  11.17   11.17
25   2008/1/7  11.97  12.14  11.70  11.90   11.90
26   2008/1/8  11.90  12.75  11.80  12.21   12.21
27   2008/1/9  12.10  13.03  12.05  12.94   12.94
28  2008/1/10  13.04  13.32  12.71  13.10   13.10
29  2008/1/11  13.15  14.15  13.15  13.93   13.93
..        ...    ...    ...    ...    ...     ...
47  2008/1/21  12.75  13.34  12.35  13.22   13.22
48  2008/1/22  13.08  13.20  11.90  11.90   11.90
49  2008/1/23  11.00  11.40  10.71  10.71   10.71
50  2008/1/24  11.30  11.47  11.00  11.17   11.17
51   2008/1/7  11.97  12.14  11.70  11.90   11.90
52   2008/1/8  11.90  12.75  11.80  12.21   12.21
53   2008/1/9  12.10  13.03  12.05  12.94   12.94
54  2008/1/10  13.04  13.32  12.71  13.10   13.10
55  2008/1/11  13.15  14.15  13.15  13.93   13.93
56  2008/1/14  13.96  14.45  13.60  14.03   14.03
57  2008/1/15  14.00  14.18  13.70  13.97   13.97
58  2008/1/16  13.80  13.85  13.11  13.32   13.32
59  2008/1/18  13.27  13.73  12.20  12.80   12.80
60  2008/1/21  12.75  13.34  12.35  13.22   13.22
61  2008/1/22  13.08  13.20  11.90  11.90   11.90
62  2008/1/23  11.00  11.40  10.71  10.71   10.71
63  2008/1/24  11.30  11.47  11.00  11.17   11.17
64   2008/1/7  11.97  12.14  11.70  11.90   11.90
65   2008/1/8  11.90  12.75  11.80  12.21   12.21
66   2008/1/9  12.10  13.03  12.05  12.94   12.94
67  2008/1/10  13.04  13.32  12.71  13.10   13.10
68  2008/1/11  13.15  14.15  13.15  13.93   13.93
69  2008/1/14  13.96  14.45  13.60  14.03   14.03
70  2008/1/15  14.00  14.18  13.70  13.97   13.97
71  2008/1/16  13.80  13.85  13.11  13.32   13.32
72  2008/1/18  13.27  13.73  12.20  12.80   12.80
73  2008/1/21  12.75  13.34  12.35  13.22   13.22
74  2008/1/22  13.08  13.20  11.90  11.90   11.90
75  2008/1/23  11.00  11.40  10.71  10.71   10.71
76  2008/1/24  11.30  11.47  11.00  11.17   11.17
[77 rows x 6 columns]


3、读取excel格式

df3=pd.read_excel('C:/Users/Administrator/Desktop/spss/数据/SPSS练习数据.xlsx')
df3 2008-01-07 00:00:00  11.97  12.14   11.7   11.9  11.9.1
0           2008-01-08  11.90  12.75  11.80  12.21   12.21
1           2008-01-09  12.10  13.03  12.05  12.94   12.94
2           2008-01-10  13.04  13.32  12.71  13.10   13.10
3           2008-01-11  13.15  14.15  13.15  13.93   13.93
4           2008-01-14  13.96  14.45  13.60  14.03   14.03
5           2008-01-15  14.00  14.18  13.70  13.97   13.97
6           2008-01-16  13.80  13.85  13.11  13.32   13.32
7           2008-01-18  13.27  13.73  12.20  12.80   12.80
8           2008-01-21  12.75  13.34  12.35  13.22   13.22
9           2008-01-22  13.08  13.20  11.90  11.90   11.90
10          2008-01-23  11.00  11.40  10.71  10.71   10.71
11          2008-01-24  11.30  11.47  11.00  11.17   11.17
12          2008-01-07  11.97  12.14  11.70  11.90   11.90
13          2008-01-08  11.90  12.75  11.80  12.21   12.21
14          2008-01-09  12.10  13.03  12.05  12.94   12.94
15          2008-01-10  13.04  13.32  12.71  13.10   13.10
16          2008-01-11  13.15  14.15  13.15  13.93   13.93
17          2008-01-14  13.96  14.45  13.60  14.03   14.03
18          2008-01-15  14.00  14.18  13.70  13.97   13.97
19          2008-01-16  13.80  13.85  13.11  13.32   13.32
20          2008-01-18  13.27  13.73  12.20  12.80   12.80
21          2008-01-21  12.75  13.34  12.35  13.22   13.22
22          2008-01-22  13.08  13.20  11.90  11.90   11.90
23          2008-01-23  11.00  11.40  10.71  10.71   10.71
24          2008-01-24  11.30  11.47  11.00  11.17   11.17
25          2008-01-07  11.97  12.14  11.70  11.90   11.90
26          2008-01-08  11.90  12.75  11.80  12.21   12.21
27          2008-01-09  12.10  13.03  12.05  12.94   12.94
28          2008-01-10  13.04  13.32  12.71  13.10   13.10
29          2008-01-11  13.15  14.15  13.15  13.93   13.93
..                 ...    ...    ...    ...    ...     ...
47          2008-01-21  12.75  13.34  12.35  13.22   13.22
48          2008-01-22  13.08  13.20  11.90  11.90   11.90
49          2008-01-23  11.00  11.40  10.71  10.71   10.71
50          2008-01-24  11.30  11.47  11.00  11.17   11.17
51          2008-01-07  11.97  12.14  11.70  11.90   11.90
52          2008-01-08  11.90  12.75  11.80  12.21   12.21
53          2008-01-09  12.10  13.03  12.05  12.94   12.94
54          2008-01-10  13.04  13.32  12.71  13.10   13.10
55          2008-01-11  13.15  14.15  13.15  13.93   13.93
56          2008-01-14  13.96  14.45  13.60  14.03   14.03
57          2008-01-15  14.00  14.18  13.70  13.97   13.97
58          2008-01-16  13.80  13.85  13.11  13.32   13.32
59          2008-01-18  13.27  13.73  12.20  12.80   12.80
60          2008-01-21  12.75  13.34  12.35  13.22   13.22
61          2008-01-22  13.08  13.20  11.90  11.90   11.90
62          2008-01-23  11.00  11.40  10.71  10.71   10.71
63          2008-01-24  11.30  11.47  11.00  11.17   11.17
64          2008-01-07  11.97  12.14  11.70  11.90   11.90
65          2008-01-08  11.90  12.75  11.80  12.21   12.21
66          2008-01-09  12.10  13.03  12.05  12.94   12.94
67          2008-01-10  13.04  13.32  12.71  13.10   13.10
68          2008-01-11  13.15  14.15  13.15  13.93   13.93
69          2008-01-14  13.96  14.45  13.60  14.03   14.03
70          2008-01-15  14.00  14.18  13.70  13.97   13.97
71          2008-01-16  13.80  13.85  13.11  13.32   13.32
72          2008-01-18  13.27  13.73  12.20  12.80   12.80
73          2008-01-21  12.75  13.34  12.35  13.22   13.22
74          2008-01-22  13.08  13.20  11.90  11.90   11.90
75          2008-01-23  11.00  11.40  10.71  10.71   10.71
76          2008-01-24  11.30  11.47  11.00  11.17   11.17
[77 rows x 6 columns]


4、读取spss格式

import savReaderWriter
df4=savReaderWriter.SavReader('C:/Users/Administrator/Desktop/spss/数据/SPSS练习数据/data02-01.sav')
目录
相关文章
|
9天前
|
机器学习/深度学习 数据采集 数据挖掘
解锁 Python 数据分析新境界:Pandas 与 NumPy 高级技巧深度剖析
Pandas 和 NumPy 是 Python 中不可或缺的数据处理和分析工具。本文通过实际案例深入剖析了 Pandas 的数据清洗、NumPy 的数组运算、结合两者进行数据分析和特征工程,以及 Pandas 的时间序列处理功能。这些高级技巧能够帮助我们更高效、准确地处理和分析数据,为决策提供支持。
21 2
|
9天前
|
图形学 Python
SciPy 空间数据2
凸包(Convex Hull)是计算几何中的概念,指包含给定点集的所有凸集的交集。可以通过 `ConvexHull()` 方法创建凸包。示例代码展示了如何使用 `scipy` 库和 `matplotlib` 绘制给定点集的凸包。
18 1
|
10天前
|
JSON 数据格式 索引
Python中序列化/反序列化JSON格式的数据
【11月更文挑战第4天】本文介绍了 Python 中使用 `json` 模块进行序列化和反序列化的操作。序列化是指将 Python 对象(如字典、列表)转换为 JSON 字符串,主要使用 `json.dumps` 方法。示例包括基本的字典和列表序列化,以及自定义类的序列化。反序列化则是将 JSON 字符串转换回 Python 对象,使用 `json.loads` 方法。文中还提供了具体的代码示例,展示了如何处理不同类型的 Python 对象。
|
10天前
|
数据采集 Web App开发 iOS开发
如何使用 Python 语言的正则表达式进行网页数据的爬取?
使用 Python 进行网页数据爬取的步骤包括:1. 安装必要库(requests、re、bs4);2. 发送 HTTP 请求获取网页内容;3. 使用正则表达式提取数据;4. 数据清洗和处理;5. 循环遍历多个页面。通过这些步骤,可以高效地从网页中提取所需信息。
|
7天前
|
并行计算 数据挖掘 大数据
Python数据分析实战:利用Pandas处理大数据集
Python数据分析实战:利用Pandas处理大数据集
|
7天前
|
数据采集 数据可视化 数据挖掘
利用Python进行数据分析:Pandas库实战指南
利用Python进行数据分析:Pandas库实战指南
|
9天前
|
索引 Python
SciPy 空间数据1
SciPy 通过 `scipy.spatial` 模块处理空间数据,如判断点是否在边界内、计算最近点等。三角测量是通过测量角度来确定目标距离的方法。多边形的三角测量可将其分解为多个三角形,用于计算面积。Delaunay 三角剖分是一种常用方法,可以对一系列点进行三角剖分。示例代码展示了如何使用 `Delaunay()` 函数创建三角形并绘制。
18 0
|
9天前
|
SQL 数据挖掘 Python
数据分析编程:SQL,Python or SPL?
数据分析编程用什么,SQL、python or SPL?话不多说,直接上代码,对比明显,明眼人一看就明了:本案例涵盖五个数据分析任务:1) 计算用户会话次数;2) 球员连续得分分析;3) 连续三天活跃用户数统计;4) 新用户次日留存率计算;5) 股价涨跌幅分析。每个任务基于相应数据表进行处理和计算。
|
9天前
|
数据采集 数据可视化 数据挖掘
使用Python进行数据分析和可视化
【10月更文挑战第33天】本文将介绍如何使用Python编程语言进行数据分析和可视化。我们将从数据清洗开始,然后进行数据探索性分析,最后使用matplotlib和seaborn库进行数据可视化。通过阅读本文,你将学会如何运用Python进行数据处理和可视化展示。
|
3月前
|
数据采集 数据可视化 数据挖掘
数据分析大神养成记:Python+Pandas+Matplotlib助你飞跃!
在数字化时代,数据分析至关重要,而Python凭借其强大的数据处理能力和丰富的库支持,已成为该领域的首选工具。Python作为基石,提供简洁语法和全面功能,适用于从数据预处理到高级分析的各种任务。Pandas库则像是神兵利器,其DataFrame结构让表格型数据的处理变得简单高效,支持数据的增删改查及复杂变换。配合Matplotlib这一数据可视化的魔法棒,能以直观图表展现数据分析结果。掌握这三大神器,你也能成为数据分析领域的高手!
77 2

热门文章

最新文章