spss、R语言、Python数据分析系列(4):python读取外部数据

简介: spss、R语言、Python数据分析系列(4):python读取外部数据

Python读取外部数据也比较简单,最常用的有pandas 和numpy模块


1、读取txt格式

import pandas as pd
 df1=pd.read_table('C:/Users/Administrator/Desktop/spss/数据/SPSS练习数据/data02-02a.txt')
  06 0 10 1.46 38
0  15 0 10 1.48 39
1  04 0 11 1.52 42
2  03 0 11 1.55 44
3  11 1 11 1.55 55
4  18 1 11 1.56 48



2、读取csv格式

df2=pd.read_csv('C:/Users/Administrator/Desktop/spss/数据/SPSS练习数据.csv')
df2
 2008/1/7  11.97  12.14   11.7   11.9  11.9.1
0    2008/1/8  11.90  12.75  11.80  12.21   12.21
1    2008/1/9  12.10  13.03  12.05  12.94   12.94
2   2008/1/10  13.04  13.32  12.71  13.10   13.10
3   2008/1/11  13.15  14.15  13.15  13.93   13.93
4   2008/1/14  13.96  14.45  13.60  14.03   14.03
5   2008/1/15  14.00  14.18  13.70  13.97   13.97
6   2008/1/16  13.80  13.85  13.11  13.32   13.32
7   2008/1/18  13.27  13.73  12.20  12.80   12.80
8   2008/1/21  12.75  13.34  12.35  13.22   13.22
9   2008/1/22  13.08  13.20  11.90  11.90   11.90
10  2008/1/23  11.00  11.40  10.71  10.71   10.71
11  2008/1/24  11.30  11.47  11.00  11.17   11.17
12   2008/1/7  11.97  12.14  11.70  11.90   11.90
13   2008/1/8  11.90  12.75  11.80  12.21   12.21
14   2008/1/9  12.10  13.03  12.05  12.94   12.94
15  2008/1/10  13.04  13.32  12.71  13.10   13.10
16  2008/1/11  13.15  14.15  13.15  13.93   13.93
17  2008/1/14  13.96  14.45  13.60  14.03   14.03
18  2008/1/15  14.00  14.18  13.70  13.97   13.97
19  2008/1/16  13.80  13.85  13.11  13.32   13.32
20  2008/1/18  13.27  13.73  12.20  12.80   12.80
21  2008/1/21  12.75  13.34  12.35  13.22   13.22
22  2008/1/22  13.08  13.20  11.90  11.90   11.90
23  2008/1/23  11.00  11.40  10.71  10.71   10.71
24  2008/1/24  11.30  11.47  11.00  11.17   11.17
25   2008/1/7  11.97  12.14  11.70  11.90   11.90
26   2008/1/8  11.90  12.75  11.80  12.21   12.21
27   2008/1/9  12.10  13.03  12.05  12.94   12.94
28  2008/1/10  13.04  13.32  12.71  13.10   13.10
29  2008/1/11  13.15  14.15  13.15  13.93   13.93
..        ...    ...    ...    ...    ...     ...
47  2008/1/21  12.75  13.34  12.35  13.22   13.22
48  2008/1/22  13.08  13.20  11.90  11.90   11.90
49  2008/1/23  11.00  11.40  10.71  10.71   10.71
50  2008/1/24  11.30  11.47  11.00  11.17   11.17
51   2008/1/7  11.97  12.14  11.70  11.90   11.90
52   2008/1/8  11.90  12.75  11.80  12.21   12.21
53   2008/1/9  12.10  13.03  12.05  12.94   12.94
54  2008/1/10  13.04  13.32  12.71  13.10   13.10
55  2008/1/11  13.15  14.15  13.15  13.93   13.93
56  2008/1/14  13.96  14.45  13.60  14.03   14.03
57  2008/1/15  14.00  14.18  13.70  13.97   13.97
58  2008/1/16  13.80  13.85  13.11  13.32   13.32
59  2008/1/18  13.27  13.73  12.20  12.80   12.80
60  2008/1/21  12.75  13.34  12.35  13.22   13.22
61  2008/1/22  13.08  13.20  11.90  11.90   11.90
62  2008/1/23  11.00  11.40  10.71  10.71   10.71
63  2008/1/24  11.30  11.47  11.00  11.17   11.17
64   2008/1/7  11.97  12.14  11.70  11.90   11.90
65   2008/1/8  11.90  12.75  11.80  12.21   12.21
66   2008/1/9  12.10  13.03  12.05  12.94   12.94
67  2008/1/10  13.04  13.32  12.71  13.10   13.10
68  2008/1/11  13.15  14.15  13.15  13.93   13.93
69  2008/1/14  13.96  14.45  13.60  14.03   14.03
70  2008/1/15  14.00  14.18  13.70  13.97   13.97
71  2008/1/16  13.80  13.85  13.11  13.32   13.32
72  2008/1/18  13.27  13.73  12.20  12.80   12.80
73  2008/1/21  12.75  13.34  12.35  13.22   13.22
74  2008/1/22  13.08  13.20  11.90  11.90   11.90
75  2008/1/23  11.00  11.40  10.71  10.71   10.71
76  2008/1/24  11.30  11.47  11.00  11.17   11.17
[77 rows x 6 columns]


3、读取excel格式

df3=pd.read_excel('C:/Users/Administrator/Desktop/spss/数据/SPSS练习数据.xlsx')
df3 2008-01-07 00:00:00  11.97  12.14   11.7   11.9  11.9.1
0           2008-01-08  11.90  12.75  11.80  12.21   12.21
1           2008-01-09  12.10  13.03  12.05  12.94   12.94
2           2008-01-10  13.04  13.32  12.71  13.10   13.10
3           2008-01-11  13.15  14.15  13.15  13.93   13.93
4           2008-01-14  13.96  14.45  13.60  14.03   14.03
5           2008-01-15  14.00  14.18  13.70  13.97   13.97
6           2008-01-16  13.80  13.85  13.11  13.32   13.32
7           2008-01-18  13.27  13.73  12.20  12.80   12.80
8           2008-01-21  12.75  13.34  12.35  13.22   13.22
9           2008-01-22  13.08  13.20  11.90  11.90   11.90
10          2008-01-23  11.00  11.40  10.71  10.71   10.71
11          2008-01-24  11.30  11.47  11.00  11.17   11.17
12          2008-01-07  11.97  12.14  11.70  11.90   11.90
13          2008-01-08  11.90  12.75  11.80  12.21   12.21
14          2008-01-09  12.10  13.03  12.05  12.94   12.94
15          2008-01-10  13.04  13.32  12.71  13.10   13.10
16          2008-01-11  13.15  14.15  13.15  13.93   13.93
17          2008-01-14  13.96  14.45  13.60  14.03   14.03
18          2008-01-15  14.00  14.18  13.70  13.97   13.97
19          2008-01-16  13.80  13.85  13.11  13.32   13.32
20          2008-01-18  13.27  13.73  12.20  12.80   12.80
21          2008-01-21  12.75  13.34  12.35  13.22   13.22
22          2008-01-22  13.08  13.20  11.90  11.90   11.90
23          2008-01-23  11.00  11.40  10.71  10.71   10.71
24          2008-01-24  11.30  11.47  11.00  11.17   11.17
25          2008-01-07  11.97  12.14  11.70  11.90   11.90
26          2008-01-08  11.90  12.75  11.80  12.21   12.21
27          2008-01-09  12.10  13.03  12.05  12.94   12.94
28          2008-01-10  13.04  13.32  12.71  13.10   13.10
29          2008-01-11  13.15  14.15  13.15  13.93   13.93
..                 ...    ...    ...    ...    ...     ...
47          2008-01-21  12.75  13.34  12.35  13.22   13.22
48          2008-01-22  13.08  13.20  11.90  11.90   11.90
49          2008-01-23  11.00  11.40  10.71  10.71   10.71
50          2008-01-24  11.30  11.47  11.00  11.17   11.17
51          2008-01-07  11.97  12.14  11.70  11.90   11.90
52          2008-01-08  11.90  12.75  11.80  12.21   12.21
53          2008-01-09  12.10  13.03  12.05  12.94   12.94
54          2008-01-10  13.04  13.32  12.71  13.10   13.10
55          2008-01-11  13.15  14.15  13.15  13.93   13.93
56          2008-01-14  13.96  14.45  13.60  14.03   14.03
57          2008-01-15  14.00  14.18  13.70  13.97   13.97
58          2008-01-16  13.80  13.85  13.11  13.32   13.32
59          2008-01-18  13.27  13.73  12.20  12.80   12.80
60          2008-01-21  12.75  13.34  12.35  13.22   13.22
61          2008-01-22  13.08  13.20  11.90  11.90   11.90
62          2008-01-23  11.00  11.40  10.71  10.71   10.71
63          2008-01-24  11.30  11.47  11.00  11.17   11.17
64          2008-01-07  11.97  12.14  11.70  11.90   11.90
65          2008-01-08  11.90  12.75  11.80  12.21   12.21
66          2008-01-09  12.10  13.03  12.05  12.94   12.94
67          2008-01-10  13.04  13.32  12.71  13.10   13.10
68          2008-01-11  13.15  14.15  13.15  13.93   13.93
69          2008-01-14  13.96  14.45  13.60  14.03   14.03
70          2008-01-15  14.00  14.18  13.70  13.97   13.97
71          2008-01-16  13.80  13.85  13.11  13.32   13.32
72          2008-01-18  13.27  13.73  12.20  12.80   12.80
73          2008-01-21  12.75  13.34  12.35  13.22   13.22
74          2008-01-22  13.08  13.20  11.90  11.90   11.90
75          2008-01-23  11.00  11.40  10.71  10.71   10.71
76          2008-01-24  11.30  11.47  11.00  11.17   11.17
[77 rows x 6 columns]


4、读取spss格式

import savReaderWriter
df4=savReaderWriter.SavReader('C:/Users/Administrator/Desktop/spss/数据/SPSS练习数据/data02-01.sav')
目录
相关文章
|
1天前
|
存储 数据采集 数据可视化
Pandas数据应用:电子商务数据分析
本文介绍如何使用 Pandas 进行电子商务数据分析,涵盖数据加载、清洗、预处理、分析与可视化。通过 `read_csv` 等函数加载数据,利用 `info()` 和 `describe()` 探索数据结构和统计信息。针对常见问题如缺失值、重复记录、异常值等,提供解决方案,如 `dropna()`、`drop_duplicates()` 和正则表达式处理。结合 Matplotlib 等库实现数据可视化,探讨内存不足和性能瓶颈的应对方法,并总结常见报错及解决策略,帮助提升电商企业的数据分析能力。
91 73
|
2天前
|
数据采集 数据可视化 数据挖掘
Pandas数据应用:天气数据分析
本文介绍如何使用 Pandas 进行天气数据分析。Pandas 是一个强大的 Python 数据处理库,适合处理表格型数据。文章涵盖加载天气数据、处理缺失值、转换数据类型、时间序列分析(如滚动平均和重采样)等内容,并解决常见报错如 SettingWithCopyWarning、KeyError 和 TypeError。通过这些方法,帮助用户更好地进行气候趋势预测和决策。
91 71
|
2月前
|
存储 机器学习/深度学习 数据可视化
数据集中存在大量的重复值,会对后续的数据分析和处理产生什么影响?
数据集中存在大量重复值可能会对后续的数据分析和处理产生多方面的负面影响
123 56
|
3天前
|
数据采集 数据可视化 索引
Pandas数据应用:股票数据分析
本文介绍了如何使用Pandas库进行股票数据分析。首先,通过pip安装并导入Pandas库。接着,从本地CSV文件读取股票数据,并解决常见的解析错误。然后,利用head()、info()等函数查看数据基本信息,进行数据清洗,处理缺失值和重复数据。再者,结合Matplotlib和Seaborn进行数据可视化,绘制收盘价折线图。最后,进行时间序列分析,设置日期索引、重采样和计算移动平均线。通过这些步骤,帮助读者掌握Pandas在股票数据分析中的应用。
30 5
|
15天前
|
数据采集 监控 数据挖掘
常用电商商品数据API接口(item get)概述,数据分析以及上货
电商商品数据API接口(item get)是电商平台上用于提供商品详细信息的接口。这些接口允许开发者或系统以编程方式获取商品的详细信息,包括但不限于商品的标题、价格、库存、图片、销量、规格参数、用户评价等。这些信息对于电商业务来说至关重要,是商品数据分析、价格监控、上货策略制定等工作的基础。
|
20天前
|
Unix 编译器 C语言
[oeasy]python052_[系统开发语言为什么默认是c语言
本文介绍了C语言为何成为系统开发的首选语言,从其诞生背景、发展历史及特点进行阐述。C语言源于贝尔实验室,与Unix操作系统相互促进,因其简洁、高效、跨平台等特性,逐渐成为主流。文章还提及了C语言的学习资料及其对编程文化的影响。
24 5
|
3月前
|
机器学习/深度学习 并行计算 数据挖掘
R语言是一种强大的统计分析工具,广泛应用于数据分析和机器学习领域
【10月更文挑战第21天】R语言是一种强大的统计分析工具,广泛应用于数据分析和机器学习领域。本文将介绍R语言中的一些高级编程技巧,包括函数式编程、向量化运算、字符串处理、循环和条件语句、异常处理和性能优化等方面,以帮助读者更好地掌握R语言的编程技巧,提高数据分析的效率。
65 2
|
3月前
|
数据采集 数据可视化 数据挖掘
R语言与Python:比较两种数据分析工具
R语言和Python是目前最流行的两种数据分析工具。本文将对这两种工具进行比较,包括它们的历史、特点、应用场景、社区支持、学习资源、性能等方面,以帮助读者更好地了解和选择适合自己的数据分析工具。
59 2
|
3月前
|
机器学习/深度学习 人工智能 搜索推荐
某A保险公司的 数据图表和数据分析
某A保险公司的 数据图表和数据分析
70 0
某A保险公司的 数据图表和数据分析
|
2月前
|
机器学习/深度学习 算法 数据挖掘
数据分析的 10 个最佳 Python 库
数据分析的 10 个最佳 Python 库
93 4
数据分析的 10 个最佳 Python 库