spss、R语言、Python数据分析系列(4):python读取外部数据

简介: spss、R语言、Python数据分析系列(4):python读取外部数据

Python读取外部数据也比较简单,最常用的有pandas 和numpy模块


1、读取txt格式

import pandas as pd
 df1=pd.read_table('C:/Users/Administrator/Desktop/spss/数据/SPSS练习数据/data02-02a.txt')
  06 0 10 1.46 38
0  15 0 10 1.48 39
1  04 0 11 1.52 42
2  03 0 11 1.55 44
3  11 1 11 1.55 55
4  18 1 11 1.56 48



2、读取csv格式

df2=pd.read_csv('C:/Users/Administrator/Desktop/spss/数据/SPSS练习数据.csv')
df2
 2008/1/7  11.97  12.14   11.7   11.9  11.9.1
0    2008/1/8  11.90  12.75  11.80  12.21   12.21
1    2008/1/9  12.10  13.03  12.05  12.94   12.94
2   2008/1/10  13.04  13.32  12.71  13.10   13.10
3   2008/1/11  13.15  14.15  13.15  13.93   13.93
4   2008/1/14  13.96  14.45  13.60  14.03   14.03
5   2008/1/15  14.00  14.18  13.70  13.97   13.97
6   2008/1/16  13.80  13.85  13.11  13.32   13.32
7   2008/1/18  13.27  13.73  12.20  12.80   12.80
8   2008/1/21  12.75  13.34  12.35  13.22   13.22
9   2008/1/22  13.08  13.20  11.90  11.90   11.90
10  2008/1/23  11.00  11.40  10.71  10.71   10.71
11  2008/1/24  11.30  11.47  11.00  11.17   11.17
12   2008/1/7  11.97  12.14  11.70  11.90   11.90
13   2008/1/8  11.90  12.75  11.80  12.21   12.21
14   2008/1/9  12.10  13.03  12.05  12.94   12.94
15  2008/1/10  13.04  13.32  12.71  13.10   13.10
16  2008/1/11  13.15  14.15  13.15  13.93   13.93
17  2008/1/14  13.96  14.45  13.60  14.03   14.03
18  2008/1/15  14.00  14.18  13.70  13.97   13.97
19  2008/1/16  13.80  13.85  13.11  13.32   13.32
20  2008/1/18  13.27  13.73  12.20  12.80   12.80
21  2008/1/21  12.75  13.34  12.35  13.22   13.22
22  2008/1/22  13.08  13.20  11.90  11.90   11.90
23  2008/1/23  11.00  11.40  10.71  10.71   10.71
24  2008/1/24  11.30  11.47  11.00  11.17   11.17
25   2008/1/7  11.97  12.14  11.70  11.90   11.90
26   2008/1/8  11.90  12.75  11.80  12.21   12.21
27   2008/1/9  12.10  13.03  12.05  12.94   12.94
28  2008/1/10  13.04  13.32  12.71  13.10   13.10
29  2008/1/11  13.15  14.15  13.15  13.93   13.93
..        ...    ...    ...    ...    ...     ...
47  2008/1/21  12.75  13.34  12.35  13.22   13.22
48  2008/1/22  13.08  13.20  11.90  11.90   11.90
49  2008/1/23  11.00  11.40  10.71  10.71   10.71
50  2008/1/24  11.30  11.47  11.00  11.17   11.17
51   2008/1/7  11.97  12.14  11.70  11.90   11.90
52   2008/1/8  11.90  12.75  11.80  12.21   12.21
53   2008/1/9  12.10  13.03  12.05  12.94   12.94
54  2008/1/10  13.04  13.32  12.71  13.10   13.10
55  2008/1/11  13.15  14.15  13.15  13.93   13.93
56  2008/1/14  13.96  14.45  13.60  14.03   14.03
57  2008/1/15  14.00  14.18  13.70  13.97   13.97
58  2008/1/16  13.80  13.85  13.11  13.32   13.32
59  2008/1/18  13.27  13.73  12.20  12.80   12.80
60  2008/1/21  12.75  13.34  12.35  13.22   13.22
61  2008/1/22  13.08  13.20  11.90  11.90   11.90
62  2008/1/23  11.00  11.40  10.71  10.71   10.71
63  2008/1/24  11.30  11.47  11.00  11.17   11.17
64   2008/1/7  11.97  12.14  11.70  11.90   11.90
65   2008/1/8  11.90  12.75  11.80  12.21   12.21
66   2008/1/9  12.10  13.03  12.05  12.94   12.94
67  2008/1/10  13.04  13.32  12.71  13.10   13.10
68  2008/1/11  13.15  14.15  13.15  13.93   13.93
69  2008/1/14  13.96  14.45  13.60  14.03   14.03
70  2008/1/15  14.00  14.18  13.70  13.97   13.97
71  2008/1/16  13.80  13.85  13.11  13.32   13.32
72  2008/1/18  13.27  13.73  12.20  12.80   12.80
73  2008/1/21  12.75  13.34  12.35  13.22   13.22
74  2008/1/22  13.08  13.20  11.90  11.90   11.90
75  2008/1/23  11.00  11.40  10.71  10.71   10.71
76  2008/1/24  11.30  11.47  11.00  11.17   11.17
[77 rows x 6 columns]


3、读取excel格式

df3=pd.read_excel('C:/Users/Administrator/Desktop/spss/数据/SPSS练习数据.xlsx')
df3 2008-01-07 00:00:00  11.97  12.14   11.7   11.9  11.9.1
0           2008-01-08  11.90  12.75  11.80  12.21   12.21
1           2008-01-09  12.10  13.03  12.05  12.94   12.94
2           2008-01-10  13.04  13.32  12.71  13.10   13.10
3           2008-01-11  13.15  14.15  13.15  13.93   13.93
4           2008-01-14  13.96  14.45  13.60  14.03   14.03
5           2008-01-15  14.00  14.18  13.70  13.97   13.97
6           2008-01-16  13.80  13.85  13.11  13.32   13.32
7           2008-01-18  13.27  13.73  12.20  12.80   12.80
8           2008-01-21  12.75  13.34  12.35  13.22   13.22
9           2008-01-22  13.08  13.20  11.90  11.90   11.90
10          2008-01-23  11.00  11.40  10.71  10.71   10.71
11          2008-01-24  11.30  11.47  11.00  11.17   11.17
12          2008-01-07  11.97  12.14  11.70  11.90   11.90
13          2008-01-08  11.90  12.75  11.80  12.21   12.21
14          2008-01-09  12.10  13.03  12.05  12.94   12.94
15          2008-01-10  13.04  13.32  12.71  13.10   13.10
16          2008-01-11  13.15  14.15  13.15  13.93   13.93
17          2008-01-14  13.96  14.45  13.60  14.03   14.03
18          2008-01-15  14.00  14.18  13.70  13.97   13.97
19          2008-01-16  13.80  13.85  13.11  13.32   13.32
20          2008-01-18  13.27  13.73  12.20  12.80   12.80
21          2008-01-21  12.75  13.34  12.35  13.22   13.22
22          2008-01-22  13.08  13.20  11.90  11.90   11.90
23          2008-01-23  11.00  11.40  10.71  10.71   10.71
24          2008-01-24  11.30  11.47  11.00  11.17   11.17
25          2008-01-07  11.97  12.14  11.70  11.90   11.90
26          2008-01-08  11.90  12.75  11.80  12.21   12.21
27          2008-01-09  12.10  13.03  12.05  12.94   12.94
28          2008-01-10  13.04  13.32  12.71  13.10   13.10
29          2008-01-11  13.15  14.15  13.15  13.93   13.93
..                 ...    ...    ...    ...    ...     ...
47          2008-01-21  12.75  13.34  12.35  13.22   13.22
48          2008-01-22  13.08  13.20  11.90  11.90   11.90
49          2008-01-23  11.00  11.40  10.71  10.71   10.71
50          2008-01-24  11.30  11.47  11.00  11.17   11.17
51          2008-01-07  11.97  12.14  11.70  11.90   11.90
52          2008-01-08  11.90  12.75  11.80  12.21   12.21
53          2008-01-09  12.10  13.03  12.05  12.94   12.94
54          2008-01-10  13.04  13.32  12.71  13.10   13.10
55          2008-01-11  13.15  14.15  13.15  13.93   13.93
56          2008-01-14  13.96  14.45  13.60  14.03   14.03
57          2008-01-15  14.00  14.18  13.70  13.97   13.97
58          2008-01-16  13.80  13.85  13.11  13.32   13.32
59          2008-01-18  13.27  13.73  12.20  12.80   12.80
60          2008-01-21  12.75  13.34  12.35  13.22   13.22
61          2008-01-22  13.08  13.20  11.90  11.90   11.90
62          2008-01-23  11.00  11.40  10.71  10.71   10.71
63          2008-01-24  11.30  11.47  11.00  11.17   11.17
64          2008-01-07  11.97  12.14  11.70  11.90   11.90
65          2008-01-08  11.90  12.75  11.80  12.21   12.21
66          2008-01-09  12.10  13.03  12.05  12.94   12.94
67          2008-01-10  13.04  13.32  12.71  13.10   13.10
68          2008-01-11  13.15  14.15  13.15  13.93   13.93
69          2008-01-14  13.96  14.45  13.60  14.03   14.03
70          2008-01-15  14.00  14.18  13.70  13.97   13.97
71          2008-01-16  13.80  13.85  13.11  13.32   13.32
72          2008-01-18  13.27  13.73  12.20  12.80   12.80
73          2008-01-21  12.75  13.34  12.35  13.22   13.22
74          2008-01-22  13.08  13.20  11.90  11.90   11.90
75          2008-01-23  11.00  11.40  10.71  10.71   10.71
76          2008-01-24  11.30  11.47  11.00  11.17   11.17
[77 rows x 6 columns]


4、读取spss格式

import savReaderWriter
df4=savReaderWriter.SavReader('C:/Users/Administrator/Desktop/spss/数据/SPSS练习数据/data02-01.sav')
目录
相关文章
|
5月前
|
数据采集 Web App开发 数据可视化
Python零基础爬取东方财富网股票行情数据指南
东方财富网数据稳定、反爬宽松,适合爬虫入门。本文详解使用Python抓取股票行情数据,涵盖请求发送、HTML解析、动态加载处理、代理IP切换及数据可视化,助你快速掌握金融数据爬取技能。
3252 1
|
5月前
|
存储 JavaScript Java
(Python基础)新时代语言!一起学习Python吧!(四):dict字典和set类型;切片类型、列表生成式;map和reduce迭代器;filter过滤函数、sorted排序函数;lambda函数
dict字典 Python内置了字典:dict的支持,dict全称dictionary,在其他语言中也称为map,使用键-值(key-value)存储,具有极快的查找速度。 我们可以通过声明JS对象一样的方式声明dict
361 1
|
5月前
|
算法 Java Docker
(Python基础)新时代语言!一起学习Python吧!(三):IF条件判断和match匹配;Python中的循环:for...in、while循环;循环操作关键字;Python函数使用方法
IF 条件判断 使用if语句,对条件进行判断 true则执行代码块缩进语句 false则不执行代码块缩进语句,如果有else 或 elif 则进入相应的规则中执行
829 1
|
5月前
|
Java 数据挖掘 数据处理
(Pandas)Python做数据处理必选框架之一!(一):介绍Pandas中的两个数据结构;刨析Series:如何访问数据;数据去重、取众数、总和、标准差、方差、平均值等;判断缺失值、获取索引...
Pandas 是一个开源的数据分析和数据处理库,它是基于 Python 编程语言的。 Pandas 提供了易于使用的数据结构和数据分析工具,特别适用于处理结构化数据,如表格型数据(类似于Excel表格)。 Pandas 是数据科学和分析领域中常用的工具之一,它使得用户能够轻松地从各种数据源中导入数据,并对数据进行高效的操作和分析。 Pandas 主要引入了两种新的数据结构:Series 和 DataFrame。
614 0
|
5月前
|
JSON 算法 API
Python采集淘宝商品评论API接口及JSON数据返回全程指南
Python采集淘宝商品评论API接口及JSON数据返回全程指南
|
5月前
|
JSON API 数据安全/隐私保护
Python采集淘宝拍立淘按图搜索API接口及JSON数据返回全流程指南
通过以上流程,可实现淘宝拍立淘按图搜索的完整调用链路,并获取结构化的JSON商品数据,支撑电商比价、智能推荐等业务场景。
|
5月前
|
存储 Java 索引
(Python基础)新时代语言!一起学习Python吧!(二):字符编码由来;Python字符串、字符串格式化;list集合和tuple元组区别
字符编码 我们要清楚,计算机最开始的表达都是由二进制而来 我们要想通过二进制来表示我们熟知的字符看看以下的变化 例如: 1 的二进制编码为 0000 0001 我们通过A这个字符,让其在计算机内部存储(现如今,A 字符在地址通常表示为65) 现在拿A举例: 在计算机内部 A字符,它本身表示为 65这个数,在计算机底层会转为二进制码 也意味着A字符在底层表示为 1000001 通过这样的字符表示进行转换,逐步发展为拥有127个字符的编码存储到计算机中,这个编码表也被称为ASCII编码。 但随时代变迁,ASCII编码逐渐暴露短板,全球有上百种语言,光是ASCII编码并不能够满足需求
255 4
|
6月前
|
数据采集 关系型数据库 MySQL
python爬取数据存入数据库
Python爬虫结合Scrapy与SQLAlchemy,实现高效数据采集并存入MySQL/PostgreSQL/SQLite。通过ORM映射、连接池优化与批量提交,支持百万级数据高速写入,具备良好的可扩展性与稳定性。
|
6月前
|
JSON API 数据安全/隐私保护
Python采集淘宝评论API接口及JSON数据返回全流程指南
Python采集淘宝评论API接口及JSON数据返回全流程指南

热门文章

最新文章

推荐镜像

更多