Python数据挖掘编程基础

简介: Python包含四种内置数据结构:列表(List)、元组(Tuple)、字典(Dictionary)和集合(Set),统称为容器。列表与元组均为序列结构,前者使用方括号表示且可修改,后者用圆括号表示且不可修改。列表支持多种方法和列表解析功能,以简化元素操作。例如,通过列表解析可以简洁地实现`d=[i+1 for i in c]`,输出结果为`[2,3,4]`。

2.数据结构
2.1Python中有4个内置的数据结构:List(列表)、Tuple(元组)、Dictionary(字典)和Set(集合),可以统称为容器(container),而这4个内置数据结构实际上是一些“东西”组合而成的结构,这些“东西”可以是数字、字符、列表,也可以是它们的组合。简而言之,容器里的数据结构可以是任意的,且容器内部的元素类型不需要相同。

<1>列表或元组
a.列表和元组都是序列结构,两者都相似,但又有一些不同的地方。
b.从外形上看,列表和元组的区别是,列表使用方括号进行标记,如m=[0,2,4],而元素使用圆括号进行标记,如n=(6,8,10),但访问列表和元组中元素的方式都是一样的,如m[0]等于0,n[2]等于10等。因为容器的数据结构可以是任意类型,所以如下关于列表p的定义也是成立的。
//p是一个列表,列表的第1个元素是字符串'efg',第2个元素使列表[5,6,7],第3个元素是整型10
p=['efg',[5,6,7],10]
c.从功能上看,列表与元组的区别是,列表可以被修改,而元组不可以。例如,如果列表m=[0,2,4],那么语句m[0]=1会将列表m修改为[1,2,4],而对于元组n=(6,8,10),语句n[0]=1将会报错。需要注意的是,如果已经有一列表m,需要将m复制为列表n,那么使用n=m是无效的,这时n仅仅是m的别名(或引用),修改n的同时也会修改m。正确的复制方法应该是n=m[:]。
d.与列表有关的函数是list,与元组有关的函数是tuple,但list函数和tuple函数的用法和功能几乎一样,都是将某个对象转换为列表或元组,例如,lis('cd')的结果是['c','d'],tuple([0,1,2])的结果是(0,1,2)。一些常见的与列表或元组相关的函数如表2-1所示。
{58CC70B4-E9DC-496C-B0A7-A053E866F95E}.png
此外,列表作为对象,自带了很多实用的方法(元组不允许被修改,因此方法很少),如表2-2所示。
{04FAF890-4736-435D-91E8-6928A6522122}.png
此外,列表还有"列表解析"这一功能。该功能能够简化列表内元素操作的代码。使用append()方法对列表元素进行操作,如代码清单2-3所示。
代码清单2-3 使用append()方法对列表元素进行操作
c=[1,2,3]
d=[]
for i in c:
d.append(i+1)
print(d)//输出结果为[2,3,4]

将代码清单2-3使用列表解析进行简化,如代码清单2-4所示。
c=[1,2,3]
d=[i+1 for i in c]
print(d) //输出结果也为[2,3,4]

目录
相关文章
|
4月前
|
数据采集 Web App开发 数据可视化
Python零基础爬取东方财富网股票行情数据指南
东方财富网数据稳定、反爬宽松,适合爬虫入门。本文详解使用Python抓取股票行情数据,涵盖请求发送、HTML解析、动态加载处理、代理IP切换及数据可视化,助你快速掌握金融数据爬取技能。
2647 1
|
4月前
|
Java 数据挖掘 数据处理
(Pandas)Python做数据处理必选框架之一!(一):介绍Pandas中的两个数据结构;刨析Series:如何访问数据;数据去重、取众数、总和、标准差、方差、平均值等;判断缺失值、获取索引...
Pandas 是一个开源的数据分析和数据处理库,它是基于 Python 编程语言的。 Pandas 提供了易于使用的数据结构和数据分析工具,特别适用于处理结构化数据,如表格型数据(类似于Excel表格)。 Pandas 是数据科学和分析领域中常用的工具之一,它使得用户能够轻松地从各种数据源中导入数据,并对数据进行高效的操作和分析。 Pandas 主要引入了两种新的数据结构:Series 和 DataFrame。
577 0
|
4月前
|
JSON 算法 API
Python采集淘宝商品评论API接口及JSON数据返回全程指南
Python采集淘宝商品评论API接口及JSON数据返回全程指南
|
4月前
|
JSON API 数据安全/隐私保护
Python采集淘宝拍立淘按图搜索API接口及JSON数据返回全流程指南
通过以上流程,可实现淘宝拍立淘按图搜索的完整调用链路,并获取结构化的JSON商品数据,支撑电商比价、智能推荐等业务场景。
|
5月前
|
数据采集 机器学习/深度学习 人工智能
Python:现代编程的首选语言
Python:现代编程的首选语言
525 102
|
5月前
|
数据采集 机器学习/深度学习 算法框架/工具
Python:现代编程的瑞士军刀
Python:现代编程的瑞士军刀
399 104
|
5月前
|
人工智能 自然语言处理 算法框架/工具
Python:现代编程的首选语言
Python:现代编程的首选语言
311 103
|
4月前
|
Python
Python编程:运算符详解
本文全面详解Python各类运算符,涵盖算术、比较、逻辑、赋值、位、身份、成员运算符及优先级规则,结合实例代码与运行结果,助你深入掌握Python运算符的使用方法与应用场景。
351 3
|
4月前
|
数据处理 Python
Python编程:类型转换与输入输出
本教程介绍Python中输入输出与类型转换的基础知识,涵盖input()和print()的使用,int()、float()等类型转换方法,并通过综合示例演示数据处理、错误处理及格式化输出,助你掌握核心编程技能。
583 3
|
4月前
|
并行计算 安全 计算机视觉
Python多进程编程:用multiprocessing突破GIL限制
Python中GIL限制多线程性能,尤其在CPU密集型任务中。`multiprocessing`模块通过创建独立进程,绕过GIL,实现真正的并行计算。它支持进程池、队列、管道、共享内存和同步机制,适用于科学计算、图像处理等场景。相比多线程,多进程更适合利用多核优势,虽有较高内存开销,但能显著提升性能。合理使用进程池与通信机制,可最大化效率。
387 3

热门文章

最新文章

推荐镜像

更多