python学习笔记(四)——数据字典

简介:                    数据字典   字典(dictionary)是除列表之外python之中最灵活的内置数据结构类型。列表是有序的对象结合,字典是无序的对象集合。两者之间的区别在于:字典当中的元素是通过键来存取的,而不是通过偏移存取,这个键可以是数字、字符串甚至元组。

                   数据字典

  字典(dictionary)是除列表之外python之中最灵活的内置数据结构类型。列表是有序的对象结合,字典是无序的对象集合。两者之间的区别在于:字典当中的元素是通过键来存取的,而不是通过偏移存取,这个键可以是数字、字符串甚至元组。映射可以使用任何不可变对象标识元素,最常用的类型是字符串和元组,python唯一内建的映射类型是字典。

   创建和使用字典:

>>> phonebook={'Jason':'23453','James':'34231','Jzhou':'90798'}
>>> phonebook['Jason']
'23453'

   字典由多个键和其对应的值构成的对组成(键值对称为项),上例中,姓名是键,分机号是值。每个键和它的值之间用冒号隔开,项之间用逗号隔开,整个字典用一对大括号括起来。

(注意:字典中的键是唯一的,其它映射也是如此,而值不唯一)

  dict函数

  dict函数可以通过其他映射(比如其他字典)或者(键、值)这样的序列对建立字典

>>> items=[('name','Gumby'),('age',42)]
>>> d=dict (items )
>>> d
{'age': 42, 'name': 'Gumby'}
>>> d['name']
'Gumby'

  dict函数也可以通过关键字参数来创建字典

>>> d=dict(name='Jason',age=42)
>>> d
{'age': 42, 'name': 'Jason'}

  还能以映射作为dict函数的参数,以建立其项与映射相同的字典,如果不带任何参数,则dict函数返回一个新的空的字典,就行list,tuple,str等函数一样。如果另一个映射也是字典,可以使用字典方法copy(之后介绍)。

  基本的字典操作

    字典的基本行为在很多方面和序列类似:

  len(d)  返回d中项(键-值对)的数量

  d[k]返回关联到键k上的值

  d[k]=v 将值v关联到键k上

  del  d[k]删除键为k的项

  k  in  d  检查中是否有含有键为k的项

  字典也有一些自己的特性,如下:

   键类型:字典的键不一定为整型数据,也可能是其他不可变类型,如浮点型、字符串、元组等

   自动添加:即使那个键起初不存在于字典中,也可以分配给它一个值,即字典会建立一个新项;而列表在不使用append方法的前提下,不能将值关联到列表之外的索引上

   成员资格:表达式k  in  d(d为字典)查找的是键而不是值;表达式 v  in l(l为列表)则用来查找值,而不是索引(另外,在字典中检查键的成员资格比在列表中检查值的成员更高效,尤其当数据结构的规模很大时。)

     我们来看一个简单的例子,来看看字典相对于列表的好处:

>>> x=[]   #创建一个空列表
>>> x[42]='floor'    #出现错误

Traceback (most recent call last):
  File "<pyshell#77>", line 1, in <module>
    x[42]='floor'
IndexError: list assignment index out of range
>>> x={}   #创建一个字典
>>> x[42]='floor'   #自动将这项添加到字典中
>>> x    #字典的值
{42: 'floor'}
>>> 

    下面是一个较复杂的字典的示例:

# 使用人名作为键的字典,每个人用另一个字典来表示,phone和addr是子字典的键
people ={
     'Jason':{
        'phone':'2341',
        'addr':'Foo drive 23'
         },
     'James':{
        'phone':'4564',
        'addr':'Bar street 42'
         },
     'Jzhou':{
        'phone':'4564',
        'addr':'Baz avenue 90'
         }
    }

# 针对电话号码和地址使用的描述性标签会在打印输出的时候用到
labels={
    'phone':'phone number',
    'addr':'address'
    }

name=raw_input('Name:')

# 查找电话号码还是地址?使用正确的键
request=raw_input ("Phone number(p) or address(a)?")
# 使用正确的键:
if request=='p':key='phone'
if request=='a':key='addr'

# 如果名字是字典中的有效键才打印信息
if name in people:
    print "%s's %s is %s." % (name,labels[key],people[name][key])

raw_input("press any key to exit!")

 运行结果如下:

  

   字典的格式化字符串

  上一篇介绍过字符串是如何格式化的,现在我们来看看字典是如何格式化的。在每个转换说明符的后面,加上键再跟其他说明元素。看例子:

>>> phonebook={'James':'3422','Jason':'3441','Jzhou':'2321'}
>>> phonebook
{'James': '3422', 'Jason': '3441', 'Jzhou': '2321'}
>>> "Jzhou's phone number is %(Jzhou)s." % phonebook
"Jzhou's phone number is 2321."

  除了增加字符串键之外,转换说明符还是像以前一样,当以这种方式使用字典的时候,只要所有给出的键都能在字典中找到,就可以获得任意数量的转换说明符,所以这类字符串格式化在模板系统中非常有用,看下面这个例子:

>>> template='''<html>
<head><title>%(title)s</title></head>
<body>
<h1>%(title)s<h1>
<p>%(text)s</p>
</body>'''
>>> data={'title':'my home page','text':'Welcome to my home age!'}

>>> print template % data
<html>
<head><title>my home page</title></head>
<body>
<h1>my home page<h1>
<p>Welcome to my home age!</p>
</body>

   字典方法

   clear——清除字典中的所有项。类似于list.sort,无返回值

>>> d={}
>>> d['name']='Jason'
>>> d['age']=42
>>> d
{'age': 42, 'name': 'Jason'}
>>> return_value=d.clear()
>>> d
{}
>>> print return_value
None

     通过下面的例子看一下clear的简单作用:

#未使用clear方法
>>> x={}
>>> y=x
>>> x['key']='value'
>>> y
{'key': 'value'}
>>> x={}
>>> y    #x使用x={}置空后y的值还存在
{'key': 'value'}
#使用clear方法
>>> x={}
>>> y=x
>>> x['key']='value'
>>> y
{'key': 'value'}
>>> x.clear()  #x使用clear方法后,y的值也被清空了
>>> y
{}

  copy——返回一个具有相同键值对的新字典(实现的是浅复制,因为值本身相同,而不是副本)

>>> x={'username':'admin','machines':['foo','bar','baz']}
>>> y=x.copy()
>>> y['username']='mlh'
>>> y['machines'].remove ('bar')
>>> y
{'username': 'mlh', 'machines': ['foo', 'baz']}
>>> x
{'username': 'admin', 'machines': ['foo', 'baz']}

  上例看出,当在副本中替换值的时候,原字典不受影响,想上述y中username赋了新值,而x没变;但是如果修改了某个值而不是替换,则原字典也会改变,像上述y的machines中移除了bar,则x中也移除了这个值。

  避免这个问题的方法是使用深复制(deep copy),复制它包含所有的值。使用copy模块的deepcopy函数来完成

>>> from copy import deepcopy
>>> d={}
>>> d['names']=['James','Jason']
>>> c=d.copy()
>>> dc=deepcopy(d)
>>> d['names'].append('Jzhou')
>>> c
{'names': ['James', 'Jason', 'Jzhou']}
>>> dc
{'names': ['James', 'Jason']}

   fromkeys——使用给定的键建立新的字典,每个键默认对应的值为None

>>> {}.fromkeys(['name','age'])  #构造了有一个空字典来建立另外一个字典
{'age': None, 'name': None}

  也可以直接在所有字典的类型dict上调用方法

>>> dict.fromkeys(['name','age'])
{'age': None, 'name': None}

  若不想使用None作默认值,也可以提供自己的默认值

>>> dict.fromkeys(['name','age'],'Unknown')
{'age': 'Unknown', 'name': 'Unknown'}

    get——得到字典中的某个项

#一般当是视图得到字典中不存在的项时将出错
>>> d={}
>>> print d['name']

Traceback (most recent call last):
  File "<pyshell#42>", line 1, in <module>
    print d['name']
KeyError: 'name'
#使用get方法时不会出错
>>> print d.get('name')
None
#也可以自定义默认值来替换'None'
>>> d.get('name','N/A')
'N/A'
#如果键值存在,get用起来就像普通的字典查询一样
>>> d['name']='Eric'
>>> d.get('name')
'Eric'

   看下面这个经过改造的例子:

people ={
     'Jason':{
        'phone':'2341',
        'addr':'Foo drive 23'
         },
     'James':{
        'phone':'4564',
        'addr':'Bar street 42'
         }
    }
labels={
    'phone':'phone number',
    'addr':'address'
    }
name = raw_input('Name:')
#查找电话号码还是地址?
request=raw_input('phone number(p) or address(a)?')
#使用正确的键
key=request
if request =='p':key='phone'
if request =='a':key='addr'

person=people.get(name,{})
label=labels.get(key,key)
#使用get()提供的默认值
result=person.get('key','not available')

#如果请求不是p或者a,则使用get()提供的默认值
if request != 'p' and request != 'a':
  print "%s's %s is %s." % (name,label,result)
#如果请求正确,则按正常处理
elif request == 'p' or request == 'a':
  print "%s's %s is %s." % (name,labels[key],people[name][key])

raw_input("press any key to exit!")

  运行结果如下,即正常输入和异常输入时的处理结果:

   

   has_key——检查字典中是否含有给出的键。表达式dict.has_key(k)相当于 表达式key  in  dict。注意在python3.0中不包含这个函数了。

>>> d={}
>>> d.has_key('name')
False
>>> d['name']='Jzhou'
>>> d.has_key('name')
True

   items和iteritems——items方法将所有字典项以列表方式返回,这些列表项中的每一项都来自于(键、值),但是在项返回时并没有特殊顺序。

>>> d={'title':'python','url':'http://www.python.org'}
>>> d.items ()
[('url', 'http://www.python.org'), ('title', 'python')]

iteritems作用大致一样,但是会返回一个迭代器对象而不是列表

>>> it=d.iteritems ()
>>> it
<dictionary-itemiterator object at 0x01D9EAB0>
>>> list(it)  #将iterator转换为列表
[('url', 'http://www.python.org'), ('title', 'python')]

         keys和iterkeys——keys方法将字典中的键以列表的形式返回,而iterkeys是返回针对键的迭代器

>>> d.keys()
['url', 'title']
>>> d.iterkeys()
<dictionary-keyiterator object at 0x02BD1DE0>
>>> list(d.iterkeys ())
['url', 'title']

      values和itervalues——values方法以列表的形式返回字典中的值,itervalues返回值的迭代器。与返回键的列表不同的是,返回值的列表中可以包含重复的元素

>>> d={}
>>> d[1]=1
>>> d[2]=2
>>> d[3]=3
>>> d[4]=1
>>> d.values()
[1, 2, 3, 1]
>>> d.itervalues ()
<dictionary-valueiterator object at 0x02BD1ED0>
>>> list(d.itervalues ())
[1, 2, 3, 1]

     pop——获得对应于给定键的值,然后将这个键值对从字典中移除

>>> d={'x':1,'y':2}
>>> d.pop('x')
1
>>> d
{'y': 2}

    popitem——类似list.pop,后者会弹出列表的最后一个元素,但不同的是,popitem弹出的是随机的项,因为字典是无序的。若想一个接一个的移除并处理项,这个方法非常有效,因为不用先获取键的列表

>>> d={'title':'python','url':'http://www.python.org','spam':0}
>>> d
{'url': 'http://www.python.org', 'spam': 0, 'title': 'python'}
>>> d.popitem()
('url', 'http://www.python.org')
>>> d
{'spam': 0, 'title': 'python'}

尽管popitem和列表的pop方法很类似,但字典中并没有与append等价的方法,因为字典是无序的,无“追加至最后”可言。

    setdefault——获得与给定键相关联的值,类似get()方法,另外,它还能在字典中不含有给定键的情况下设定相应的键值

>>> d={}
>>> d.setdefault('name','N/A')
'N/A'
>>> d
{'name': 'N/A'}
>>> d['name']='Jzhou'
>>> d.setdefault('name','N/A')
'Jzhou'
>>> d
{'name': 'Jzhou'}

可以看出,当键不存在的时候,setdefault返回默认值并且相应的更新字典。如果键存在,那么就返回与其对应的值,但不改变字典。默认值可选,如果不写,默认为None

>>> d={}
>>> print d.setdefault('name')
None
>>> d
{'name': None}

    update——利用一个字典更新另外一个字典

>>> d={
    'title':'Python web site',
    'url':'http://www.python.org',
    'changed':'April 4 20:18 2013'
    }
>>> x={'title':'Python Language Website'}
>>> d.update(x) #提供的字典中的项会被添加到旧的字典中,若有相同的键则会进行覆盖
>>> d
{'url': 'http://www.python.org', 'changed': 'April 4 20:18 2013', 'title': 'Python Language Website'}

    以上是字典常用的主要方法,调用方式和调用列表及字符串的方式相同。

  

 

作者: zhoujie
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,不然我担心博客园找你算账
如果您觉得本文对你有帮助,请竖起您的大拇指右下角点推荐,也可以关注我
目录
相关文章
|
1月前
|
数据采集 数据可视化 数据挖掘
利用Python自动化处理Excel数据:从基础到进阶####
本文旨在为读者提供一个全面的指南,通过Python编程语言实现Excel数据的自动化处理。无论你是初学者还是有经验的开发者,本文都将帮助你掌握Pandas和openpyxl这两个强大的库,从而提升数据处理的效率和准确性。我们将从环境设置开始,逐步深入到数据读取、清洗、分析和可视化等各个环节,最终实现一个实际的自动化项目案例。 ####
161 10
|
5天前
|
数据采集 Web App开发 数据可视化
Python用代理IP获取抖音电商达人主播数据
在当今数字化时代,电商直播成为重要的销售模式,抖音电商汇聚了众多达人主播。了解这些主播的数据对于品牌和商家至关重要。然而,直接从平台获取数据并非易事。本文介绍如何使用Python和代理IP高效抓取抖音电商达人主播的关键数据,包括主播昵称、ID、直播间链接、观看人数、点赞数和商品列表等。通过环境准备、代码实战及数据处理与可视化,最终实现定时任务自动化抓取,为企业决策提供有力支持。
|
18天前
|
JSON 监控 安全
深入理解 Python 的 eval() 函数与空全局字典 {}
`eval()` 函数在 Python 中能将字符串解析为代码并执行,但伴随安全风险,尤其在处理不受信任的输入时。传递空全局字典 {} 可限制其访问内置对象,但仍存隐患。建议通过限制函数和变量、使用沙箱环境、避免复杂表达式、验证输入等提高安全性。更推荐使用 `ast.literal_eval()`、自定义解析器或 JSON 解析等替代方案,以确保代码安全性和可靠性。
28 2
|
25天前
|
数据采集 Web App开发 监控
Python爬虫:爱奇艺榜单数据的实时监控
Python爬虫:爱奇艺榜单数据的实时监控
|
20天前
|
数据采集 存储 XML
python实战——使用代理IP批量获取手机类电商数据
本文介绍了如何使用代理IP批量获取华为荣耀Magic7 Pro手机在电商网站的商品数据,包括名称、价格、销量和用户评价等。通过Python实现自动化采集,并存储到本地文件中。使用青果网络的代理IP服务,可以提高数据采集的安全性和效率,确保数据的多样性和准确性。文中详细描述了准备工作、API鉴权、代理授权及获取接口的过程,并提供了代码示例,帮助读者快速上手。手机数据来源为京东(item.jd.com),代理IP资源来自青果网络(qg.net)。
|
1月前
|
数据采集 分布式计算 大数据
构建高效的数据管道:使用Python进行ETL任务
在数据驱动的世界中,高效地处理和移动数据是至关重要的。本文将引导你通过一个实际的Python ETL(提取、转换、加载)项目,从概念到实现。我们将探索如何设计一个灵活且可扩展的数据管道,确保数据的准确性和完整性。无论你是数据工程师、分析师还是任何对数据处理感兴趣的人,这篇文章都将成为你工具箱中的宝贵资源。
|
2月前
|
XML JSON API
如何使用Python将字典转换为XML
本文介绍了如何使用Python中的`xml.etree.ElementTree`库将字典数据结构转换为XML格式。通过定义递归函数处理字典到XML元素的转换,生成符合标准的XML文档,适用于与旧系统交互或需支持复杂文档结构的场景。示例代码展示了将一个简单字典转换为XML的具体实现过程。
26 1
|
2月前
|
传感器 物联网 开发者
使用Python读取串行设备的温度数据
本文介绍了如何使用Python通过串行接口(如UART、RS-232或RS-485)读取温度传感器的数据。详细步骤包括硬件连接、安装`pyserial`库、配置串行端口、发送请求及解析响应等。适合嵌入式系统和物联网应用开发者参考。
75 3
|
2月前
|
图形学 Python
SciPy 空间数据2
凸包(Convex Hull)是计算几何中的概念,指包含给定点集的所有凸集的交集。可以通过 `ConvexHull()` 方法创建凸包。示例代码展示了如何使用 `scipy` 库和 `matplotlib` 绘制给定点集的凸包。
43 1
|
2月前
|
数据采集 JavaScript 程序员
探索CSDN博客数据:使用Python爬虫技术
本文介绍了如何利用Python的requests和pyquery库爬取CSDN博客数据,包括环境准备、代码解析及注意事项,适合初学者学习。
117 0