python数据结构
学一门语言,最基础和重要的就是数据结构了,而在python中最基本的数据结构是序列,也可以理解为数组,但貌似比数组强大。
>>> jason=['jason',42] >>> james=['james',45] >>> database=[jason,james] >>> database [['jason', 42], ['james', 45]] >>>
索引:
>>> greeting='hello' >>> greeting[0] 'h' >>> greeting[-1] ==>反着的时候从-1而不是0开始开始 'o' >>> digital=raw_input ("year:")[3] year:2013 >>> digital '3'
索引示例:
>>> months=['January','February','March','April',\ 'May','June','July','August','September','October'\ 'November','December'] #根据指定的年月日以数字形式打印出日期 >>> endings=['st','nd','rd']+17*['th']+['st','nd','rd']+7*['th']+['st'] #以1-31的数字作为结尾的列表 >>> year=raw_input ("Year:") Year:2013 >>> month=raw_input('Month(1-12):') Month(1-12):3 >>> day=raw_input('Day(1-31):') Day(1-31):30 >>> month_num=int(month) >>> day_num=int(day) >>> month_name=months[month_num-1] ==>注意这里索引要减1 >>> ordinal=day+endings[day_num-1] >>> print month_name +' '+ordinal + ', '+ year March 30th, 2013 >>>
分片:
使用索引能访问单个元素,使用分片能访问一定范围的元素,分片通过冒号相隔的两个索引来实现。
>>> tag='<a href="http://www.python.org">Python web site</a>' >>> tag[9:30] 'http://www.python.org' >>> tag[32:-4] 'Python web site'>>>
>>> numbers=[1,2,3,4,5,6,7,8,9,10] >>> numbers[3:6] [4, 5, 6] >>> numbers[-3:-1] [8, 9] >>> numbers[-3:0] #分片中的最左边的索引比它右边索引的晚出现在序列中,结果就是一个空序列 [] >>> numbers[-3:] #默认到最后 [8, 9, 10] >>> numbers[:3] #默认从第一个开始 [1, 2, 3] >>> numbers[:] #默认全部 [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
很显然,分片操作的实现需要提供两个索引作为边界,第一个索引的元素包含在分片内,而第二个不包含在分片内。
分片步长:默认步长没有写,是1,分片格式:上边界:下边界:步长
>>> numbers[0:10:1] #默认步长是1 [1, 2, 3, 4, 5, 6, 7, 8, 9, 10] >>> numbers[0:10:2] #步长设为2 [1, 3, 5, 7, 9] >>> numbers[3:6:3] #步长设为3 [4] >>> numbers[::4] [1, 5, 9] >>> numbers[8:3:-1] #步长不能为0,因为不会向下执行,可以为负数,向前执行 [9, 8, 7, 6, 5] >>> numbers[10:0:-2] #当步长为负数时,开始索引必须大于结束索引 [10, 8, 6, 4, 2] >>> numbers[0:10:-2] [] >>> numbers[::-2] [10, 8, 6, 4, 2] >>> numbers [5::-2] [6, 4, 2] >>> numbers[:5:-2] [10, 8] >>>
序列相加:
>>> [1,2,3]+[4,5,6] [1, 2, 3, 4, 5, 6] >>> [1,2,3]+'world' #列表和字符串都是序列,但是不能连在一起,两种同类型的序列才能进行连接操作 Traceback (most recent call last): File "<pyshell#141>", line 1, in <module> [1,2,3]+'world' TypeError: can only concatenate list (not "str") to list >>>
序列乘法:
>>> 'python'*5 'pythonpythonpythonpythonpython' >>> [25]*10 [25, 25, 25, 25, 25, 25, 25, 25, 25, 25]
空列表可以简单的通过[ ]表示,但若想要创建一个占用十个元素空间,却不包括任何有用的有用的内容列表。这时需要使用None,None是Python的内建值,初始化一个长度为10的列表如下:
>>> sequence=[None]*10
>>> sequence
[None, None, None, None, None, None, None, None, None, None]
序列乘法示例:(存在脚本中运行)
sentence=raw_input ("Sentence:") screen_width=60 text_width=len(sentence) box_width=text_width+6 left_margin=(screen_width-box_width)//2 print print ' ' * left_margin + '+' + '-' * (box_width-2) + '+' print ' ' * left_margin + '| ' + ' ' * text_width +' |' print ' ' * left_margin + '| ' + sentence +' |' print ' ' * left_margin + '| ' + ' ' * text_width +' |' print ' ' * left_margin + '+' + '-' * (box_width-2) + '+' print raw_input()
结果如下:
in运算符:检查一个值是否在序列中
>>> permission='rwx' #有木有觉得这个像判断Linux中某个文件的执行权限,确实可以这么判断 >>> 'w' in permission True >>> 'xx' in permission False >>> users=['jason','james','jzhou'] >>> raw_input ("enter your name:") in users enter your name:jzhou True
序列成员资格示例:
database=[['jason','42'],['james','45'],['jzhou','22']] username=raw_input("Username:") age=raw_input("Age:") if [username,age] in database: print "OK,right" raw_input()
内建函数len、min、max
>>> numbers [1, 2, 3, 4, 5, 6, 7, 8, 9, 10] >>> len(numbers) 10 >>> max(numbers) 10 >>> min(numbers) 1 >>>
列表:
列表不同于元组和字符串,列表是可变的,而且列表有许多专门的方法。字符串不能像列表一样被修改,但是列表中的list函数可以实现修改。列表的常用用法:
>>> list('hello') ['h', 'e', 'l', 'l', 'o'] >>> x=[1,1,1] >>> x[1]=2 #可以改变列表为元素赋值 >>> x[2]=3 >>> x [1, 2, 3] >>> names=['james','jason','jzhou','liwear'] #可以删除列表中的元素 >>> del names[3] >>> names ['james', 'jason', 'jzhou'] >>> name=list('jzhou') >>> name ['j', 'z', 'h', 'o', 'u'] >>> name[2:]=list('1314') #可以分片赋值 >>> name ['j', 'z', '1', '3', '1', '4']
>>> numbers=[1,5] #分片赋值可以在不需要替换任何元素的情况下插入新元素 >>> numbers[1:1]=[2,3,4] >>> numbers [1, 2, 3, 4, 5] >>> numbers[1:4]=[] #也可以变相的删除元素 >>> numbers [1, 5]
列表的方法主要有append, count,extend,index,insert,pop,remove,reverse,sort,简单用法如下:
>>> list=[1,2,3]
>>> list .append(4) # append用于在列表末尾追加新对象
>>> list
[1, 2, 3, 4]
>>> ['to','be','or','to'].count('to') #count用于统计某个元素在列表中出现的次数 2 >>> x=[[1,2],1,1,[2,1,[1,2]]] >>> x.count(1) 2 >>> x.count([1,2]) 1 >>> a=[1,2,3] >>> b=[4,5,6] >>> a.extend(b) #extend在列表的末尾一次性追加另一个序列的多个值,扩展原有列表 >>> a [1, 2, 3, 4, 5, 6] #注意这个操作与连接操作不同,extend修改了被扩展的序列即a,而连接只是临时显示并没有变 >>> a=[1,2,3] >>> b=[4,5,6] >>> a[len(a):]=b #也可以通过分片赋值来扩展,但是可读性不强 >>> a [1, 2, 3, 4, 5, 6] >>> sentence=['we','are','good','student'] >>> sentence.index ('are') #index用于从列表中找出某个值第一个匹配项的索引位置 1 >>> numbers=[1,2,3,4,5,6,7] >>> numbers.insert(3,'four') #insert用于将对象插入列表中,和数据结构中的链表操作非常相似 >>> numbers [1, 2, 3, 'four', 4, 5, 6, 7] >>> numbers=[1,2,3,4,5,6,7] >>> numbers[3:3]=['four'] #也可以使用分片赋值的方法实现,但是可读性不强 >>> numbers [1, 2, 3, 'four', 4, 5, 6, 7] >>> x=[1,2,3] >>> x.pop() #出栈操作,和数据结构中的栈操作一样,即移除列表中的最后一个,并且返回该元素的值 3 >>> x [1, 2] >>> x.pop() 2 >>> x=[1,2,3] >>> x.append(x.pop()) #这个操作和数据结构中的push、pop是一样的,追加刚刚出栈的值,很有趣,最后得到的还是是原来的值 >>> x [1, 2, 3] >>> x=['to','be','or','not','to','be'] >>> x.remove ('be') #remove用于移除列表中某个值的第一个匹配项 >>> x #值得注意的是remove方法是没有返回值的原位置改变方法,注意和pop的区别 ['to', 'or', 'not', 'to', 'be'] >>> x=[1,2,3] >>> x.reverse () #将列表中的元素反向存放,注意这种方法改变了列表但没有返回值 >>> x [3, 2, 1] >>> x=[4,5,6,7,1,2,3] >>> x.sort() #sort用于在原位置对列表进行排序,也改变了序列的值,但是没有返回值 >>> x [1, 2, 3, 4, 5, 6, 7] >>>
注意以上方法除了count和index,都是会使列表的内容的产生变化。
介于sort方法修改列表但是没有返回值的情况有待细说一下:
>>> x=[4,6,2,1,7,9] >>> y=x.sort() #因为x.sort()不反回值,所以y并没有赋到值 >>> print y None >>>
看下正确的做法吧,其实也就是将步骤拆开而已:(sort函数不反回值的特点决定了不能在它的后面继续后续操作,比如x.sort().reverse(),但是serted(x).reverse()是正确的)
>>> x=[4,6,2,1,7,9] >>> y=x[:] #先将x复制给y >>> y.sort() #将y排序 >>> x [4, 6, 2, 1, 7, 9] >>> y [1, 2, 4, 6, 7, 9] >>> x=y>>> x [1, 2, 4, 6, 7, 9] >>> y [1, 2, 4, 6, 7, 9]
另一种获取已排序的列表副本的方法是使用sorted函数:
>>> x=[4, 6, 2, 1, 7, 9] >>> y=sorted(x) >>> x [4, 6, 2, 1, 7, 9] >>> y [1, 2, 4, 6, 7, 9]
sorted函数可以用于任何序列,却总是返回一个列表:
>>> sorted("Python") #默认按ASCII码排序 ['P', 'h', 'n', 'o', 't', 'y']
如果想把一些元素按相反的顺序排出,可以先用sort或者sorted函数,在调用reverse函数。嵌套使用的功能很强大。
关于高级排序:元素能按照特定的方式进行排序,可以使用compare(x,y)自定义比较函数,compare(x,y)函数会在x<y时返回负值,x>y时返回正值,x=y时返回0。定义好该函数之后,就可以提供给sort方法作为参数了。
>>> cmp(42,23) 1 >>> cmp(99,100) -1 >>> cmp(1,1) 0 >>> numbers=[5,2,6,7] >>> numbers.sort(cmp) #这个机制之后会介绍 >>> numbers [2, 5, 6, 7]
元组——不可变序列
元组和列表一样,也是一种序列,唯一的不同是元组不能修改,字符串也是如此;创建元素很简单,用逗号分隔一些值,就自动创建了元组:
>>> 1,2,3 (1, 2, 3) >>> (1,2,3) (1, 2, 3) >>> (42,) # 逗号说明它是一个元组,不然加括号(如:(42))也没用 (42,) >>> 3*(40+2) #这个例子说明了逗号的重要性,42和(42)是完全一样的 126 >>> 3*(40+2,) (42, 42, 42) >>>
tuple函数:
tuple函数的功能与list函数基本一样:以一个序列作为参数把它转换为元组。如果参数是数组,那么该参数就会被原样返回:
>>> tuple([1,2,3]) (1, 2, 3) >>> tuple('abc') ('a', 'b', 'c') >>> tuple((1,2,3)) (1, 2, 3)
元组其实就是数组,除了创建和访问之外,没有太多操作,和其他类型的序列操作类似:
>>> x=1,2,3 >>> x[1] 2 >>> x[0:2] #元组的分片还是元组,就像列表的分片还是列表一样 (1, 2)
那么元组的存在意义是什么呢,首先元组可以在映射中当做键使用,而列表不行;其次,元组作为很多内建函数和方法的返回值存在。只要不涉及到修改元组,大部分情况下和列表基本功能相同。一般来说,列表可更能满足对序列的所有要求。
用到的函数总结:cmp(x,y)、len(seq)(返回序列长度)、list(seq)(把序列转换成列表)、max(args)、min(args)、reverse(seq)(对序列进行反向迭代)、sorted(seq)(返回已排序的包含seq所有元素的列表)、tuple(seq)(把序列转换成元组)