带你读《Python3智能数据分析快速入门》之三:控制语句

简介: 本书作者从实践出发,总结了智能数据分析常用的方法,深入浅出地介绍了智能数据分析编程过程中的相关知识。书中涵盖Python环境搭建、Python基础语法、控制语句、函数、面向对象编程、数值计算、数据处理、绘图、模型构建等内容,还配套提供了程序代码及数据。此外,每章的最后均提供课后习题,帮助读者快速掌握Python的使用方法。

点击查看第一章
点击查看第二章

第3章

控制语句
在计算机中,程序执行的方向被称为控制流。最基本的情况下,程序从首条代码开始依次执行,调用函数、方法,使用控制结构,或程序发生异常都能使控制流转向。Python中用于操纵控制流的常用语句有if-elif-else语句、for语句、while语句、break语句、continue等。本章将重点介绍Python常用控制流语句,以及与控制流功能非常类似的、用于异常处理的try-except-else语句。

3.1 条件语句

条件语句通过一个或多个布尔表达式的执行结果(真值或假值)决定下一步的执行方向。所谓布尔表达式,即对某个对象进行布尔运算,产生一个bool值。条件语句的运行逻辑为:如果条件被满足(返回真值),可以做某件事情;如果条件不满足(返回假值),就做另一件事情,或什么也不做。
通过图3-1,可以对条件语句的运行机制作有一个简单的了解。虚线框内是一个选择结

image.png

构,此结构中包含一个判断条件和两条执行语句,以及连接各部分的流向线。根据判断条件(布尔表达式)返回值的情况,程序将选择执行语句1或语句2。
在Python中,实现选择结构最普遍的工具是if语句。此外,try语句专门用于异常处理,其内在逻辑也符合选择结构。

3.1.1 if、elif与else

if语句中包含3种条件判断句式,即if、elif和else。其中,if与elif部分都包含判断条件,当判断条件都不成立时,程序才能执行else部分的代码。
if语句最基础的形式是if-else,其基本语法格式如下。
if 条件表达式:

操作语句1

else:

操作语句2

if-else语句常用的参数及说明如表3-1所示。

image.png

if-else语句执行时,程序首先判断if部分条件表达式的真假。如果条件表达式返回真值,则执行操作语句1;如果返回假值,则执行操作语句2。
if-else语句的形式很简单,通过条件判断的结果即可决定下一步的执行方向,具有两条分支。以编写一个账户密码登录界面为例,介绍该语句的使用,如代码清单3-1所示。

image.png
image.png

在代码清单3-1中,使用input函数以支持交互式的输入,并在函数括号内插入文字进行了输入提示,增强了登录界面的人性化。在if部分的条件判断式中,使用and运算符进行且运算,只有账户和密码都输入正确才能成功登录,从而增加了安全性。
if-else语句可以缩减为单行形式,其基本语法格式如下。
操作语句1 if 条件表达式 else 操作语句2
if-else语句单行形式语法格式中的参数说明与图3-1一致。如果条件表达式返回的结果为真,则执行if前面的操作语句1,否则执行else后面的操作语句2。
if-else语句使用单行形式的目的主要在于增加代码的简洁性,其基本使用方法如代码清单3-2所示。

image.png

if-else语句有明显的缺陷,即只能实现两条分支。实际工作中需要用到的条件分支数目可能难以想象,扩展if语句的分支需要用到elif句式。elif是“else if”的缩写,即“下一条件是否成立?”。使用elif有简洁、减少过分缩排的效果。将elif代码块放在if和else之间,就组成了if-elif-else语句。理论上,if语句中的elif可以无限多。if-elif-else语句与if-else语句其实是等价的,后者相当于前者中elif个数为0或不执行的情况。由于if-elif-else语句能提供更多条件分支,因此被普遍使用,其基本语法格式如下。
if 条件表达式1:

操作语句1

elif 条件表达式2:

操作语句2

else:

操作语句3

if-elif-else语句语法格式中的参数与表3-1一致。该语句执行时,按照从上到下的顺序,依次检查每个条件表达式返回值的情况,任何一个条件表达式返回真值,就执行该表达式下面的操作语句。若所有条件表达式都返回假值,则执行else下面的操作语句。
if-elif-else语句相对于if-else语句优势明显,可以实现更为复杂的功能。使用if-elif-else语句实现年龄段的判断,如代码清单3-3所示。

image.png

代码清单3-3通过比较运算符实现了年龄段划分,并能区分年龄段界限,避免逻辑出错。正如2.4.1节中所述,input函数将接收的任何数据类型都默认为str,如果不在该代码中插入转换接收数据类型的语句,程序将无法执行。这是因为,接收的年龄数据会被用于和后续的年龄数值比较,而number与str是无法比较的。
需要说明,if语句还有一种形式是if-if-else,这一形式中的if可以有多个,从而实现多分支。与if-elif-else语句相比,差异不仅仅存在于形式上,性能上也同样有区别,使用多个if的效率更低,它实际上是多重if语句。
if语句支持嵌套,即在一个if语句中嵌入另一个if语句,从而构成不同层次的选择结构。嵌套的意义在于实现多层选择结构。使用嵌套对条件语句的功能有升华作用,这与elif是相似的,elif将有限的条件分支扩展,嵌套则提供了建立多层选择结构的工具,两者分别在不同的维度上提升了if语句的功能性。使用嵌套需要以不同的缩进长度划分代码结构的层次,因此嵌套时要特别注意缩进的规范性。
嵌套选择结构具有很广的应用场景,以下给出一个例子。假设系统中存储了5个用户的身份信息,分别是:来自英国的Tom,35岁;来自法国的Frank,35岁;来自德国的Bob,35岁;来自澳大利亚的Washington,51岁;来自南非的Jane,21岁。设计一个程序,询问用户的部分信息,在对方不说出自己名字的情况下识别其身份,如代码清单3-4所示。

image.png
image.png

从代码清单3-4可以看到,该程序具有两层选择结构。第1层用于询问年龄,程序通过接收的年龄,可以判断输入者是Jane、Washington或其他3个同龄人中的一个;若收到的值不在这5人年龄范围中,则提示输入出错;若收到的值是3个同龄人的岁数,则进入下一层选择结构,即询问国籍;通过询问国籍,程序可以准确报出输入者的信息。
使用if语句时,需要注意以下几点。
1)条件判断语句应尽量简单,若语句复杂则应当将运算先放到一个变量中。
2)Python的条件语句中允许常用的数值比较运算(==,!=,>,>=,<,<=)。
3)Python允许无限次if语句嵌套,但实际编程中如果必须用到3级到4级嵌套,建议考虑用其他方法编写代码,嵌套超过两层会使程序的运行效率大打折扣。

3.1.2 try、except与else

如果运行途中发生错误事件,程序的执行将中断,并创建异常对象。异常是程序在正常流程控制以外采取的动作,当它被引发时,计算机将自动寻找异常处理程序,以帮助程序恢复正常运行。
要保证程序的正常运行,就需要排除错误,错误要么是语法上的,要么是逻辑上的。语法错误的出现表明程序在结构上出现了问题,可以在程序执行前加以纠正。逻辑错误可能是缺少输入或输入不正确,某些情况下,也可能是根据输入无法生成预期的结果。逻辑错误难以预防,必须使用异常处理程序来应对。
计算机语言针对可能出现的错误定义了异常类型,某种错误引发对应的异常时,异常处理程序将被启动,从而恢复程序的正常运行。Python中定义的异常类型大致分为数值计算错误、操作系统错误、无效数据查询、Unicode相关的错误和警告等几类,如表3-2所示。

image.png

异常体系内部有层次关系,即某些异常属于某个异常的子类,该异常又可能是另一异常的子类。较低层次、更具细节的异常是某些异常的子类,这些高层次的异常则称为基类,子类和基类是相对的。Python异常体系中的部分关系如图3-2所示。

image.png

在图3-2中,越下面的异常,其层次越低,细节更明显,它们总有更高层次的基类。
Python使用try语句处理异常,该语句一般包括try、except和else三个句式,组成try-except-else的形式。try部分包含一个尝试执行的代码块,except部分是特定异常的处理对策,else部分则在程序运行正常时执行。
try语句可以视为一种条件分支,与if语句的区别是try语句并不包含条件判断式,执行的流向也不取决于条件表达式,而依赖于代码块能否执行。但其内在逻辑和运行流程与if语句是相似的,符合条件分支的特征,其基本语法格式如下。
try:

操作语句1

except 错误类型1:

操作语句2

except 错误类型2:

操作语句3

else:

操作语句4

try语句常用的语法格式及其参数说明如表3-3所示。

image.png

运行try-except-else语句时,程序首先执行try代码块,即可能出错的试探性语句,这可能导致致命性错误使得程序无法继续执行;如果try代码块确实无法执行,就可能执行某个except代码块。执行一个except代码块的条件是,系统捕捉的异常类型和该代码块标识的类型相符合;如果try代码块的语句正常执行,就接着执行else代码块的语句。如果try部分无法执行,也没有找到相应的except代码块,就将异常消息发送给程序调用端,如Python Shell,Python Shell对异常消息的默认处理则是终止程序的执行并打印具体的出错信息。这也是在Python Shell中执行程序错误后所出现的出错打印信息的由来。
在try语句中,except与else代码块都是可选的。except代码块可以有0或多个;else代码块可以有0或1个。但要注意,else语句的存在必须以except语句的存在为前提,在没有except语句的try语句中使用else语句,会引发语法错误。
try语句中没有else时,就构成try-except语句,如代码清单3-5所示。

image.pngimage.png

在代码清单3-5中,由于0不能做除数,因此引发了除零异常。except代码块由于给出了ZeroDivisionError的解决方案,因此被执行,程序得以完整地运行。
代码清单3-5所展示的异常之间的层次差别是有意义的,这在程序执行过程中可以体现,如代码清单3-6所示。

image.png

代码清单3-6展示的try-except-else语句尝试查询不在dict中的键值对,从而引发了异常。这一异常准确地说应属于KeyError,但由于KeyError是LookupError的子类,且在代码清单3-6中将LookupError置于KeyError之前,因此程序优先执行该except代码块。所以,使用多个except代码块时,必须坚持对其规范排序,要从最具针对性的异常到最通用的异常。
除自然发生的异常外,Python中的raise语句可用于故意引发异常。使用该语句引发异常时,只需在raise后输入异常名即可,如代码清单3-7所示。

image.png

3.2 循环语句

循环语句又称为重复结构,用于反复执行某一操作。面对大数量级的重复运算,即使借助计算机,重复编写代码也是费时的,这时就需要借助循环语句。使用循环语句一般要用到条件判断,根据判断式的返回值决定是否执行循环体。循环分为两种模式,一种是条件满足时执行循环体;另一种则相反,在条件不满足时执行循环体。前者称为当型循环,后者称为直到型循环。
在图3-3中,虚线框内是一个当型循环结构,此结构包含判断条件和循环体,以及连接各部分的流向线。程序执行时,先判断条件的真假。判断为真时,则执行循环体;判断为假时,不再执行循环体,循环结束。当型循环先进行条件判断,如果满足循环条件,再执行循环体,因此又被称为前测试型循环。
在图3-4中,虚线框内是一个直到型循环结构,此结构包括判断条件和循环体,以及连接各部分的流向线。程序执行时,先执行一次循环体,再判断执行循环的结果是否满足判断条件。满足条件时,再次执行循环体;不满足条件时,不再执行循环体。直到型循环在执行判断前先进入循环体运行,因此又被称为后测试型循环。

image.png

Python中主要有两种循环语句,即for语句和while语句。前者采用遍历的形式指定循环范围,后者视判断式返回值的情况而决定是否执行。要更灵活地操纵循环的流向,就要用到break、continue和pass等语句。

3.2.1 for

for循环是迭代循环,在Python中相当于一个通用的序列迭代器,可以遍历任何有序序列,如str、list、tuple等,也可以遍历任何可迭代对象,如dict。不同于C语言,Python中的for语句将遍历系列中的所有成员,遍历顺序为成员在系列中的顺序。需要注意,在for循环中改变任何序列的内容都是危险的!
for语句不属于当型循环或直到型循环,它遍历序列对象内的元素,对每个元素运行一次循环体,循环的步数在程序开始执行时已经指定,不属于条件判断。
在for语句中,for和in搭配组成for-in循环结构,for-in循环依次把list或tuple中的每个元素迭代出来。for语句的基本语法格式如下。
for 变量 in 序列:
操作语句
for语句常用的语法格式及其参数说明如表3-4所示。

image.png

程序的执行从“for变量in序列”开始,该语句把序列中的每个元素代入变量,执行一遍操作语句1,重复的次数就是序列中元素的个数。
为了展示for循环的遍历功能,依次打印list中的姓名,如代码清单3-8所示。

image.png

2.3节介绍了dict的遍历方法,实际上,for语句同样可以实现这一功能,如代码清单3-9所示。

image.png

从代码清单3-9可以看到,for语句中用于遍历的“变量”不仅可以是Python默认的指代词,也可以是常规的变量。
和条件语句一样,循环语句也可以使用嵌套,作用同样是丰富程序的功能性。设计一个成绩录入系统,就必然要录入姓名和课程这两类信息,仅靠一层循环是无法实现的,可使用两层循环结构,如代码清单3-10所示。

image.png
image.png

理论上,for循环也可以无限嵌套,但并不推荐。

3.2.2 while

while语句是Python中最常用的递归结构。区别于for循环,while循环结构包含条件判断式,是一种条件循环,属于当型循环。
while语句最基本的形式包括一个位于顶部的布尔表达式,一个或多个属于while代码块的缩进语句。也可以在结尾处包含一个else代码块,它与while代码块是同级的,组成while-else的形式。while语句的基本语法格式如下。
while 条件表达式:

操作语句 1
操作语句 2

while语句常用的参数及其说明如表3-5所示。

image.png

执行while语句时,只要顶部的条件表达式返回真值,就一直执行while部分嵌套的递归代码,当条件表达式返回假值时,不再执行操作语句,程序跳出while结构。
while语句的基础使用方法如代码清单3-11所示。

image.png

如果布尔表达式不带有<、>、==、!=、in、not in等运算符,仅仅给出数值之类的条件,也是可以的。当while后写入一个非零整数时,视为真值,执行循环体;写入0时,视为假值,不执行循环体。也可以写入str、list或任何序列,长度非零则视为真值,执行循环体;否则视为假值,不执行循环体。
如果布尔表达式始终返回1,while语句就变成无限循环,如代码清单3-12所示。

image.png

运行代码清单3-12,将会不断打印出“循环”。代码清单3-12展示了制造无限循环的两种方式,既可以在while后写入一个固定的真值,也可以写入一个一直生成真值的表达式。要终止无限循环,可以使用快捷键Ctrl+C中断循环的执行,也可以用循环终止语句,这将在3.2.3节介绍。
灵活地利用while语句中的布尔表达式及代入表达式的递归值,可以实现特别的功能,如代码清单3-13所示。

image.png

代码清单3-13包含一个自减迭代值,它并不通过明显的运算符实现自减,而是利用索引法则,x变量一直从str中第2个值截取至结尾,每次都将位于str最前面的字符截取掉,最终只剩下一个字符时,再次截取就只有空的结果,布尔表达式返回0,循环终止。
通过代码清单3-12和代码清单3-13可以看到,灵活地利用递归式,可以实现程序流向的控制。
while循环同样可以使用嵌套,嵌套的while循环实现成绩录入系统如代码清单3-14所示。

image.png

代码清单3-14的第1层while语句用于录入人名,第2层则在各人名下录入多门成绩,布尔表达式决定录入的人数和课程数。

3.2.3 break、continue与pass

在3.2.1节和3.2.2节中,已经介绍了Python中的两种循环语句。循环语句中还可以嵌入break、continue和pass语句,以灵活地改变流向,实现更多功能。
1.break
在Python中,break语句用于终止循环语句的执行。使用该语句时,即使循环条件判断为真,或序列未被完全递归,循环语句也会被立刻停止。
break语句一般配合条件判断使用,因为程序的终止必须是在某一条件被满足时执行。break语句在for循环和while循环中的使用如代码清单3-15所示。

image.png

从代码清单3-15可以看到,break语句用于for循环和while循环是有区别的。用于for循环时,只终止遍历中某一次的循环体执行;用于while循环时,整个循环被终止。
break只终止本层循环,如有多层嵌套的循环,在其中一层循环中写入break,只在这层循环中生效,程序将跳到上一层循环中继续运行,如代码清单3-16所示。

image.png
image.png

在代码清单3-16中,break语句在条件判断式“if j>1:”后被使用,因此尽管j的指定遍历次数为10,实际上遍历只运行两次。由于break语句只终止本层循环的运行,i依旧遍历执行了两次,而不是在第1次遍历过程末尾终止。
2.continue
Python中的continue语句用于跳出当前循环,并执行下一次循环,而break跳出整层循环,两者的功能具有明显区别。
如果一段代码中包含continue语句,循环执行至continue处时,先忽略本次循环,在本层仍满足条件的剩余循环次数中继续执行,不会终止这一层循环。实际上,如果在某一层的每次循环中都使用continue语句,就相当于使用break语句。
打印一个数表,要不打印某些指定的数字,或只打印某类数,就可以使用continue语句跳过一些循环次数,该语句在for循环和while循环中都可以自由地使用,如代码清单3-17所示。

image.pngimage.png

break语句一旦用于嵌套循环中的第n层,该层循环会被终止,但在执行第n-1层循环时,仍会创造一个第n层循环并执行。continue语句同样如此,只是仍会执行某一层的剩余部分。因此,无论使用哪种循环终止语句,都只会影响使用终止语句的那一层循环,而不会干扰到其他层。continue语句用于循环的例子如代码清单3-18所示。

image.png

3.pass
pass是空语句,不做任何操作,只起到占位的作用,其作用是为了保持程序结构的完整性。尽管pass语句不做任何操作,但如果暂时不确定要在一个位置放上什么样的代码,可以先放置一个pass语句,让代码可以正常运行。pass语句并非循环或者条件语句的一部分,但与break、continue在代码形式上有些类似。
使用pass语句遍历输出str及数值计算,如代码清单3-19所示。

image.png
image.png

从代码清单3-19可以看到,Python在“P”和“t”之间占位,当循环遍历到“y”时不做任何操作;当i等于3时,幂运算不执行,但不影响其他数值。上述两个代码如果在pass的位置缺失,程序将无法执行,因为判断条件没有给出相应的执行语句,会导致逻辑出错。使用pass语句占位,一方面为了让程序正常执行,另一方面也是为了方便以后补充操作语句。

3.2.4 列表推导式

推导式是可以从一个数据序列构建另一个新的数据序列的结构体,能够非常简洁地构造新的变量。列表推导式是其中最常用的类型。
列表推导式又称为列表解析式,是Python迭代机制的一种应用,也是一种高效创建列list的方式,可以动态地创建list。由于列表推导式必须用到遍历循环,因此属于一种特殊的循环。
使用列表推导式时,需要将推导式写在[]中。list中的元素可以来源于其他类型序列、可迭代对象或自建的满足一定条件的序列。使用列表推导式的好处是代码更加简洁,实现效率更高。
列表推导式的基本语法格式如下。
[操作语句 for变量 in 序列 if 条件表达式]
列表推导式常用的参数及其说明如表3-6所示。

image.png

列表推导式可以不包含条件表达式,只做遍历,生成list,如代码清单3-20所示。

image.png

在代码清单3-20中,除了列表推导式的简单形式,还说明了列表推导式中可以使用多样的函数和变量类型。另外,列表推导式中也可以包含条件语句,如代码清单3-21所示。

image.png

列表推导式最大的优点还是简洁,这需要与常规的编程方式进行对比。如代码清单3-22所示,要创建一个平方数组成的list,这里的两种方式是等价的,但列表推导式的方式显然代码更加简洁。

image.pngimage.png

列表推导式中同样可以实现嵌套循环,如代码清单3-23所示。

image.png

代码清单3-23所示的列表推导式将两个不同list中的元素整合到了一起。列表推导式中包含一对括号,在括号中有一个表达式,表达式后面紧跟一条for语句,然后是零条或多条for语句或if语句。通过for语句和if语句计算出表达式,结果作为新list的元素。

小结

控制语句是计算机语言中用于操纵程序流走向的工具,有广泛的应用场景。使用控制语句的精要在于灵活选择与搭配语句,合理使用嵌套,以实现多样化功能。本章重点讲述了如下知识点。
1)if语句和try语句。这两个语句均可以实现多个条件分支,但try语句专门用于异常处理。
2)for语句和while语句。for语句属于遍历循环,while语句属于当型循环。除了两个循环语句外,还介绍了break、continue与pass三个用于控制循环结构中的程序流向的语句。在此基础之上,还介绍了列表推导式,这一种特殊的循环语句。

课后习题

1.选择题
(1)下列关于if语句的说法正确的是(  )。
A.一个完整的if语句必须包含if、elif和else,否则无法执行
B.在if语句的单行形式中,必须将布尔表达式放在最前端
C.理论上,elif可以实现无限多条件分支
D.if语句的嵌套次数可以尽可能的多,并无不良影响

(2)下列关于异常及try语句的说法不正确的是(  )。
A.Python中的错误事件引发了异常
B.异常体系中的基类比子类被执行的优先级高
C.try语句也是一种分支结构
D.在try代码块中成功使用raise语句引发异常,下一步会执行else代码块

(3)下列关于循环语句的说法正确的是(  )。
A.for语句是一种当型循环
B.while语句是一种直到型循环
C.使用while语句创建出了无限循环,一定是因为顶端布尔表达式只包含常数
D.for语句和while语句都支持嵌套,并且可以相互嵌套

(4)下列关于循环控制语句的说法正确的是(  )。
A.break语句的使用将终止整个程序
B.continue语句终止整层循环
C.pass语句的作用是终止一层循环中的某一次循环
D.break和continue语句采用不同方式终止循环,pass语句仅仅是一个占位符

(5)下列关于列表推导式的说法正确的是(  )。
A.列表推导式必须写在[]中
B.列表推导式必须包含一个条件语句
C.列表推导式中可以写入while语句以产生list
D.列表推导式中不允许嵌套

2.填空题
(1)在if-else语句中加入elif的意义在于image.png

(2)在try语句中,如果try代码块执行不成功,程序将执行image.png代码块。

(3)for语句是image.png循环,while语句是image.png循环。

(4)break语句终止image.png循环,continue语句终止image.png循环。

(5)列表推导式利用image.png循环生成list。

3.操作题
(1) 使用if-elif-else语句实现一个猜食材的程序。程序将询问匿名食材A、B、C、D、E的味道和颜色,猜出该食材是柠檬(sour,yello)、醋(sour,colourless)、白糖(sweet,white)、黑巧克力(bitter,black)、苦瓜(bitter,green)或青椒(spicy,green)。

(2)编写一个嵌套循环语句,生成一个如表3-7所示的99乘法表,并写入文件。

image.png

(3) 写出列表推导式[(i,j) for i in range(0,3) if i < 1 for j in range(0,3) if j > 1]的for语句形式代码。

相关文章
|
8月前
|
SQL 人工智能 数据挖掘
阿里云DMS,身边的智能化数据分析助手
生成式AI颠覆了人机交互的传统范式,赋予每个人利用AI进行低门槛数据分析的能力。Data Fabric与生成式AI的强强联合,不仅能够实现敏捷数据交付,还有效降低了数据分析门槛,让人人都能数据分析成为可能!阿里云DMS作为阿里云统一的用数平台,在2021年初就开始探索使用Data Fabric理念构建逻辑数仓来加速企业数据价值的交付,2023年推出基于大模型构建的Data Copilot,降低用数门槛,近期我们将Notebook(分析窗口)、逻辑数仓(Data Fabric)、Data Copilot(生成式AI)进行有机组合,端到端的解决用数难题,给用户带来全新的分析体验。
111618 120
阿里云DMS,身边的智能化数据分析助手
|
8月前
|
机器学习/深度学习 数据挖掘 索引
Python数据分析(一)—— Numpy快速入门
Python数据分析(一)—— Numpy快速入门
|
4天前
|
安全 数据挖掘 BI
欢迎使用Quick BI,开启您的智能数据分析之旅!
欢迎选择Quick BI作为您的数据分析伙伴!本文将为您介绍一个月全功能免费试用教程,帮助您轻松上手。请确保在PC环境下操作。
53 5
|
8月前
|
人工智能 数据挖掘 机器人
【python】python智能停车场数据分析(代码+数据集)【独一无二】
【python】python智能停车场数据分析(代码+数据集)【独一无二】
244 0
|
8月前
|
SQL 数据挖掘 数据处理
Python数据分析(二)—— Pandas快速入门
Python数据分析(二)—— Pandas快速入门
|
4月前
|
存储 算法 数据挖掘
高效文本处理新纪元:Python后缀树Suffix Tree,让数据分析更智能!
在大数据时代,高效处理和分析文本信息成为关键挑战。后缀树作为一种高性能的数据结构,通过压缩存储字符串的所有后缀,实现了高效的字符串搜索、最长公共前缀查询等功能,成为文本处理的强大工具。本文探讨Python中后缀树的应用,展示其在文本搜索、重复内容检测、最长公共子串查找、文本压缩及智能推荐系统的潜力,引领数据分析迈入新纪元。虽然Python标准库未直接提供后缀树,但通过第三方库或自定义实现,可轻松利用其强大功能。掌握后缀树,即掌握开启文本数据宝藏的钥匙。
62 5
|
6月前
|
机器学习/深度学习 数据采集 数据挖掘
智能决策新引擎:Python+Scikit-learn,打造高效数据分析与机器学习解决方案!
【7月更文挑战第26天】在数据驱动时代,企业需从大数据中提取价值以精准决策。Python凭借丰富的库成为数据分析利器,而Scikit-learn作为核心工具备受青睐。本文通过电商案例展示如何预测潜在买家以实施精准营销。首先进行数据预处理,包括清洗、特征选择与转换;接着采用逻辑回归模型进行训练与预测;最后评估模型并优化。此方案显著提升了营销效率和企业决策能力,预示着智能决策系统的广阔前景。
107 2
|
6月前
|
人工智能 算法 数据挖掘
高效文本处理新纪元:Python后缀树Suffix Tree,让数据分析更智能!
【7月更文挑战第20天】后缀树是文本处理的关键工具,它在Python中虽需第三方库支持(如pysuffixtree),但能高效执行搜索、重复内容检测等任务。应用于文本搜索、重复内容检测、生物信息学、文本压缩及智能推荐系统。随着AI和大数据发展,后缀树将在更多领域展现潜力,助力数据分析智能化和高效化。学习和利用后缀树,对于驾驭海量文本数据至关重要。**
55 1
|
8月前
|
人工智能 自然语言处理 数据挖掘
产品更新|宜搭AI 新增「智能数据分析」「智能表单」两项功能!
「宜搭AI」开放新一期功能:智能数据分析、智能表单,已支持在宜搭网页端使用体验。
508 0
产品更新|宜搭AI 新增「智能数据分析」「智能表单」两项功能!
|
6月前
|
数据挖掘 数据处理 决策智能
Python 数据分析工具箱:深挖 Pandas 与 NumPy 高级功能,驱动智能决策
【7月更文挑战第12天】Python的Pandas和NumPy是数据分析的基石。Pandas提供灵活的数据结构如DataFrame,用于高效处理关系型数据,而NumPy则以多维数组和科学计算功能著称。两者结合,支持数据合并(如`pd.merge`)、时间序列分析(`pd.to_datetime`)和高级数组运算。通过掌握它们的高级特性,能提升数据分析效率,应用于各领域,如金融风险评估、市场分析和医疗预测,助力数据驱动的决策。学习和熟练运用Pandas与NumPy是成为出色数据分析师的关键。
64 0