数据挖掘导论——Python练习

简介: 数据挖掘导论——Python练习

编写一个名为collatz()的函数,它有一个名为number的参数,如果输入的参数是质数,那么collatz()就打印出number,如果number不是质数,则打印3*number+1。


输入 2 3 4
输出 2 3 13

代码

import math  
def collatz(number):  
    if number <= 1:  
        return 3 * number + 1  
    if number == 2:  
        return number  
    i = 2  
    while i <= math.sqrt(number) + 1:  
        if number % i == 0:  
            return 3 * number + 1  
        i += 1  
    return number  

分析


首先对负数以及小于等于1的数字进行特判,如果是小于等于1的数字则一定不是质数,直接返回三倍number+1的值即可。当输入为2时,为质数,直接返回即可。当输入其他数字时,利用循环,依次取2到number的平方根+1的值进行取余运算,利用遍历对是否存在非1以及其本身的其他因子进行判断。如果存在,则直接返回三倍number+1的值。若穷举后发现不存在,则返回原值即可。


测试


当输入为2时:

269783f414124c0f93f31d44f2c0fde8.png

当输入为3时:

cbec9c3ec52c4eb6b4e1dc31a491ea20.png

当输入为4时:

b81e8070515e49c6a72f3e56f5c999aa.png

当输入为8时:

6eb22d9b5cf64b6fa2a9c6b9867ab8df.png

当输入为19时:

9ec2b0ffc0c6424ab12f154540f319a8.png


有两个磁盘文件test1.txt和test2.txt,各存放一行字母,要求把这两个文件中的信息合并(按字母顺序排列,每类字母大写在前,小写在后), 输出到一个新文件test3.txt中。

示例:

注:运行以上程序前,你需要在脚本执行的目录下创建 test1.txt、test2.txt 文件

test1.txt : AbCdEf

test2.txt: HIiJKaBcDeF

test3.txt: AaBbCcDdEeFfHIiJK


代码

with open('test1.txt', 'r+') as f:  
    tempString = f.read()  
with open('test2.txt', 'r+') as f:  
    tempString += f.read()  
print(tempString)  
temp = list(tempString)  
temp.sort(key=lambda x: 2 * ord(x) if x.isupper() else 2 * ord(x.upper()) + 1)  
tempString = "".join(temp)  
f = open("test3.txt", "w")  
f.write(tempString)  
print(tempString)  

分析


首先利用文件流读取两个文件并合并成一个字符串,然后将其转成列表,再利用sort函数结合ASCII码,对于大写字母,排序的键为ASCII码的二倍,对于小写字母,排序的键为对应大写字母ASCII码的二倍加一,从而将小写字母插入大写字母中。排序结束后再利用join将列表转换成字符串。最后利用文件流,输出到文件中即可。


测试


Test1.txt:

1b73a73ad0884af2b2279dfa482f32ac.png

Test2.txt

70d537dd158d44109c4d0b795c80b870.png

Test3.txt

24a7c3beff6c4f7cbc14488f9f1c6843.png


某个公司采用公用电话传递数据,数据是四位的整数,在传递过程中是加密的,加密规则如下:每位数字都加上5,然后用和除以10的余数代替该数字,再将第一位和第四位交换,第二位和第三位交换。


示例:

输入:1234

输出:9876


代码

def encrypt(num):  
    res = int(num / 1000 + 5) % 10  
    res += int(num % 1000 / 100 + 5) % 10 * 10  
    res += int(num % 100 / 10 + 5) % 10 * 100  
    res += int(num % 10 + 5) % 10 * 1000  
    return res  
print(encrypt(1234))  

分析


对于个位数,新数字的个位数即为原数字的千位数,因此对原数字的千位数加五之后对10取模即可

对于十位数,新数字的十位数即为原数字的百位数,因此对原数字的百位数加五之后对10取模即可

对于百位数,新数字的百位数即为原数字的十位数,因此对原数字的十位数加五之后对10取模即可

对于千位数,新数字的千位数即为原数字的个位数,因此对原数字的个位数加五之后对10取模即可


测试


加密前:1234

加密后:9876


元素分类。给定如下的集合[11,33,22,44,55,66,77,88,99,90],创建一个字典,第一个键(“min”)对应的值是所有小于66的值,第二个键(“max”)对应的值是所有大于或等于66的值。输出该字典的所有键值对。


代码

if __name__ == '__main__':  
    num = [11, 33, 22, 44, 55, 66, 77, 88, 99, 90]  
    dic = {'min': [], 'max': []}  
    for i in num:  
        if i < 66:  
            dic['min'].append(i)  
        else:  
            dic['max'].append(i)  
    print(dic)

分析


首先创建元素列表以及目标字典。利用for循环遍历列表,对于列表中的每个数字,当其小于66时,加入到以min为键的字典中,反之则加入到以max为键的字典中。最后输出结果即可


测试


ffcfb3a7ef4b4030a91be601d1845418.png


创建一个名为names的空列表,往里面按顺序添加 Lihua、Rain、Jack、Xiuxiu、Peiqi和Black共6个元素。再分别按照如下3个要求对names进行操作(每个操作不相关):


往names列表里Black前面插入一个Blue,后面插入White,输出names列表;

把names列表中Xiuxiu的名字替换成“秀秀”,并输出names列表;

创建新列表[1,2,3,4,2,5,6,2],将新列表元素追加到names列表末尾,并输出names列表;取出names列表中索引2-10的元素,步长为2,打印所取出的元素。


代码

  if __name__ == '__main__':  
      names = ['Lihua', 'Rain', 'Jack', 'Xiuxiu', 'Peiqi', 'Black']  
      names.insert(-1, 'Blue')  
      names.append('White')  
      print(names)  
if __name__ == '__main__':  
    names = ['Lihua', 'Rain', 'Jack', 'Xiuxiu', 'Peiqi', 'Black']  
    names[names.index('Xiuxiu')] = '秀秀'  
    print(names) 
if __name__ == '__main__':  
    names = ['Lihua', 'Rain', 'Jack', 'Xiuxiu', 'Peiqi', 'Black']  
    newList = [1, 2, 3, 4, 2, 5, 6, 2]  
    names.extend(newList)  
    print(names)  
    print(names[2:11:2])  


分析


通过利用insert在倒数第二个位置插入’Blue’,通过append在末尾加入’White’

通过利用index函数获取对应内容的下标值之后,再直接进行读写。

通过利用extend函数完成两个列表间的合并操作。利用切片对列表进行切片,从而获取以2开始,步长为2的序列


测试


ffc0e1a5ed1a469086ce8e04ad321b5d.png

820c2f81dc42483f9b6b1a98a10759a6.png

271d6c572f1949ebb16cb5f5399fe32c.png


定义一个字典。其中键是字符串,描述清单中的物品,值是一个整型值,说明玩家有多少该物品。例如,字典值{‘rope’: 1, ‘torch’: 6, ‘gold coin’: 42, ‘dagger’: 1, ‘arrow’: 12}。写一个名为 displayInventory()的函数,参数是字典,打印输出物品个数和物品名称,并统计物品总数量。(输出格式参考下图)


401bb1e951d54e71a3e6155bf9ce72fd.png

代码

def displayInventory(dir):  
    print('Inventory:')  
    temp = 0  
    for i in dir.keys():  
        print(str(dir[i]) + " " + i)  
        temp += dir[i]  
    print('Total number of items:' + str(temp))  
if __name__ == '__main__':  
    dir = {'rope': 1, 'torch': 6, 'gold coin': 42, 'dagger': 1, 'arrow': 12}  
    displayInventory(dir)  

分析

首先输出“Inventory:”,然后利用for循环遍历整个字典并累加。最后将累加结果输出。

测试

d9d502a6eb374f79b9cf566a66001423.png

输入包含数字和字母的字符串,判断:


  1. 该串中是否两类字符[数字和英文字符]都包含?
  2. 每种字符都唯一?
    若两个条件都满足返回”TURE”,否则返回”FALSE”。
    示例:
    输入: Aabc123 输出:TURE
    输入: aabc123 输出:FALSE
    输入:Aabc 输出:FALSE


代码


import re  
def judge(string0):  
    if len(string0) != len(set(string0)):  
        return False  
    if re.compile(r"[0-9]").findall(string0) and re.compile(r"[a-zA-Z]").findall(string0):  
        return True  
    else:  
        return False


分析

首先利用set,将字符串转化为字符串集合。由于集合的键值元素特性,集合长度即为字符串中拥有的不同字符数,因此当集合长度与字符串长度相等时,字符串每种字符均唯一。

其次,利用正则表达式检索数字与英文字符,当两个正则表达式都匹配时,即说明字符串中两类字符都包含。


测试


35a3252cd16a4c2ab339618c7928372e.png

5c2b6b24027645dbbf01a59aff7e1c5e.png

17e399a7eba142838f53ba7ffa6b02bd.png


相关文章
|
2月前
|
Python
Python:函数篇(每周练习)
Python:函数篇(每周练习)
96 1
|
3月前
|
机器学习/深度学习 人工智能 算法
【Python】编程练习的解密与实战(一)
【Python】编程练习的解密与实战(一)
38 0
|
5月前
|
算法 Python
Python实战练习示例
Python实战练习示例
43 7
|
5月前
|
数据可视化 算法 JavaScript
【Python数据挖掘】数据可视化及数据对象的相似性度量算法详解(超详细 附源码)
【Python数据挖掘】数据可视化及数据对象的相似性度量算法详解(超详细 附源码)
91 0
|
3月前
|
数据采集 数据可视化 数据挖掘
Python数据挖掘项目实战——自动售货机销售数据分析
Python数据挖掘项目实战——自动售货机销售数据分析
|
5月前
|
机器学习/深度学习 人工智能 数据挖掘
【Python数据挖掘】数据挖掘简介及Jupyter notebook操作介绍(图文解释 超详细)
【Python数据挖掘】数据挖掘简介及Jupyter notebook操作介绍(图文解释 超详细)
75 0
|
3月前
|
数据可视化 数据挖掘 调度
【Python数据挖掘】优化电能能源策略:基于非侵入式负荷检测与分解的智能解决方案
【Python数据挖掘】优化电能能源策略:基于非侵入式负荷检测与分解的智能解决方案
38 0
|
5天前
|
网络安全 Python
网安之python基础学习练习(2-3)
本篇博文是关于网络安全课程中Python编程的学习实践总结。分享关于两个练习题目及其解决方案。第一个题目要求用户输入姓名并选择一项武技,使用for循环和if判断实现。第二个题目是删除列表中特定值(如&#39;cat&#39;)的所有元素,作者展示了两种方法,包括列表推导式和常规循环删除。接下来,文章还介绍了如何编写一个函数,随机生成一副扑克牌(除大小王),并返回一张随机抽取的牌。
|
5天前
|
存储 网络安全 索引
网安之python基础学习练习(1)
本篇博文是关于网络安全课程中Python编程学习的总结,主要内容包括:1) 常见数据类型的回顾和应用,如数字(整数、浮点数、复数)、字符串、列表、元组、集合、字典和布尔类型;2) 数据类型的实例操作,展示如何创建和使用这些类型;3) 数值类型之间的加、减、乘、除和模运算;4) 列表和元组的索引访问;5) 字典的修改,如查看键和值,以及更新值。文章强调了基础知识的重要性,并以“自满必定失败,骄傲必定后悔”作为每日一言。
|
19天前
|
存储 索引 Python
Python从入门到精通——1.3.1练习编写简单程序
Python从入门到精通——1.3.1练习编写简单程序