《python 与数据挖掘 》一 2.6 上机实验

简介:

本节书摘来自华章出版社《python 与数据挖掘 》一书中的第2章,第2.6节,作者张良均 杨海宏 何子健 杨 征,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

2.6 上机实验

1.实验目的
掌握Python流程控制语句,合理运用循环进行程序设计。
掌握Python数据结构,并能熟练运用进行程序设计。
掌握Python的文件读写,并能编写读取数据集的程序。
2.实验内容
实验一
冒泡排序是一个经典的排序算法,任意给定一个Python的列表SList ,要求使用Python实现冒泡排序算法对SList进行排序。
输入样例:SList = [5,6,3,4,8,1,9,0,2]
输出样例:[0,1,2,3,4,5,6,7,8,9]
提示:for i in range(3)[::-1]: 这个语法表示从2到0倒叙遍历
实验二
设计一个节假日字典,键值为日期,格式如“160101”(表示2016年1月1日)。现在要求使用Python编写一个2016年5月的节假日字典,当输入日期时,字典能返回一个值,1代表该日为节假日,0代表该日不是节假日。最后要求使用json模块将这个节假日字典序列化并保存下来。
实验三
进行txt文件数据读取,数据为UCI数据库的疝气病症预测病马数据,数据见data/ horseColic.txt。数据有多行,每行都有22个数据,前21个为马的病症数据,最后一个为该马的标签,判断其患病与否。实验的要求是将所有行的前21个数据保存到一个二维列表dataArr中,而标签数据单独保存在一个列表labelArr中。
展示前三行数据经程序处理后的格式:
dataArr:
[['2.000000', '1.000000', '38.500000', '66.000000', '28.000000', '3.000000', '3.000000', '0.000000', '2.000000', '5.000000', '4.000000', '4.000000', '0.000000', '0.000000', '0.000000', '3.000000', '5.000000', '45.000000', '8.400000', '0.000000', '0.000000'], ['1.000000', '1.000000', '39.200000', '88.000000', '20.000000', '0.000000', '0.000000', '4.000000', '1.000000', '3.000000', '4.000000', '2.000000', '0.000000', '0.000000', '0.000000', '4.000000', '2.000000', '50.000000', '85.000000', '2.000000', '2.000000'], ['2.000000', '1.000000', '38.300000', '40.000000', '24.000000', '1.000000', '1.000000', '3.000000', '1.000000', '3.000000', '3.000000', '1.000000', '0.000000', '0.000000', '0.000000', '1.000000', '1.000000', '33.000000', '6.700000', '0.000000', '0.000000']]

labelArr:
['0.000000', '0.000000', '1.000000']

相关文章
|
5天前
|
算法 数据挖掘 Python
Python中的拟合技术:揭示数据背后的模式
Python中的拟合技术:揭示数据背后的模式
14 0
Python中的拟合技术:揭示数据背后的模式
|
4天前
|
数据挖掘 索引 Python
Python数据挖掘编程基础3
字典在数学上是一个映射,类似列表但使用自定义键而非数字索引,键在整个字典中必须唯一。可以通过直接赋值、`dict`函数或`dict.fromkeys`创建字典,并通过键访问元素。集合是一种不重复且无序的数据结构,可通过花括号或`set`函数创建,支持并集、交集、差集和对称差集等运算。
14 9
|
1天前
|
数据采集 数据挖掘 数据处理
Python中实现简单爬虫并处理数据
【9月更文挑战第31天】本文将引导读者理解如何通过Python创建一个简单的网络爬虫,并展示如何处理爬取的数据。我们将讨论爬虫的基本原理、使用requests和BeautifulSoup库进行网页抓取的方法,以及如何使用pandas对数据进行清洗和分析。文章旨在为初学者提供一个易于理解的实践指南,帮助他们快速掌握网络数据抓取的基本技能。
13 3
|
6天前
|
数据挖掘 Python 容器
Python数据挖掘编程基础
Python包含四种内置数据结构:列表(List)、元组(Tuple)、字典(Dictionary)和集合(Set),统称为容器。列表与元组均为序列结构,前者使用方括号表示且可修改,后者用圆括号表示且不可修改。列表支持多种方法和列表解析功能,以简化元素操作。例如,通过列表解析可以简洁地实现`d=[i+1 for i in c]`,输出结果为`[2,3,4]`。
19 7
|
5天前
|
Python
Python量化炒股的数据信息获取—获取沪深股市每日成交概况信息
Python量化炒股的数据信息获取—获取沪深股市每日成交概况信息
18 5
|
4天前
|
存储 索引 Python
python中的数据容器
python中的数据容器
|
5天前
|
Python
Python量化炒股的数据信息获取—获取上市公司分红送股数据信息
Python量化炒股的数据信息获取—获取上市公司分红送股数据信息
17 3
|
5天前
|
数据采集 Python
天天基金数据的Python爬虫
天天基金数据的Python爬虫
20 3
|
4天前
|
机器学习/深度学习 TensorFlow 算法框架/工具
使用Python实现深度学习模型:智能数据隐私保护
使用Python实现深度学习模型:智能数据隐私保护
14 1
|
5天前
|
数据采集 JSON 数据格式
Python:南京地铁每日客流数据的爬虫实现
Python:南京地铁每日客流数据的爬虫实现
16 1
下一篇
无影云桌面