利用Python对白葡萄酒品质进行分析与处理实战(附源码)

简介: 利用Python对白葡萄酒品质进行分析与处理实战(附源码)

需要源码和数据集请点赞关注收藏后评论区留言私信~~~

众所周知 葡萄酒的价格是与其品质相关的,下面根据数据对白葡萄酒品质进行分析与处理

白葡萄酒的各项指标含义如下

fixed acidity                        固定酸度

volatile acidity                   挥发性酸度

citric acid                           柠檬酸

residual sugar                     剩余糖

chlorides                              氯化物

free sulfur dioxide                  游离二氧化碳

total sulfur dioxide                 总二氧化硫

density                                 密度

PH                                  ph值

sulphates                    酸碱盐

alcohol                       酒精

quality                        品质

首先读取数据 打印部分部分数据如下图

import csv
f = open("data//white_wine.csv", "r")
reader = csv.reader(f)
content = []
for row in reader:
    content.append(row)
f.close()
for i in range(5):
    print(content[i])

 

接着处理数据 首先查看白葡萄酒总共分为几种品质等级

quality_list = []
for row in content[1:]:
    quality_list.append(int(row[-1]))
quality_count = set(quality_list)
print("白葡萄酒共有%d种等级,分别是:%r"%(len(quality_count),quality_count))

然后按白葡萄酒等级将数据集划分为七个自己 并统计每种等级的数量

content_dict = {}
for row in content[1:]:
    quality = int(row[-1])
    if quality not in content_dict.keys():
        content_dict[quality] = [row]
    else:
        content_dict[quality].append(row)
for key in content_dict:
    print(key,":",len(content_dict[key]))

最后再计算每个数据集中fixed acidity的均值

mean_list = []
for key, value in content_dict.items():
    sum= 0
    for row in value:
        sum += float(row[0]) #fixed acidity是第一列数据
    mean_list.append((key, sum/len(value)))
for item in mean_list:
    print(item[0],":",item[1])
#     print("\n")
# print(mean_list)

创作不易 觉得有帮助请点赞关注收藏~~~

相关文章
|
3月前
|
SQL 关系型数据库 数据库
Python SQLAlchemy模块:从入门到实战的数据库操作指南
免费提供Python+PyCharm编程环境,结合SQLAlchemy ORM框架详解数据库开发。涵盖连接配置、模型定义、CRUD操作、事务控制及Alembic迁移工具,以电商订单系统为例,深入讲解高并发场景下的性能优化与最佳实践,助你高效构建数据驱动应用。
491 7
|
3月前
|
存储 分布式计算 大数据
基于Python大数据的的电商用户行为分析系统
本系统基于Django、Scrapy与Hadoop技术,构建电商用户行为分析平台。通过爬取与处理海量用户数据,实现行为追踪、偏好分析与个性化推荐,助力企业提升营销精准度与用户体验,推动电商智能化发展。
|
3月前
|
数据采集 Web App开发 数据安全/隐私保护
实战:Python爬虫如何模拟登录与维持会话状态
实战:Python爬虫如何模拟登录与维持会话状态
|
3月前
|
机器学习/深度学习 大数据 关系型数据库
基于python大数据的台风灾害分析及预测系统
针对台风灾害预警滞后、精度不足等问题,本研究基于Python与大数据技术,构建多源数据融合的台风预测系统。利用机器学习提升路径与强度预测准确率,结合Django框架实现动态可视化与实时预警,为防灾决策提供科学支持,显著提高应急响应效率,具有重要社会经济价值。
|
3月前
|
机器学习/深度学习 大数据 关系型数据库
基于python大数据的青少年网络使用情况分析及预测系统
本研究基于Python大数据技术,构建青少年网络行为分析系统,旨在破解现有防沉迷模式下用户画像模糊、预警滞后等难题。通过整合多平台亿级数据,运用机器学习实现精准行为预测与实时干预,推动数字治理向“数据驱动”转型,为家庭、学校及政府提供科学决策支持,助力青少年健康上网。
|
3月前
|
Java 调度 数据库
Python threading模块:多线程编程的实战指南
本文深入讲解Python多线程编程,涵盖threading模块的核心用法:线程创建、生命周期、同步机制(锁、信号量、条件变量)、线程通信(队列)、守护线程与线程池应用。结合实战案例,如多线程下载器,帮助开发者提升程序并发性能,适用于I/O密集型任务处理。
391 0
|
Linux C语言 开发者
源码安装Python学会有用还能装逼 | 解决各种坑
相信朋友们都看过这个零基础学习Python的开篇了
763 0
源码安装Python学会有用还能装逼 | 解决各种坑

推荐镜像

更多