ML之FE:对人类性别相关属性数据集进行数据特征分布可视化分析与挖掘

简介: ML之FE:对人类性别相关属性数据集进行数据特征分布可视化分析与挖掘


输出结果

image.pngimage.png

image.png


实现代码


# coding: utf8

import pandas as pd

import matplotlib.pyplot as plt

# ML之FE:对人类性别相关属性数据集进行数据特征分布可视化分析与挖掘

#1、定义数据集

# 头发(长发/短发)、身高、下巴(棱角/圆滑)、胡长(mm)、皮肤、体重

contents={"name": ['Mary', 'Bob',  'Lisa', 'Tom',  'Alan', 'Jason','Sophia', 'Aiden',  'Sarah', 'Miqi', 'Temp01', 'Temp02'],

         "age":  [ 16,     24,      19,     20,      33,     23,     29,      31,        34,      24,       27,        30],

         "Hair": ['长发', '短发',  '长发', '短发', '长发', '短发', '长发',    '长发',   '长发',  '长发',    '短发',   '长发'],

       "Height": [158,     175,     162,    170,    175,    168,    166,     169,       164,     157,      182,        161],

        "Jaw":   ['圆滑', '棱角',  '圆滑', '棱角', '圆滑', '圆滑', '圆滑',    '棱角',  '圆滑',    '圆滑',    '棱角',   '圆滑'],

       "Beard":  [2,       7,       3,       5,      2,      3,      5,        6,         3,      4,         5,         3],

        "Skin":  ['细腻', '粗糙',  '细腻', '粗糙', '细腻', '粗糙', '细腻',   '粗糙',   '细腻',   '细腻',    '粗糙',    '粗糙'],

       "Weight": [99,     143,      105,     135,    120,    160,    95,      145,      125,     112,       155,        100],

        "Sex":   ['女性', '男性', '女性',  '男性', '男性', '男性',  '女性',   '男性',  '女性',   '女性',    '男性',    '女性'],

         }

data_frame = pd.DataFrame(contents)

print(type(data_frame))

data_name = 'HumanGender_RelatedAttributes'

col_cat='Jaw'

label_name='Sex'

for col in data_frame.columns[1:-2]:

   if data_frame[col].dtypes in ['object']:

       print(col)

       # T1、采用函数

       col_cats=[col,label_name]

#         SNCountPlot(col_cats,data_frame,imgName='')

     

       # T2、自定义函数???

       x_subname = list(data_frame[col].value_counts().to_dict().keys())

       label_y1 = list(data_frame[label_name].value_counts().to_dict().keys())[0]

       label_y2 = list(data_frame[label_name].value_counts().to_dict().keys())[1]

       y1=list(data_frame[data_frame[label_name]==label_y1][col].value_counts().to_dict().values())

       y2=list(data_frame[data_frame[label_name]==label_y2][col].value_counts().to_dict().values())

       print(x_subname)

       print(label_y1,label_y2)

       print(y1,y2)

     

#       # T2、自定义函数???

#         y01Lists,y02Lists=[],[]

#         for x in x_subname:

#             if x not in data_frame[data_frame[label_name]==label_y2][col].value_counts(dropna=False).to_dict().keys():

#                 pass

#             else:

#                

#                 y01=data_frame[data_frame[label_name]==label_y1][col].value_counts(dropna=False).to_dict()[x]

#                 y02=data_frame[data_frame[label_name]==label_y2][col].value_counts(dropna=False).to_dict()[x]

#                 y01Lists.append(y01)

#                 y02Lists.append(y02)

#         print(y01Lists,y02Lists)

     

     

       DoubleBarAddText(y1,y2, col,label_name, x_subname,label_y1,label_y2,data_name)

   else:

       Num_col_Plot2_ByLabels(data_name,data_frame,label_name,col)


相关文章
|
8月前
|
存储 测试技术 对象存储
容器计算服务ACS单张GPU即可快速搭建QwQ-32B推理模型
阿里云最新发布的QwQ-32B模型拥有320亿参数,通过强化学习大幅度提升了模型推理能力,其性能与DeepSeek-R1 671B媲美,本文介绍如何使用ACS算力部署生产可用的QwQ-32B模型推理服务。
|
2月前
|
存储 监控 安全
RFID电动车车牌让出行更安全
RFID电动车车牌通过内置芯片实现车辆身份唯一识别,结合物联网技术,提升防盗、交通秩序、事故处理等多方面的出行安全,助力城市电动车智能化管理,守护市民安全出行。
|
3月前
|
安全
电脑进入bios关闭网卡的技巧
华硕电脑开机显示字符无法进入系统,提示“PXE-MOF:Exiting PXE ROM”,表明电脑正尝试从网卡启动。解决方法为进入BIOS关闭网卡启动功能。开机时连续按F2进入BIOS,切换至“Security”选项卡,找到“I/O Interface Security”设置,选择“LAN Network Interface”并设为“LOCKED”以禁用网卡启动,最后按F10保存退出即可。
506 0
|
11月前
|
人工智能 数据可视化 数据挖掘
【产品】G 端产品经理
G端产品经理在政府数字化转型中扮演着关键角色,连接政府需求与技术实现。他们负责挖掘需求、规划方案、推动跨部门协作,并监督项目进展。具体职责包括需求调研、产品规划与设计、原型制作、文档撰写及交互与视觉设计等。面对复杂多变的需求、快速更新的技术和严格的项目验收,G端产品经理需不断提升专业技能,以适应挑战并推动政府治理体系现代化。
|
监控 安全 测试技术
网络信息系统的整个生命周期
网络信息系统规划、设计、集成与实现、运行维护及废弃各阶段介绍。从企业需求出发,经过可行性研究和技术评估,详细设计系统架构,完成设备安装调试和系统集成测试,确保稳定运行,最终安全退役。
182 1
网络信息系统的整个生命周期
|
安全 网络协议 网络安全
【【安全知识】SSH远程登录方法详解】
SSH(Secure Shell)是一种安全的网络协议,用于远程登录和安全数据传输。在本文中,我们将详细介绍如何使用SSH进行远程登录。
2243 0
|
传感器 存储 物联网
新技术趋势与应用:区块链、物联网和虚拟现实的融合创新
在数字化浪潮中,区块链技术以其不可篡改的特性成为信任的基石;物联网技术通过智能设备的互联互通,将物理世界数字化;而虚拟现实技术则打造沉浸式体验,模糊现实与虚拟的边界。这三者的结合预示着一个高度互联、智能化且富有创造力的未来,其中区块链确保数据安全,物联网提供实时数据,虚拟现实则为用户带来前所未有的交互体验。本文将探讨这些技术的发展趋势和潜在应用场景,并展示它们如何共同塑造未来社会的面貌。
249 5
|
NoSQL JavaScript MongoDB
mongodb语法
mongodb语法
279 0
|
自然语言处理 运维 监控
产品解读 | 敏捷版云原生PaaS场景
更丰富的云原生应用治理能力让业务快速生长,更丰富的云原生应用治理能力让业务快速生长。
1513 73
产品解读 | 敏捷版云原生PaaS场景
|
机器学习/深度学习 人工智能 自然语言处理
【大模型】什么是大型语言模型(LLM)?
【5月更文挑战第4天】【大模型】什么是大型语言模型(LLM)?