文档备案控制台

开发者社区大数据文章正文

Python数据分析之dataframe的groupby

2017-05-14 1483

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 大家都知道数据库有groupby函数，今天给大家讲讲dataframe的groupby函数。groupby函数还是以上文的数据为例子，进行讲解，首先读入数据，通过groupby聚合数据。

大家都知道数据库有groupby函数，今天给大家讲讲dataframe的groupby函数。

groupby函数

还是以上文的数据为例子，进行讲解，首先读入数据，通过groupby聚合数据。（该数据为简书it互联网一段时间的文章收录信息）

import pandas as pd
import pymysql
conn = pymysql.connect(host='localhost', user='root', passwd='123456', db='test', port=3306, charset='utf8')
jianshu = pd.read_sql('select * from jianshu1',conn)
group_user = jianshu.groupby('user')
group_user.groups

可以看出返回的有用户id和所在的索引位置以及数据类型。通过下面代码计算有多少用户。

len(group_user.groups)
#result 543

通过size方法进行统计显示：

size_user = group_user.size()
size_user

进行排序，取前十的用户。

sort_user = size_user.sort_values(ascending=False)
sort_user[0:10]

highcharts绘图

import charts
series = [{'name': 'Apple','data': [10],'type': 'column'},{'name': 'Android','data': [5],'type': 'column'},{'name': 'Other','data': [5],'type': 'column'}]
charts.plot(series,show='inline')

我们需要把数据整合为highcharts能识别的数据结构，然后进行绘制。

series1 = []
for i in a.index:
    data = {
        'name':i,
        'data':[a[i]],
        'type':'column'
    }
    series1.append(data)
charts.plot(series1,options=dict(title=dict(text='投稿前十用户')))

这里的a是前十的用户数据，也就是sort_user[0:10]。
最后祝愿全天下母亲节日快乐

文章标签：

Python

索引

数据挖掘

关键词：

Python数据分析dataframe

是罗罗攀啊

目录

相关文章

凉凉心.

|

10月前

|

Java 数据处理索引

（Pandas）Python做数据处理必选框架之一！（二）：附带案例分析；刨析DataFrame结构和其属性；学会访问具体元素；判断元素是否存在；元素求和、求标准值、方差、去重、删除、排序...

DataFrame结构每一列都属于Series类型，不同列之间数据类型可以不一样，但同一列的值类型必须一致。 DataFrame拥有一个总的 idx记录列，该列记录了每一行的索引在DataFrame中，若列之间的元素个数不匹配，且使用Series填充时，在DataFrame里空值会显示为NaN；当列之间元素个数不匹配，并且不使用Series填充，会报错。在指定了index 属性显示情况下，会按照index的位置进行排序，默认是 [0,1,2,3,...] 从0索引开始正序排序行。

凉凉心.

691 0 1

站大爷

|

11月前

|

数据采集数据可视化数据挖掘

Python数据分析实战：Pandas处理结构化数据的核心技巧

在数据驱动时代，结构化数据是分析决策的基础。Python的Pandas库凭借其高效的数据结构和丰富的功能，成为处理结构化数据的利器。本文通过真实场景和代码示例，讲解Pandas的核心操作，包括数据加载、清洗、转换、分析与性能优化，帮助你从数据中提取有价值的洞察，提升数据处理效率。

站大爷

523 3 3

站大爷

|

数据采集数据可视化搜索推荐

Python数据分析全流程指南：从数据采集到可视化呈现的实战解析

在数字化转型中，数据分析成为企业决策核心，而Python凭借其强大生态和简洁语法成为首选工具。本文通过实战案例详解数据分析全流程，涵盖数据采集、清洗、探索、建模、可视化及自动化部署，帮助读者掌握从数据到业务价值的完整技能链。

站大爷

1401 0 0

Q一个好的名字容易让人记住你2483558220

|

10月前

|

数据可视化大数据关系型数据库

基于python大数据技术的医疗数据分析与研究

在数字化时代，医疗数据呈爆炸式增长，涵盖患者信息、检查指标、生活方式等。大数据技术助力疾病预测、资源优化与智慧医疗发展，结合Python、MySQL与B/S架构，推动医疗系统高效实现。

Q一个好的名字容易让人记住你2483558220

448 3 3

游客moiomvrp3vyac2

|

机器学习/深度学习数据可视化数据挖掘

使用Python进行数据分析的入门指南

本文将引导读者了解如何使用Python进行数据分析，从安装必要的库到执行基础的数据操作和可视化。通过本文的学习，你将能够开始自己的数据分析之旅，并掌握如何利用Python来揭示数据背后的故事。

游客moiomvrp3vyac2

395 5 5

Q一个好的名字容易让人记住你2483558220

|

11月前

|

数据可视化数据挖掘大数据

基于python大数据的水文数据分析可视化系统

本研究针对水文数据分析中的整合难、分析单一和可视化不足等问题，提出构建基于Python的水文数据分析可视化系统。通过整合多源数据，结合大数据、云计算与人工智能技术，实现水文数据的高效处理、深度挖掘与直观展示，为水资源管理、防洪减灾和生态保护提供科学决策支持，具有重要的应用价值和社会意义。

Q一个好的名字容易让人记住你2483558220

383 1 1

Q一个好的名字容易让人记住你2483558220

|

12月前

|

存储数据挖掘大数据

基于python大数据的用户行为数据分析系统

本系统基于Python大数据技术，深入研究用户行为数据分析，结合Pandas、NumPy等工具提升数据处理效率，利用B/S架构与MySQL数据库实现高效存储与访问。研究涵盖技术背景、学术与商业意义、国内外研究现状及PyCharm、Python语言等关键技术，助力企业精准营销与产品优化，具有广泛的应用前景与社会价值。

Q一个好的名字容易让人记住你2483558220

1166 2 3

Echo_Wish

|

机器学习/深度学习数据采集数据可视化

Python数据分析，别再死磕Excel了！

Python数据分析，别再死磕Excel了！

Echo_Wish

526 2 3

蓝易云

|

Python

解决Python报错：DataFrame对象没有concat属性的多种方法（解决方案汇总）

总的来说，解决“DataFrame对象没有concat属性”的错误的关键是理解concat函数应该如何正确使用，以及Pandas库提供了哪些其他的数据连接方法。希望这些方法能帮助你解决问题。记住，编程就像是解谜游戏，每一个错误都是一个谜题，解决它们需要耐心和细心。

蓝易云

662 15 15

热门文章

最新文章

AI时代Python金融大数据分析实战：ChatGPT让金融大数据分析插上翅膀

Python DataFrame初学者指南：轻松上手构建数据表格

Python 图像处理实用指南：6~10

python datetime模块简单记录

python中pickle使用学习-字典小程序函数化

Python 学习笔记 - 生成器和迭代器

Python中的list

Python 目录操作

【Python】已解决：ERROR: Could not find a version that satisfies the requirement easyocr (from versions: n

Python编写的10个小游戏完整版

基于python大数据技术的医疗数据分析与研究

如何构建企业级数据智能体：Data Agent 开发实践

构建企业级数据分析助手：Data Agent 开发实践

数据分析真能让音乐产业更好听吗？——聊聊大数据在音乐里的那些事

通义灵码产品演示：数据库设计与数据分析

StarRocks Connect 2025 圆满落幕：AI Native 时代，数据分析未来已来

HiChIP 数据分析: 差异 Loop 检测

HiChIP 数据分析: 鉴定 Loops

基于python大数据的水文数据分析可视化系统

基于python大数据的用户行为数据分析系统

相关课程

更多

Python Web开发基础

Python爬虫实战

Python常用数据科学库

Python网络爬虫实战

Python完全自学手册图文教程

Python基础快速入门实战教程

相关电子书

更多

From Python Scikit-Learn to Sc

Data Pre-Processing in Python:

双剑合璧-Python和大数据计算平台的结合

推荐镜像

更多

python-release

下一篇

一条命令迁移，帮你实现 OpenClaw 与 Hermes Agent 记忆互通！