pandas - 数据排序

简介: pandas - 数据排序

pandas - 排序


Series 排序


  1. 语法结构:Series.sort_values(ascending=True, inplace=False)

参数说明:

ascending:默认为True升序排序,为False降序排序;

inplace:是否修改原始Series;


DataFrame 排序

  1. 语法结构:DataFrame.sort_values(by, ascending=True, inplace=False)

参数说明:

by:字符串或者List<字符串>,单列排序或者多列排序;

ascending:bool或者List,升序还是降序,如果是list对应by的多列,默认升序,为False时降序;

inplace:是否修改原始DataFrame,为True时修改源数据;


实例

  1. 读取文件:以 match.csv 为例
import pandas as pd 
df = pd.read_csv("match.csv")
df


3338ad08b82f4397a148cae2a12e7798.png


  1. Series 排序
import pandas as pd 
df = pd.read_csv("match.csv")
# 按照 Number 升序排序
df["Number"].sort_values()
    输出:
    0       0.0
    291     0.0
    22      0.0
    393     0.0
    141     0.0
           ... 
    372    90.0
    5      90.0
    68     92.0
    1      99.0
    457     NaN
    Name: Number, Length: 458, dtype: float64
# 按照 Number 降序排序
df["Number"].sort_values(ascending=False)
    输出:
    1      99.0
    68     92.0
    5      90.0
    372    90.0
    398    88.0
           ... 
    347     0.0
    188     0.0
    205     0.0
    0       0.0
    457     NaN
    Name: Number, Length: 458, dtype: float64
# 也可以将文本排序
df["Name"].sort_values()
    输出:
    152      Aaron Brooks
    356      Aaron Gordon
    328    Aaron Harrison
    404     Adreian Payne
    312        Al Horford
                ...      
    270    Xavier Munford
    402       Zach LaVine
    271     Zach Randolph
    237     Zaza Pachulia
    457               NaN
    Name: Name, Length: 458, dtype: object


  1. DataFrame 排序
  • 单列排序
import pandas as pd
df =pd.read_csv('match.csv')
#按照 Number 降序排序
df.sort_values(by = "Number",ascending = False)  # 默认升序排序,ascending=True时,升序排序
#输出如下:


35032ec18d1b45d89f4206f62da0eb68.png

  • 多列排序-1——同升同降
import pandas as pd
df =pd.read_csv('match.csv')
#按照 Age 与 Number 均升序排序,不修改源数据
df.sort_values(by = ["Age","Number"],ascending=True,inplace=False)
#输出如下:


e918727a07f34ee4bb73115035a1269c.png

  • 多列排序-2——指定升降序
import pandas as pd
df =pd.read_csv('match.csv')
# 按照 Age 与 Number 排序,分别指定升序和降序
df.sort_values(by = ["Age","Number"],ascending = [True,False])  # ascending可以接受str类型,所以True与False没有加引号
#输出如下:

24cc029659ff42c2ba2a76527f8b924d.png

相关文章
|
4天前
|
数据采集 数据可视化 数据处理
Pandas高级数据处理:数据仪表板制作
《Pandas高级数据处理:数据仪表板制作》涵盖数据清洗、聚合、时间序列处理等技巧,解决常见错误如KeyError和内存溢出。通过多源数据整合、动态数据透视及可视化准备,结合性能优化与最佳实践,助你构建响应快速、数据精准的商业级数据仪表板。适合希望提升数据分析能力的开发者。
57 31
|
5天前
|
数据采集 并行计算 数据可视化
Pandas高级数据处理:数据报告生成实战指南
数据报告生成面临数据质量、计算性能、呈现形式和自动化等核心挑战。常见问题包括缺失值导致统计失真、内存溢出及可视化困难。解决方案涵盖数据清洗、分块处理、安全绘图模板等。通过模块化设计、异常处理机制和性能优化策略,如使用`category`类型、并行计算等,可大幅提升效率。最佳实践建议建立数据质量检查清单、版本控制和自动化测试框架,确保系统具备自适应能力,提升报告生成效率300%以上。
38 12
|
11天前
|
监控 物联网 数据处理
Pandas高级数据处理:数据流式计算
本文介绍了如何使用 Pandas 进行流式数据处理。流式计算能够实时处理不断流入的数据,适用于金融交易、物联网监控等场景。Pandas 虽然主要用于批处理,但通过分块读取文件、增量更新 DataFrame 和使用生成器等方式,也能实现简单的流式计算。文章还详细讨论了内存溢出、数据类型不一致、数据丢失或重复及性能瓶颈等常见问题的解决方案,并建议在处理大规模数据时使用专门的流式计算框架。
138 100
Pandas高级数据处理:数据流式计算
|
28天前
|
机器学习/深度学习 搜索推荐 数据挖掘
Pandas数据应用:广告效果评估
在数字化营销中,广告效果评估至关重要。Pandas作为Python的强大数据分析库,在处理广告数据时表现出色。本文介绍如何使用Pandas进行广告效果评估,涵盖数据读取、预览、缺失值处理、数据类型转换及常见报错解决方法,并通过代码案例详细解释。掌握这些技能,可为深入分析广告效果打下坚实基础。
41 17
|
29天前
|
数据采集 供应链 数据可视化
Pandas数据应用:供应链优化
在当今全球化的商业环境中,供应链管理日益复杂。Pandas作为Python的强大数据分析库,能有效处理库存、物流和生产计划中的大量数据。本文介绍如何用Pandas优化供应链,涵盖数据导入、清洗、类型转换、分析与可视化,并探讨常见问题及解决方案,帮助读者在供应链项目中更加得心应手。
50 21
|
30天前
|
数据采集 存储 供应链
Pandas数据应用:库存管理
本文介绍Pandas在库存管理中的应用,涵盖数据读取、清洗、查询及常见报错的解决方法。通过具体代码示例,讲解如何处理多样数据来源、格式不一致、缺失值和重复数据等问题,并解决KeyError、ValueError等常见错误,帮助提高库存管理效率和准确性。
106 72
|
1月前
|
机器学习/深度学习 数据采集 供应链
Pandas数据应用:销售预测
本文介绍如何使用Pandas进行销售预测。首先,通过获取、清洗和可视化历史销售数据,确保数据质量并理解其特征。接着,进行特征工程,构建线性回归等模型进行预测,并评估模型性能。最后,针对常见问题如数据类型不匹配、时间格式错误、内存不足和模型过拟合提供解决方案。掌握这些步骤,可有效提升销售预测的准确性,助力企业优化库存管理和提高客户满意度。
55 17
|
1月前
|
机器学习/深度学习 存储 算法
Pandas数据应用:客户流失预测
本文介绍如何使用Pandas进行客户流失预测,涵盖数据加载、预处理、特征工程和模型训练。通过解决常见问题(如文件路径错误、编码问题、列名不一致等),确保数据分析顺利进行。特征工程中创建新特征并转换数据类型,为模型训练做准备。最后,划分训练集与测试集,选择合适的机器学习算法构建模型,并讨论数据不平衡等问题的解决方案。掌握这些技巧有助于有效应对实际工作中的复杂情况。
142 95
|
1月前
|
数据采集 存储 算法
Pandas数据应用:市场篮子分析
市场篮子分析是一种用于发现商品间关联关系的数据挖掘技术,广泛应用于零售业。Pandas作为强大的数据分析库,在此领域具有显著优势。本文介绍了市场篮子分析的基础概念,如事务、项集、支持度、置信度和提升度,并探讨了数据预处理、算法选择、参数设置及结果解释中的常见问题与解决方案,帮助用户更好地进行市场篮子分析,为企业决策提供支持。
70 29
|
1月前
|
机器学习/深度学习 BI 定位技术
Pandas数据应用:用户细分
用户细分是数据分析和商业智能中的关键步骤,通过将用户群体划分为不同子集,企业可以更精准地了解用户需求并制定营销策略。Pandas 是 Python 中常用的数据处理库,支持高效的数据操作。使用 Pandas 进行用户细分包括数据准备、清洗、特征工程、细分和结果分析等步骤。常见问题如数据类型不一致、内存不足等可通过相应方法解决。Pandas 简化了用户细分流程,帮助获取有价值的洞察。
59 24