数据包络分析(Data Envelopment Analysis, DEA)详解与Python代码示例

本文涉及的产品
实时计算 Flink 版,1000CU*H 3个月
实时数仓Hologres,5000CU*H 100GB 3个月
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
简介: 数据包络分析(Data Envelopment Analysis, DEA)详解与Python代码示例

数据包络分析(Data Envelopment Analysis, DEA)详解与Python代码示例

一、数据包络分析(DEA)详解

数据包络分析(DEA)是一种非参数的评价方法,主要用于评估具有多个投入和多个产出的决策单元(Decision Making Units, DMUs)的相对效率。DEA方法最初由A.Charnes和W.W.Cooper在1978年提出,现已广泛应用于生产管理、金融分析、教育评估等多个领域。

DEA的核心思想是通过比较不同DMUs的输入和输出数据,确定一个效率前沿(Efficiency Frontier),即所有DMUs中效率最高的集合。位于效率前沿上的DMUs被认为是相对有效的,而位于效率前沿下方的DMUs则被认为是相对无效的。DEA方法可以帮助管理者识别出效率低下的DMUs,并为其改进提供方向。

DEA模型通常分为两类:CRS(Constant Returns to Scale)模型和VRS(Variable Returns to Scale)模型。CRS模型假设DMUs的规模效率是恒定的,即输入和输出之间存在线性关系;而VRS模型则假设DMUs的规模效率是可变的,即输入和输出之间存在非线性关系。在实际应用中,可以根据具体情况选择合适的模型。

二、Python代码示例

以下是一个使用Python实现DEA模型的简单示例。这里我们采用CRS模型(也称为CCR模型),并使用Gurobi作为优化求解器。请注意,为了运行此代码,您需要安装Gurobi和相应的Python库。

import gurobipy as gp
import pandas as pd

# 假设我们有三个DMUs(A, B, C),每个DMUs有两个输入(x1, x2)和两个输出(y1, y2)
inputs = pd.DataFrame({
   
    'DMU': ['A', 'B', 'C'],
    'x1': [2, 1, 3],
    'x2': [3, 2, 4]
})
outputs = pd.DataFrame({
   
    'DMU': ['A', 'B', 'C'],
    'y1': [4, 3, 6],
    'y2': [5, 4, 7]
})

# 合并输入和输出数据
data = pd.merge(inputs, outputs, on='DMU')

# 设置Gurobi模型
m = gp.Model('DEA_CCR')

# 定义变量
lambdas = m.addVars(data.shape[0], name='lambda')
OE = m.addVar(name='OE', lb=0, ub=1, vtype=gp.GRB.CONTINUOUS)
s_neg = m.addVars(data.shape[1]-2, name='s_neg')  # 输入的松弛变量
s_pos = m.addVars(2, name='s_pos')  # 输出的松弛变量

# 设置目标函数(最大化OE)
m.setObjective(OE, gp.GRB.MAXIMIZE)

# 设置约束条件
for i in range(data.shape[0]):
    if i == 0:  # 对于第一个DMU,设置OE为其效率值
        m.addConstr(OE * data.loc[i, 'x1':] <= gp.quicksum(lambdas[j] * data.loc[j, 'x1':] for j in range(data.shape[0])))
        m.addConstr(data.loc[i, 'y1':] >= gp.quicksum(lambdas[j] * data.loc[j, 'y1':] for j in range(data.shape[0])) - s_pos)
    else:  # 对于其他DMU,设置其权重为非负
        m.addConstr(lambdas[i] >= 0)

# 设置松弛变量为非负
for var in s_neg:
    m.addConstr(var >= 0)
for var in s_pos:
    m.addConstr(var >= 0)

# 求解模型
m.optimize()

# 输出结果
for v in m.getVars():
    print(v.varName, v.x)

注释

  • gurobipy是Gurobi优化求解器的Python接口,用于构建和求解优化模型。
  • pd.DataFrame用于存储和处理输入和输出数据。
  • m.addVars用于添加决策变量,包括DMUs的权重(lambdas)、效率值(OE)以及松弛变量(s_negs_pos)。
  • 目标函数设置为最大化效率值(OE)。
  • 约束条件包括输入
相关文章
|
25天前
|
存储 算法 调度
【复现】【遗传算法】考虑储能和可再生能源消纳责任制的售电公司购售电策略(Python代码实现)
【复现】【遗传算法】考虑储能和可再生能源消纳责任制的售电公司购售电策略(Python代码实现)
133 26
|
10天前
|
数据采集 Web App开发 数据可视化
Python零基础爬取东方财富网股票行情数据指南
东方财富网数据稳定、反爬宽松,适合爬虫入门。本文详解使用Python抓取股票行情数据,涵盖请求发送、HTML解析、动态加载处理、代理IP切换及数据可视化,助你快速掌握金融数据爬取技能。
205 1
|
11天前
|
Java 数据挖掘 数据处理
(Pandas)Python做数据处理必选框架之一!(一):介绍Pandas中的两个数据结构;刨析Series:如何访问数据;数据去重、取众数、总和、标准差、方差、平均值等;判断缺失值、获取索引...
Pandas 是一个开源的数据分析和数据处理库,它是基于 Python 编程语言的。 Pandas 提供了易于使用的数据结构和数据分析工具,特别适用于处理结构化数据,如表格型数据(类似于Excel表格)。 Pandas 是数据科学和分析领域中常用的工具之一,它使得用户能够轻松地从各种数据源中导入数据,并对数据进行高效的操作和分析。 Pandas 主要引入了两种新的数据结构:Series 和 DataFrame。
199 0
|
14天前
|
测试技术 Python
Python装饰器:为你的代码施展“魔法”
Python装饰器:为你的代码施展“魔法”
196 100
|
14天前
|
开发者 Python
Python列表推导式:一行代码的艺术与力量
Python列表推导式:一行代码的艺术与力量
228 95
|
22天前
|
Python
Python的简洁之道:5个让代码更优雅的技巧
Python的简洁之道:5个让代码更优雅的技巧
177 104
|
22天前
|
开发者 Python
Python神技:用列表推导式让你的代码更优雅
Python神技:用列表推导式让你的代码更优雅
308 99
|
14天前
|
缓存 Python
Python装饰器:为你的代码施展“魔法
Python装饰器:为你的代码施展“魔法
130 88
|
23天前
|
缓存 监控 算法
唯品会item_search - 按关键字搜索 VIP 商品接口深度分析及 Python 实现
唯品会item_search接口支持通过关键词、分类、价格等条件检索商品,广泛应用于电商数据分析、竞品监控与市场调研。结合Python可实现搜索、分析、可视化及数据导出,助力精准决策。
|
12天前
|
JSON API 数据安全/隐私保护
Python采集淘宝拍立淘按图搜索API接口及JSON数据返回全流程指南
通过以上流程,可实现淘宝拍立淘按图搜索的完整调用链路,并获取结构化的JSON商品数据,支撑电商比价、智能推荐等业务场景。

推荐镜像

更多