数据包络分析法 | 兔子帮の博客

数据包络分析法简介

数据包络分析方法(Data Envelopment Analysis,DEA)是运筹学、管理科学与数理经济学交叉研究的一个新领域。它是根据多项投入指标和多项产出指标，利用线性规划的方法，对具有可比性的同类型单位(称为决策单元DMU)进行相对有效性评价的一种数量分析方法。DEA方法及其模型自1978年由美国著名运筹学家A.Charnes和W.W.Cooper提出以来，已广泛应用与不同行业及部门，并且在处理多指标投入和多指标产出方面，体现了其得天独厚的优势。该方法最初主要用于对一些非盈利部门(如教育、卫生、政府机构)的运转的有效性的评价；后来被用于更广泛的领域(如金融、经济、项目评估等等)。

一个部门的运转往往需要多项投入，也会有多项产出。例如，对大学一个系的投入包括：教师、教师的工资、办公经费、文献资料费等等；而这个系的产出包括：培养本科生和研究生、发表的论文、完成的科研项目等等。DEA可以对若干个同类型的这种部门或单位(它们有相同的目标和任务、有相同的输入和输出指标、有相同的外部环境)进行相对有效性的评价。

数据包络分析法数学模型

设有n个决策单元DMUi(1≤i≤n)。每一个单元DMUi有m项输入x1i，x2i，···，xmi和s项输出y1i，y2i，···，ysi(其中xji，yji>0)。则有以下输入输出矩阵：

将DMUi的输入和输出记为向量形式： xi = (x1ix2i,···,xmi)T, yi = (y1iy2i,···,ysi)T 则以上矩阵可简记为：

记 X = (x1,x2,···,xn)T, Y = (y1,y2,···,yn)T 并称X为多指标输入矩阵，Y为多指标输出矩阵。设 v = (v1,v2,···,vm)T, u = (u1,u2,···,us)T 分别是输入和输出的权向量，则DMUi的总输入Ii和总输出Oi分别为： Ii = (v1x1i+v2x2i+···+vmxmi) = xiTv, Oi = (u1y1iu2y2i+···+usysi) = yiTu 显然，总输入Ii越小，总输出Oi越大，则DMUi的效率越高。为此，DEA用总输出与总输入之比的大小来衡量DMUi的有效性。令 $$ E_{ii}=\frac{O_i}{I_i}=\frac{y_i^Tu}{x_i^Tv} $$ Eii称为DMUi的效率评价指数。在上式中，权向量u和v都是待定的，它们的每一个分量都是非负的(记作u ≥ 0, v ≥ 0)。对每一个DMUi，我们求使得Eii达到最大值的权向量。因此，得到DEA的C2R的模型(={P}即表达式)：对每一个DMUi，解决以下极大化问题： $$ \left\{ \begin{array}{lr} max\frac{y_i^Tu}{x_i^Tv}=E_{ii}, & \\ s.t. \frac{y_i^Tu}{x_i^Tv}\leq1(1 \leq j \leq n), & u \geq 0, v \geq 0 \end{array} \right. $$ 这是一个分式规划问题。若令 $$ t=\frac{1}{x_i^Tv}, w=tv, \mu=tu $$ 则可化为等价的线性规划问题： $$ \left\{ \begin{array}{lr} max y_i^T\mu=E_{ii}, & \\ s.t. y_j^T\mu\leq x_j^T\mu (1 \leq j \leq n), & x_i^Tw=1, w \geq 0, \mu \geq 0 \end{array} \right. $$ 线性规划(P即表达式)的解wi*，μi*称为DMUi的最佳权向量，它们是使DMUi的效率值Eii达到最大值的权向量。注意：作为线性规划的解，wi*和μi*不是唯一的。

解判定相关定义及定理

定义1 若线性规划(P)的解wi*，μi*满足：Eii = yiTμi* = 1，则称DMUi为弱DEA有效(C2R)的；(2) 若线性规划(P)的解中存在解wi* > 0, μi* > 0并且Eii = yiTμi* = 1，则称DMUi为DEA有效(C2R)的。

为了便于检验DEA的有效性，一般考虑(P)的对偶模型的等式形式(带有松弛变量且具有非阿基米德无穷小ε)，记为Dε： $$ \left\{ \begin{array}{lr} min(\theta-\varepsilon(e_1^Ts^-+e_2^Ts^+)), & \\ s.t \sum_{j=1}^{n}\lambda_jx_j+s^-=\theta x_i, \sum_{j=1}^{n}\lambda_jy_j-s^+=y_i, & \\ \lambda\geq0, s^-\geq0, s^+\geq0 \end{array} \right. $$ 其中，s− = (s1−,s2−,···,sm−)是m项输入的松弛变量；s+ = (s1+,s2+,···,ss+)是s项输出的松弛变量；λ = (λ1,λ2,···,λn)是n个DMU的组合系数；e1T = (1,1,···,1)1 × m, e2T = (1,1,···,1)1 × s; ε是一个很小的正数(一般取ε = 10−6)。

定理设线性规划(Dε)的最优解为λ*, s*−, s*+, θ*，则

若θ = 1，则DMU为弱DEA有效(CR)的；

若θ = 1且s = 0, s = 0，则DMU为DEA有效(CR)的。

例题讲解

问题描述

设有某大学的同类型的五个系DMUi(1≤i≤5)在一学年内的投入和产出的数据如下：

其中，运转经费指一学年内维持该系正常运转的各种费用，如行政办公费、图书资料费、差旅费等等。求解各系的相对效率并进行评价。

MATLAB求解过程

由前文介绍可知，要计算一个DMUi的相对效率值并讨论其(弱)有效性，须解一个线性规划；若要计算所有DMUi(1≤i≤n)的相对效率值，则须解n个线性规划，其计算量比较大，一般须利用计算机进行计算。我们利用数学软件MATLAB编写了解模型(P)和(Dε)的程序，比较方便地解决了DEA的计算量大的和计算复杂的问题。

MATLAB强大的矩阵运算能力和方便、直观的编程功能是我们选择它作为编写DEA应用程序的原因。诚然，LINDO或LINGO是解线性规划问题的专业软件，但它们缺乏方便的编程功能和矩阵输入功能，在解一系列线性规划时，它们不如MATLAB方便。此外，它们的普及程度远不如MATLB。因此，我们认为MATLAB是编写DEA应用程序的最佳软件之一。

MATLAB所解的线性规划的标准形式是极小化问题： $$ \left\{ \begin{array}{lr} min f^*w, & \\ s.t. A^*w \leq b, Aeq^*w = beq, & LB \leq w \leq UB \end{array} \right. $$ 其中，w是变量，f是目标函数的系数向量，A是不等式约束的系数矩阵，Aeq是等式约束的系数矩阵，LB和UB分别是变量的下界和上界。

MATLAB解线性规划的语句为：

如果要解极大化问题 maxf*w，只须解极小化问题 min(−f)*w。

下面，我们给出模型(P)和(Dε)的MATLAB程序。

程序一(模型(P)的MATLAB程序)

程序二(模型(Dε)的MATLAB程序)

由程序一，得到各系的相对效率值： E11 = 1.0000, E22 = 0.8982, E33 = 1.0000, E44 = 0.8206, E55 = 1.0000 以及各项投入和产出的权向量：

由定义，DMU1, DMU3和DMU5至少是弱有效的；DMU2和DMU4是非弱有效的。为了确认DMU1, DMU3和DMU5的有效性并分析DMU2和DMU4非有效的原因，须利用模型(Dε)。

由程序二，得本问题的解：

由以上解可以看出：DMU1, DMU3和DMU5的解中 θ* = 1且松弛变量s*− = 0, s*+ = 0，故由定理知，这几个系是相对有效的。DMU2和DMU4的非有效性也可以在以上解中看得一清二楚。以DMU2为例，根据有效性的经济意义，在不减少各项输出的前提下，构造一个新的DMU2： DMU2 = 0.8472 * DMU1 + 0.1417 * DMU3 = [62.8750,154.4083,56.5278,80.5278,13.0000,25.0000,4.0972]T 可使DMU2的投入按比例减少的原投入的0.8982( = θ2*)倍，并且(由非零的松弛变量可知)还可以进一步减少教职工工资25.2345万元、减少运转费用105.1508万元、多培养本科生20人、多完成2项科研项目。对DMU4的非有效性可作类似的经济解释。

修改记录

2020-12-10， @刘哲恺重新整理

2018-01-28， @李婧松吴娴王浥清创建初始页面

参考文献

盛昭翰. DEA 理论、方法与应用. 科学出版社, 1996.↩︎