数据包络分析法简介
数据包络分析方法(Data Envelopment
Analysis,DEA)是运筹学、管理科学与数理经济学交叉研究的一个新领域。它是根据多项投入指标和多项产出指标,利用线性规划的方法,对具有可比性的同类型单位(称为决策单元DMU)进行相对有效性评价的一种数量分析方法。DEA方法及其模型自1978年由美国著名运筹学家A.Charnes和W.W.Cooper提出以来,已广泛应用与不同行业及部门,并且在处理多指标投入和多指标产出方面,体现了其得天独厚的优势。该方法最初主要用于对一些非盈利部门(如教育、卫生、政府机构)的运转的有效性的评价;后来被用于更广泛的领域(如金融、经济、项目评估等等)。
一个部门的运转往往需要多项投入,也会有多项产出。例如,对大学一个系的投入包括:教师、教师的工资、办公经费、文献资料费等等;而这个系的产出包括:培养本科生和研究生、发表的论文、完成的科研项目等等。DEA可以对若干个同类型的这种部门或单位(它们有相同的目标和任务、有相同的输入和输出指标、有相同的外部环境)进行相对有效性的评价。
数据包络分析法数学模型
设有n个决策单元DMUi(1≤i≤n)。每一个单元DMUi有m项输入x1i,x2i,···,xmi和s项输出y1i,y2i,···,ysi(其中xji,yji>0)。则有以下输入输出矩阵:
将DMUi的输入和输出记为向量形式:
xi = (x1ix2i,···,xmi)T, yi = (y1iy2i,···,ysi)T
则以上矩阵可简记为:
记 X = (x1,x2,···,xn)T, Y = (y1,y2,···,yn)T
并称X为多指标输入矩阵,Y为多指标输出矩阵。 设 v = (v1,v2,···,vm)T, u = (u1,u2,···,us)T
分别是输入和输出的权向量,则DMUi的总输入Ii和总输出Oi分别为: Ii = (v1x1i+v2x2i+···+vmxmi) = xiTv, Oi = (u1y1iu2y2i+···+usysi) = yiTu
显然,总输入Ii越小,总输出Oi越大,则DMUi的效率越高。为此,DEA用总输出与总输入之比的大小来衡量DMUi的有效性。令
$$
E_{ii}=\frac{O_i}{I_i}=\frac{y_i^Tu}{x_i^Tv}
$$ Eii称为DMUi的效率评价指数。在上式中,权向量u和v都是待定的,它们的每一个分量都是非负的(记作u ≥ 0, v ≥ 0)。对每一个DMUi,我们求使得Eii达到最大值的权向量。因此,得到DEA的C2R的模型(={P}即表达式):对每一个DMUi,解决以下极大化问题:
$$
\left\{
\begin{array}{lr}
max\frac{y_i^Tu}{x_i^Tv}=E_{ii}, & \\
s.t. \frac{y_i^Tu}{x_i^Tv}\leq1(1 \leq j \leq n), & u \geq
0, v \geq 0
\end{array}
\right.
$$ 这是一个分式规划问题。若令 $$
t=\frac{1}{x_i^Tv}, w=tv, \mu=tu
$$ 则可化为等价的线性规划问题: $$
\left\{
\begin{array}{lr}
max y_i^T\mu=E_{ii}, & \\
s.t. y_j^T\mu\leq x_j^T\mu (1 \leq j \leq n), & x_i^Tw=1, w
\geq 0, \mu \geq 0
\end{array}
\right.
$$ 线性规划(P即表达式)的解wi*,μi*称为DMUi的最佳权向量,它们是使DMUi的效率值Eii达到最大值的权向量。注意:作为线性规划的解,wi*和μi*不是唯一的。
解判定相关定义及定理
定义1 若线性规划(P)的解wi*,μi*满足:Eii = yiTμi* = 1,则称DMUi为弱DEA有效(C2R)的;(2)
若线性规划(P)的解中存在解wi* > 0, μi* > 0并且Eii = yiTμi* = 1,则称DMUi为DEA有效(C2R)的。
为了便于检验DEA的有效性,一般考虑(P)的对偶模型的等式形式(带有松弛变量且具有非阿基米德无穷小ε),记为Dε: $$
\left\{
\begin{array}{lr}
min(\theta-\varepsilon(e_1^Ts^-+e_2^Ts^+)), & \\
s.t \sum_{j=1}^{n}\lambda_jx_j+s^-=\theta x_i,
\sum_{j=1}^{n}\lambda_jy_j-s^+=y_i, & \\
\lambda\geq0, s^-\geq0, s^+\geq0
\end{array}
\right.
$$ 其中,s− = (s1−,s2−,···,sm−)是m项输入的松弛变量;s+ = (s1+,s2+,···,ss+)是s项输出的松弛变量;λ = (λ1,λ2,···,λn)是n个DMU的组合系数;e1T = (1,1,···,1)1 × m, e2T = (1,1,···,1)1 × s; ε是一个很小的正数(一般取ε = 10−6)。
定理设线性规划(Dε)的最优解为λ*, s*−, s*+, θ*,则
- 若θ = 1,则DMU为弱DEA有效(CR)的;
i
2
- 若θ = 1且s = 0, s = 0,则DMU为DEA有效(CR)的。
- −
- +
i
2
例题讲解
问题描述
设有某大学的同类型的五个系DMUi(1≤i≤5)在一学年内的投入和产出的数据如下:
其中,运转经费指一学年内维持该系正常运转的各种费用,如行政办公费、图书资料费、差旅费等等。求解各系的相对效率并进行评价。
MATLAB求解过程
由前文介绍可知,要计算一个DMUi的相对效率值并讨论其(弱)有效性,须解一个线性规划;若要计算所有DMUi(1≤i≤n)的相对效率值,则须解n个线性规划,其计算量比较大,一般须利用计算机进行计算。我们利用数学软件MATLAB编写了解模型(P)和(Dε)的程序,比较方便地解决了DEA的计算量大的和计算复杂的问题。
MATLAB强大的矩阵运算能力和方便、直观的编程功能是我们选择它作为编写DEA应用程序的原因。诚然,LINDO或LINGO是解线性规划问题的专业软件,但它们缺乏方便的编程功能和矩阵输入功能,在解一系列线性规划时,它们不如MATLAB方便。此外,它们的普及程度远不如MATLB。因此,我们认为MATLAB是编写DEA应用程序的最佳软件之一。
MATLAB所解的线性规划的标准形式是极小化问题: $$
\left\{
\begin{array}{lr}
min f^*w, & \\
s.t. A^*w \leq b, Aeq^*w = beq, & LB \leq w \leq UB
\end{array}
\right.
$$
其中,w是变量,f是目标函数的系数向量,A是不等式约束的系数矩阵,Aeq是等式约束的系数矩阵,LB和UB分别是变量的下界和上界。
MATLAB解线性规划的语句为:
如果要解极大化问题 maxf*w,只须解极小化问题
min(−f)*w。
下面,我们给出模型(P)和(Dε)的MATLAB程序。
程序一(模型(P)的MATLAB程序)
程序二(模型(Dε)的MATLAB程序)
由程序一,得到各系的相对效率值: E11 = 1.0000, E22 = 0.8982, E33 = 1.0000, E44 = 0.8206, E55 = 1.0000
以及各项投入和产出的权向量:
由定义,DMU1, DMU3和DMU5至少是弱有效的;DMU2和DMU4是非弱有效的。为了确认DMU1, DMU3和DMU5的有效性并分析DMU2和DMU4非有效的原因,须利用模型(Dε)。
由程序二,得本问题的解:
由以上解可以看出:DMU1, DMU3和DMU5的解中
θ* = 1且松弛变量s*− = 0, s*+ = 0,故由定理知,这几个系是相对有效的。DMU2和DMU4的非有效性也可以在以上解中看得一清二楚。以DMU2为例,根据有效性的经济意义,在不减少各项输出的前提下,构造一个新的DMU2:
DMU2 = 0.8472 * DMU1 + 0.1417 * DMU3 = [62.8750,154.4083,56.5278,80.5278,13.0000,25.0000,4.0972]T
可使DMU2的投入按比例减少的原投入的0.8982( = θ2*)倍,并且(由非零的松弛变量可知)还可以进一步减少教职工工资25.2345万元、减少运转费用105.1508万元、多培养本科生20人、多完成2项科研项目。对DMU4的非有效性可作类似的经济解释。
修改记录
- 2020-12-10, @刘哲恺重新整理
- 2018-01-28, @李婧松 吴娴 王浥清创建初始页面
参考文献
- 盛昭翰. DEA 理论、方法与应用. 科学出版社, 1996.↩︎