熵权法
00 分钟
2024-7-28
信息熵的推导
信息熵,是对可能产生信息量的期望,也是在度量事件发生概率的变异程度:样本概率变异程度大,不确定度越小,信息熵越小
因此,套用信息熵的计算方法,得到相对熵,用来衡量量的变异程度

熵权法概览

学科分属

熵权法隶属于应用数学中的信息论学科分支1

历史发展

熵最先由Claude Shannon引入信息论,目前已经在工程技术、社会经济等领域得到了非常广泛的应用。照信息论基本原理的解释,信息是系统有序程度的一个度量,熵是系统无序程度的一个度量;如果指标的信息熵越小,该指标提供的信息量越大,在综合评价中所起作用理当越大,权重就应该越高。

熵权法模型介绍

定义介绍

熵权法的基本思路是根据指标变异性的大小来确定客观权重。一般来说,若某个指标的信息熵Ej越小,表明指标值得变异程度越大,提供的信息量越多,在综合评价中所能起到的作用也越大,其权重也就越大。相反,某个指标的信息熵Ej越大,表明指标值得变异程度越小,提供的信息量也越少,在综合评价中所起到的作用也越小,其权重也就越小。

熵权法赋权步骤

数据标准化

将各个指标的数据进行标准化处理。假设给定了k个指标X1,X2,…Xk,其中Xi = x1, x2, ...xn。假设对各指标数据标准化后的值为Y1, Y2, ...Yk,那么

求各指标的信息熵

根据信息论中信息熵的定义,一组数据的信息熵
其中$P_{ij} = Y_{ij} / \sum_{i=1}^n Y_{ij}$,如果Pij = 0,则定义limpij → 0pijln pij = 0

确定各指标的权重

根据信息论中信息熵的计算公式,计算出各个指标的信息熵为
通过信息熵计算各指标的权重:

熵权法与层次分析法(AHP)的比较

  • 熵权法
    • 优点
      • 客观性(相对于主观赋值法)
      • 适应性(用于任何确定权重的过程,也可以结合其它方法)
    • 缺点
      • 目前只在确定权重的过程中使用,所以使用范围有限
  • 层次分析法
    • 优点
      • 系统性的分析方法
      • 简洁实用的决策方法,所需定量数据信息较少
    • 不能为决策提供新方案,定量数据上,定性成分多

熵权法赋权应用

常见应用场景

熵权法一般在需要确定每个因素对总体影响的权重的过程中使用,且其可和很多模型方法结合使用。

熵权法赋权实例应用

背景介绍

某医院为了提高自身的护理水平,对拥有的11个科室进行了考核,考核标准包括9项整体护理,并对护理水平较好的科室进行奖励。下表是对各个科室指标考核后的评分结果。
科室
X1
X2
X3
X4
X5
X6
X7
X8
X9
A
100
90
100
84
90
100
100
100
100
B
100
100
78.6
100
90
100
100
100
100
C
75
100
85.7
100
90
100
100
100
100
D
100
100
78.6
100
90
100
94.4
100
10
E
100
90
100
100
100
90
100
100
8
F
100
100
100
100
90
100
100
85.7
10
G
100
100
78.6
100
90
100
55.6
100
100
H
87.5
100
85.7
100
100
100
100
100
100
I
100
100
92.9
100
80
100
100
100
100
J
100
90
100
100
100
100
100
100
100
K
100
100
92.9
100
90
100
100
100
100
但是由于各项护理的难易程度不同,因此需要对9项护理进行赋权,以便能够更加合理的对各个科室的护理水平进行评价。

数据标准化

对上表进行标准化,得到标准化的得分表。
科室
X1
X2
X3
X4
X5
X6
X7
X8
X9
A
1.00
0.00
1.00
0.00
0.50
1.00
1.00
1.00
1.00
B
1.00
1.00
0.00
1.00
0.50
1.00
1.00
1.00
1.00
C
0.00
1.00
0.33
1.00
0.50
1.00
1.00
1.00
1.00
D
1.00
1.00
0.00
1.00
0.50
1.00
0.87
1.00
1.00
E
1.00
0.00
1.00
1.00
1.00
0.00
1.00
1.00
0.00
F
1.00
1.00
1.00
1.00
0.50
1.00
1.00
0.00
1.00
G
1.00
1.00
0.00
1.00
0.50
1.00
0.00
1.00
1.00
H
0.50
1.00
0.33
1.00
1.00
1.00
1.00
1.00
1.00
I
1.00
1.00
0.67
1.00
0.00
1.00
1.00
1.00
1.00
J
1.00
0.00
1.00
1.00
1.00
1.00
1.00
1.00
1.00
K
1.00
1.00
0.67
1.00
0.50
1.00
1.00
1.00
1.00

求各指标的信息熵

根据信息熵的计算公式
$$ E_{j}=-\ln (n)^{-1} \sum_{i=1}^{n} p_{i j} \ln p_{i j} $$
可以计算出9项护理指标各自的信息熵如下:
X1
X2
X3
X4
X5
X6
X7
X8
X9
信息熵
0.95
0.87
0.84
0.96
0.94
0.96
0.96
0.96
0.96

计算各指标的权重

根据指标权重的计算公式
$$ W_{i}=\frac{1-E_{i}}{9-\sum E_{i}}(i=1,2, \ldots, 9) $$
可以得到各个指标的权重如下表所示:
X1
X2
X3
X4
X5
X6
X7
X8
X9
权重
0.08
0.22
0.27
0.07
0.11
0.07
0.07
0.07
0.07

对各科室进行评分

根据计算出的指标权重,以及对11个科室9项护理水平的评分。设Zl为第l个科室的最终得分,则
$$ Z_{l}=\sum_{i=1}^{9} X_{l i} W_{i} $$
各个科室最终得分如下
科室
A
B
C
D
E
F
G
H
I
J
K
得分
95.71
93.14
93.17
92.77
95.84
98.01
90.21
95.17
95.97
97.81
97.02

数学建模竞赛的应用

暂无

代码实现

matlab代码如下:
python代码如下:

修改记录

  • 2022-09-12,杨伟程添加内容
  • 2018-01-28, @汪海洋创建初始页面

参考文献


  1. 【评价算法】01. 熵权法确定权重↩︎
上一篇
海明校验的公式推导及讨论
下一篇
数学建模のwiki

评论
Loading...