TOPSIS-AISM联用示意TOPSIS方法说明原始矩阵O规范化得到规范化矩阵N1、原始矩阵 O的特点2、无量纲化、规范化、归一化的特点无量纲化、规范化、归一化之间的关系常见的六大类归一化方法及注意事项3、规一化矩阵的特点求权重的方法2、距离公式{D+,D−}⟹{C+,C−}贴近度公式1、贴近度公式2、距离与贴近度指标的性质TOSIS的变化形式(魔改方式)
TOPSIS-AISM联用示意
TOPSIS方法说明
流程图中纵向的过程即为TOPSIS方法的流程。
TOPSIS简介。
TOPSIS (Technique for Order Preference by Similarity to an Ideal Solution )法是C.L.Hwang和K.Yoon于1981年首次提出,TOPSIS法根据有限个评价对象与理想化目标的接近程度进行排序的方法,是在现有的对象中进行相对优劣的评价。TOPSIS法是一种逼近于理想解的排序法,该方法只要求各效用函数具有单调递增(或递减)性就行。TOPSIS法是多目标决策分析中一种常用的有效方法,又称为优劣解距离法。该方法又被称为“双基点法”
TOPSIS重要基本概念与原理
“正理想解”和“负理想解”是TOPSIS法的最基本的概念。
离正理想点(最好的解、最佳点、最优解、最大极值点)的距离越远,效果最差,即为负向指标。因为其数值越大越差,数值越小越牛逼。
离负理想点(最差的解、最差点、最劣解、最差极值点)的距离越远,效果最好,即为正向指标。因为其数值越小越牛逼,数值越大越差。
贴近度、相似度是TOPSIS法的另外一个重要概念。
越贴近正理想点,即数值越大,效果最大,即为正向指标。
越贴近负理想点,即数值越大,效果最差,即为为向指标。
原始矩阵O规范化得到规范化矩阵N
1、原始矩阵 O的特点
第一、每一列(指标、维度、属性)的性质为如下四大类
对于振荡性指标与周期性指标,需要先进行转化,转化成正向指标或者负向指标进行处理这样才能保证每一列有严格的可比性。
第二、每一列(指标、维度、属性)都转化成数值的特征,每一列都是同一量纲。其中描述性的比较需要转化成数值型的比较
无量纲化式特别注意:为非数值型的属性,则需要转化成数值型的数据进行处理。
如描述性的属性,即非正规(Non-normal)模糊数,又称为一般性模糊数 (Generalized Fuzzy Numbers)可转化成五分制、十分制、百分制或者特定的数值。该数值可以通过特定的模糊运算进行转化。
其中五分制是最常见的模糊数值的转化。
第三、原始矩阵的预处理——在进行规范化之前,原始矩阵的每列必须是正向指标,或者负向指标。
设某物种最适合的生长的酸碱环境为6.3-7.3区间,偏离此区间成线性的危害。酸碱度分别为8.2,7.1,6.9,5.3,6.1对该物种的危害可进行如下换算。
对于上面的震荡类区间数,周期性数值,一般要转化成正向指标或者负向指标两类
2、无量纲化、规范化、归一化的特点
无量纲化、规范化、归一化之间的关系
无量纲化(nondimensionalize 或者dimensionless)是指通过一个合适的变量替代,将一个涉及物理量的方程的部分或全部的单位移除,以求简化实验或者计算的目的,是科学研究中一种重要的处理思想。
无量纲化方法选择的标准:
① 客观性。无量纲化所选择的转化公式要能够客观地反映指标实际值与指标评价值之间的对应关系。要做到客观性原则,需要评价专家对被评价对象的历史信息做出深入彻底的分析和比较,找出事物发展变化的转折点,才能够确定合适的无量纲化方法。
② 可行性。即所选择的无量纲化方法要确保转化的可行性各种方法各有特点,各有千秋,应用时应当加以注意。
③ 可操作性。即要确保所选方法具有简便易用的特点,并不是所有的非线性无量纲化方法都比线性无量纲化方法更加精确。评价不是绝对的度量,在不影响被评价对象在评价中的影响程度的前提下,可以使用更为简便的线性无量纲化方法代替曲线关系。
无量纲化、规范化、归一化是包含关系。无量纲化的概念最广
归一化方法是指,经过归一化计算后,得到的矩阵,矩阵值都在[0,1]之间。
常见的六大类归一化方法及注意事项
选择归一化方式的时候,一定要对原始矩阵进行预处理。最核心的是每一列的属性一定要是正向指标或者负向指标。每一列数据之间的差异不会出现数量级的差异的时候,一般用极差法来进行归一化。
3、规一化矩阵的特点
第一、归一化矩阵N中的指标都是正向指标
第二、采用极差法得到的归一化矩阵N中每一列中的最大值为1,最小值为0。
带权重的距离公式是从规范化矩阵到距离矩阵的核心内容。此处分为求权重的方法与距离公式两个部分。
求权重的方法
通常来说采用TOPSIS方法采用的是客观法,因为客观法可以利用当前的数据直接求出权重,计算上非常方便。常见的客观赋权法如下:
※变异系数(Coefficient of variation)变异系数又称“标准差率”,是衡量资料中各观测值变异程度的另一个统计量。当进行两个或多个资料变异程度的比较时,如果度量单位与平均数相同,可以直接利用标准差来比较。如果单位和(或)平均数不同时,比较其变异程度就不能采用标准差,而需采用标准差与平均数的比值(相对值)来比较。这是一个常用的方法
计算公式:
※复相关系数(multiple correlation coefficient)是常用的一种求权重的方法。它是指一个随机变量与某一组随机变量间线性相依性的度量。该方法又叫独立权系数法。
※CRITIC方法(Criteria Importance Though Intercrieria Correlation)。CRITIC方法是由Diakoulaki提出的一种客观权重赋权法。它的基本思路是确定指标的客观权数以两个基本概念为基础。一是对比强度,它表示同一指标各个评价方案取值差距的大小,以标准差的形式来表现,即标准化差的大小表明了在同一指标内各方案的取值差距的大小,标准差越大各方案的取值差距越大。二是评价指标之间的冲突性,指标之间的冲突性是以指标之间的相关性为基础,如两个指标之间具有较强的正相关,说明两个指标冲突性较低。
设 表示第个指标(维度,分量)所包含的信息量,则 可以表示为:
其中的计算即相关系数的计算是关键。
其中转化到规范化矩阵其中分别对应规范化矩阵的第x,y列的系列值此相关系数为简单相关系数
※熵权法(the entropy weight method 简称EWM)是脱胎于信息论基本原理的解释,信息是系统有序程度的一个度量,熵是系统无序程度的一个度量;如果指标的信息熵越小,该指标提供的信息量越大,在综合评价中所起作用理当越大,权重就应该越高。熵权法是常用的一种求权重的方法。它是指一个随机变量与某一组随机变量间线性相依性的度量。
计算公式:
☆ 第 项指标下第 个样本值占该指标的比重:
☆ 第 项指标(列)的熵值:由于自然对数或者是以正数为底取对数无意义,对于规范化(归一化)矩阵要专门处理!!
☆ 第 项指标(列)的差异系数:
☆ 第 项指标(列)的权重:
※反熵权法(the anti-entropy weight method 简称anti-EWM)其理念来自变异系数与熵权的概念,它认为指标的差异越大,反熵越大的理念,反熵越大,对应的权重越高。
※主成分分析(Principal Component Analysis,PCA), 是一种统计方法,也是快用烂了的一种方法,spss,matlab,python都有这玩意的工具包。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。 主成分分析首先是由K.皮尔森(Karl Pearson)对非随机变量引入的,尔后H.霍特林将此方法推广到随机向量的情形。信息的大小通常用离差平方和或方差来衡量。此方法为常用的方法,它最大好处并不是求出各维度的权重,而是可以通过合并与抛弃部分维度,从总体上减少维度,使得分析的内容减少,模型更简洁且有说服力。它深刻的体现了,简洁就是美,堆出来的东西很可能里面是一堆垃圾信息。
※因子分析权数法(Factor analysis weight method FAM), 这种方法也快用烂了,一般的用SPSS的基本都是用到这玩意。因子分析是指研究从变量群中提取共性因子的统计技术。最早由英国心理学家C.E.斯皮尔曼提出。他发现学生的各科成绩之间存在着一定的相关性,一科成绩好的学生,往往其他各科成绩也比较好,从而推想是否存在某些潜在的共性因子,或称某些一般智力条件影响着学生的学习成绩。因子分析可在许多变量中找出隐藏的具有代表性的因子。将相同本质的变量归入一个因子,可减少变量的数目,还可检验变量间关系的假设。
2、距离公式
{D+,D−}⟹{C+,C−}贴近度公式
1、贴近度公式
2、距离与贴近度指标的性质
※距离正理想点距离越远效果越差,D+为负向指标。
※距离负理想点距离越远效果越好,D−为正向指标。
※越贴近距离正理想点数值越大越优,C+为正向指标。
※越贴近距离负理想点数值越大越差,C−为负向指标。
上述4个指标性质容易搞混
TOSIS的变化形式(魔改方式)
由流程图可知,规范化方法有6种,求权重方法10种,距离公式60种,贴近度公式3种。
6×10×60×3=108006×10×60×3=10800
在上述变化中距离公式的选择与贴近度公式是最重要的变化部分。