学位专题

目录>
<
DOI:10.7666/d.D604782

线性模型中自变量相对重要性的Shapley值估计与有偏估计

贾孝霞
宁波大学
引用
研究目的:本研究共有两个目的:第一,研究线性回归模型因变量总变异(R2)在各个自变量中的分割问题(相对重要性估计)与对策理论中求解Shapley值的同构性以及自变量相对重要性估计的前提条件(期望准则),根据对策理论 Shapley值对自变量所有组合中逐步引入自变量时模型的R2增加值的序列与平均值,从而建立基于 Shapley值法的自变量相对性估计方法,并与几种现存方法进行比较。第二,考虑到当自变量间存在多重共线性时,用普通最小二乘法建立的回归模型可能不稳定甚至是失真的,那么估计自变量相对重要性也是多余的。因此,本研究分别用实际例子及大量模拟数据探索分析乘积尺度、相对权重在偏最小二乘回归模型中自变量相对重要性估计的应用。  研究方法:对于第一个研究目的,本研究采用Shapley在1953年提出的对策理论法求解 Shapley值法对自变量相对重要性进行估计。对第二个目的,本研究采用乘积尺度法和相对权重法的思路,模拟试验数据采用Monte Calro法进行模拟。所有的计算结果利用SAS9.2编程实现。  研究结果:用对策理论建立的自变量相对重要性分析方法在实际数据中估计的结果和优势分析一致,估计结果结果均优于传统的估计方法。在用实际案例探索分析偏最小二乘回归中自变量相对重要性发现,优势分析和 Shapley值估计法不适合用于有偏估计中,采用相对权重利用自变量正交转化的思路求解的自变量相对重要性结果也不符合自变量重要性求解的前提条件,故探索乘积尺度在偏最小二乘回归中自变量相对重要性的应用。大量的模拟数据结果发现,虽然乘积尺度估计的自变量相对重要性值之和能够较好地贴近模型总变异 R2,但是估计的结果仍然存在负值,且出现负值的情况随自变量的个数增多也在急剧增加。  研究结论:对策理论的Shapley值法可以作为估计自变量相对重要性的方法,相比于其他方法,Shapley值不是一个探索式的理论方法而是基于四个公理推导且已经作为一个公理使用的方法。另外,Shapley值法对更加复杂的问题提供了一个比较接近实际的模型,原因是它比较和平均了自变量所有可能的子集构成模型的总变异 R2。在自变量间存在较高相关性时,首先用偏最小二乘法对回归模型进行修正,再用乘积尺度法估计自变量相对重要性时,估计的结果值仍会出现负值的情况,说明这种方法的使用仍存在缺陷。

自变量相对重要性;Shapley值;乘积尺度;MonteClaro模拟;偏最小二乘回归

宁波大学

硕士

流行病与卫生统计

沈其君

2014

中文

R181.3

55

2015-08-17(万方平台首次上网日期,不代表论文的发表时间)

相关文献
评论
相关作者
相关机构
打开万方数据APP,体验更流畅