学位专题

目录>
<
DOI:10.7666/d.D462634

缺失数据情形概率密度函数的统计推断

李琼梅
广西师范大学
引用
在许多实际问题中,由于各种人为或其它不可知因素,很容易导致大量缺失数据的产生,例如在民意调查,市场调研,医学研究以及社会经济研究等领域普遍存在数据缺失现象.在有数据缺失的情况下,通常的统计方法往往不能直接应用,需要对数据进行必要的处理. Complete ? Case方法是解决数据缺失问题的一种方法,它是将有缺失的数据项删除,然后对剩余的项构成的“完全样本”用常规的统计方法进行推断.填补法也是处理数据缺失问题的方法之一,而填补法是对缺失值进行填补,继而得到“完全样本”,再按照通常的统计方法进行推断,缺失数据情形的统计推断是现代统计界的一个热门研究领域(Little andRubin, Statistical Analysis with Missing Data[M], New York: John Wiley and Sons, 2002).由于客观实际错综复杂,使在统计判决问题中“假定总体服从某分布族”有时并不符合实际.因此,有时需要利用观察数据来直接估计概率密度函数,以便得到总体的某些特征值的较好的估计.对于概率密度函数的研究,目前文献中已有大批研究成果.在完全样本情形,Rosenblatt,Parzen,Loftsgarden & Quesenberry,Wahba,Silverman,Devroye,Devroye &Gyo¨rfi等人对概率密度函数的估计问题进行了广泛深入的研究;在缺失数据情形,Robinset al(Semiparametric efficient estimation of a density with missing or mismeasured covariates [J].Roy. Statist Soc Ser B,57: 409-424)在随机设计及协变量有缺失情形基于参数模型定义了概率密度函数的估计; Wang(Probability density estimation with data missing at random whencovariables are present [J]. Journal of Statistical Planning and Inference,2008,138: 568-587)分别基于校正法和逆概率权法研究了概率密度函数的估计及其渐近性质.本文在第二章中研究了MAR缺失机制下的概率密度函数的估计及其渐近正态性,得到两个结果:(1)将Wang(2008)中的条件减弱(主要体现在扩大核估计的适用范围),证明了基于非参数回归填补法定义的概率密度函数的估计的渐近正态性,并利用此结果构造了概率密度函数的基于正态逼近的渐近置信区间.(2)基于一种新的逆概率权方法定义了概率密度函数的一个新估计,证明了估计的渐近正态性,利用此结果构造了概率密度函数的基于正态逼近的渐近置信区间.本文在第三章中在MAR缺失机制下,首次对概率密度函数的经验似然置信区间的构造进行研究,得到了如下结果:(1)采用非参数回归填补法补足缺失数据,证明了基于此填补法得到的概率密度函数的经验似然比统计量的极限分布为加权卡方分布,利用此结果构造概率密度函数的经验似然置信区间时需要调整,而调整系数需要估计,这会降低经验似然置信区间的覆盖精度.(2)采用逆概率权填补法补足缺失数据,证明了基于此填补法得到的概率密度函数的经验似然比统计量的极限分布为卡方分布,利用此结果构造概率密度函数的经验似然置信区间时不需要调整,从而可以提高经验似然置信区间的覆盖精度.本文的特色体现在以下三个方面:1.将Wang(2008)中的条件减弱(主要体现在扩大核估计的适用范围),证明了基于非参数回归填补法定义的概率密度函数的估计的渐近正态性,并利用此结果构造了概率密度函数的基于正态逼近的渐近置信区间.2.采用新的逆概率权方法定义了概率密度函数的一个新估计,证明了估计的渐近正态性,利用此结果构造了概率密度函数的基于正态逼近的渐近置信区间.3.在MAR缺失机制下,首次对概率密度函数的经验似然置信区间的构造进行研究.采用逆概率权填补法补足缺失数据,证明了基于此填补法得到的概率密度函数的经验似然比统计量的极限分布为卡方分布,利用此结果构造概率密度函数的经验似然置信区间时不需要调整,从而可以提高经验似然置信区间的覆盖精度.

概率密度函数;MAR缺失机制;渐近正态性;经验似然

广西师范大学

硕士

概率论与数理统计

秦永松

2010

中文

O212.7

2014-05-29(万方平台首次上网日期,不代表论文的发表时间)

相关文献
评论
相关作者
相关机构
打开万方数据APP,体验更流畅