多重插补在成分数据缺失值补全中的应用
成分数据主要用来研究构成某个整体的各部分的比重.近年来,在社会结构、经济发展、工程技术等方面有着重要而广泛的应用.然而在数据收集、存储等的过程中,常因为各种因素的影响导致数据的缺失.数据缺失会增加分析的复杂性,使得结果的偏离,降低工作效率.所以对缺失数据的处理变得极为重要.如果对缺失数据插补后,再对完整数据统计分析,不仅能更好的反应整个样本信息,而且能更准确的反应真实结果.本文主要对成分数据缺失值的插补方法进行研究,并把多重插补法应用到成分数据缺失值的数值实例中. 全文共分为四章:第一章,提出问题,论述了论文研究的背景和现实价值,对有关成分数据和缺失问题的研究现状作了综述,对成分数据统计分析给出简要的介绍,并对文章的主要工作作了简要的说明.第二章,对已有缺失值的处理作了概括说明,从理论上对均值插补法和回归插补法等简单插补法以及多重插补法作了较为详细的说明.第三章,在第二章的基础上,进一步研究成分数据缺失值的插补,并提出针对成分数据缺失值的单一插补方法和多重插补方法,进一步举例说明.第四章,以“2004年各地区城镇居民家庭平均每人全年消费性支出结构”为例,结合SAS统计软件对各种不同插补方法进行效果比较,验证结论的合理性.
成分数据;缺失值;多重插补;统计分析
山西大学
硕士
概率论与数理统计
张晓琴
2012
中文
O212.1
44
2015-04-20(万方平台首次上网日期,不代表论文的发表时间)