10.19343/j.cnki.11-1302/c.2019.01.009
零膨胀计数数据的联合建模及变量选择
零膨胀计数数据破坏了泊松分布的方差-均值关系,可由取值服从泊松分布的数据和取值为零(退化分布)的数据各占一定比例所构成的混合分布所解释.本文基于自适应弹性网技术,研究了零膨胀计数数据的联合建模及变量选择问题.对于零膨胀泊松分布,引入潜变量,构造出零膨胀泊松模型的完全似然,由零膨胀部分和泊松部分两项组成.考虑到协变量可能存在共线性和稀疏性,通过对似然函数加自适应弹性网惩罚得到目标函数,然后利用EM算法得到回归系数的稀疏估计量,并用贝叶斯信息准则BIC来确定最优调节参数.本文也给出了估计量的大样本性质的理论证明和模拟研究,最后把所提出的方法应用到实际问题中.
零膨胀泊松模型、变量选择、联合建模
36
O212(概率论与数理统计)
中国人民大学科学研究基金中央高校基本科研业务费专项资金资助项目“大数据分析的稳健统计理论与应用研究”18XNL012
2019-04-04(万方平台首次上网日期,不代表论文的发表时间)
共11页
104-114