学位专题

目录>
<

分子树空间的贝叶斯推断采样算法研究

李晓鹏
北京化工大学
引用
随着现代生物学技术的进步,分子序列数据的收集日益丰富,导致研究物种间历史关系的树状拓扑空间持续扩大。在这种情况下,基于随机游走(RWM)算法的贝叶斯推断方法面临混合速度变慢的问题日益凸显。为确保贝叶斯推断的效率和准确性,优化MCMC采样算法显得尤为重要。近年来,作为马尔可夫链蒙特卡洛(MCMC)家族中最先进的算法之一,哈密顿马尔可夫蒙特卡洛(HMC)算法在系统发育分析领域得到了初步应用。它能够减少传统MCMC算法中大量的随机游走行为,从而加快马氏链的混合速度,提高计算效率。  本文深入探讨了 RWM算法在分子系统发育树空间采样时所面临的局限性以及HMC方法在系统发育分析中处理多模态问题的挑战。为了克服这些问题,本文提出了一种混合路径哈密顿马尔可夫蒙特卡洛(MPHMC)方法,以提高系统发育分析的效率和准确性。在复杂的多模态发育树空间中,单一的HMC算法无法通过从其他模式中获得提议来逃离局部的高概率区域。为提升算法的健壮性,在不增加额外的计算成本情况下,算法采样路径中添加针对离散参数的非HMC更新组件,与HMC确定性更新交替进行,进而在树空间中引入了拓扑变化更大的分支重排策略,能更自由地遍历整个后验分布的树空间。  在不同规模的八组经验数据集上实验证明,MPHMC方法能更好地从正确的后验分布中采样;在比较难采样的大数据集上运行时,HMC单一路径的采样算法可能会失效,而MPHMC方法能获得比使用广泛的系统发育分析工具Mrbayes(MCMC)高15%以上的采样效率提升。

分子序列数据;随机游走;贝叶斯推断;采样算法;马尔可夫链蒙特卡洛算法;分支重排策略

北京化工大学

硕士

计算机技术

高敬阳;高姣姣

2023

中文

TP311.13

2023-09-27(万方平台首次上网日期,不代表论文的发表时间)

相关文献
评论
相关作者
相关机构
打开万方数据APP,体验更流畅