学位专题

目录>
<
DOI:10.7666/d.D507133

DNA计算核酸编码优化及算法设计

张凯
华中科技大学
引用
DNA计算是一种以DNA分子作为计算介质,以生物化学反应作为计算工具的一种新型计算方法。凭借着极大的存储密度和高度并行性,这种基于生物分子的计算模式,在求解复杂的组合优化NP完全问题时显示出了极大潜力。DNA计算首先是对核酸序列进行编码,将现实问题映射到核酸分子上,然后通过生物试验获得代表问题解的核酸分子。核酸编码质量的优劣决定了DNA计算的效率,核酸编码数量的多少决定了DNA计算可求解问题的规模,因此核酸编码是DNA计算研究中的重要课题。本文研究了DNA计算中核酸编码理论及其算法的设计,主要研究工作如下:  (1)DNA计算中编码质量、编码数量、序列长度与DNA计算的可靠性、有效性、可扩充性密切相关,选取适当的DNA编码约束及约束强度是提高DNA计算设计效率的关键,DNA编码问题是一个极具挑战性的多目标组合优化问题。  本文首先分析了各编码约束对编码质量的影响,进而对DNA编码的约束条件进行归类。通过将DNA编码问题和图的最大独立集问题进行类比,对DNA编码问题的复杂性进行了分析。对基于汉明距离和基于最小自由能这两类DNA编码方法进行了类比和研究,分析了两类方法限制核酸非特异性杂交的完备性及计算量,为DNA计算编码方法的选择及其参数的确定提供了理论支持。  (2)DNA分子杂交二级结构的多样性,使得计算其最小自由能的时间复杂度非常高,当编码约束条件较严格时,很难在有效的时间内设计出满意数量的DNA序列。提高DNA分子二级结构的预测精度和自由能的计算效率是热力学DNA编码算法设计的难点和关键。  本文研究了DNA分子杂交自由能变化与双链DNA分子二级结构稳定性的关系,提出了一种基于热力学的启发式随机搜索 DNA序列设计算法,该算法采用Nearest-Neighbors热力学模型,通过对DNA分子杂交的二级结构进行预测,选择满足用户设定的最小自由能约束的DNA序列,从而有效避免了DNA计算中DNA分子的非特异性杂交。同其它随机搜索DNA序列设计算法相比,该算法首先排除不满足解链温度的候选DNA序列,然后用贪婪算法计算DNA序列的自由能,并逐步将不满足自由能约束的候选序列转化为可行解,提高了DNA序列的设计效率。通过和其它算法提供的DNA序列进行比较和分析,证实了算法可产生热力学性质更稳定的DNA序列,验证了算法的有效性。  (3)当前各种DNA序列设计算法适用的编码约束有限,对不同的DNA计算模型不具备通用性;并且难以高效的设计出满足约束的最大DNA序列集合,无法求解大规模的DNA计算问题实例。  本文针对DNA编码设计的这些难点,提出了隐枚举核酸序列设计算法,以提高DNA计算的可扩充性,求解更大规模的计算问题。通过将编码约束转换为整型线性规划的条件不等式对DNA序列进行约束,灵活适用于各种编码约束,可满足各种DNA计算模型对DNA编码的不同要求。算法使用剪枝策略高效的搜索4n解空间,找出满足约束条件的最大的DNA序列集合。最后通过和遗传算法、多目标进化算法、模板映射、模拟退火和动态规划等算法进行比较和分析,证明了本文提出的隐枚举核酸序列设计算法产生的DNA编码质量更加稳定可靠,具有极强的扩充性,适用于各种核酸试验的DNA分子设计要求,可以高效的产生满足编码约束的最大的DNA序列集合。  (4)最后,将隐枚举核酸编码算法应用于求解61个顶点的图着色DNA计算实例。使用隐枚举DNA编码算法设计出了满足组合约束、热力学约束共129条DNA序列,通过分子生物学实验方法,成功求解出61个顶点3着色DNA计算实例,通过DNA测序证明得到了代表图着色问题解的DNA分子,验证了本文编码算法的有效性和可靠性。

脱氧核糖核酸;核酸编码;计算模式;组合优化;算法设计

华中科技大学

博士

系统分析与集成

许进

2008

中文

Q523

123

2014-09-17(万方平台首次上网日期,不代表论文的发表时间)

相关文献
评论
相关作者
相关机构
打开万方数据APP,体验更流畅