DNA序列拼接算法分析及并行化探讨
【摘要】:基于欧拉路径的拼接算法开辟了一条解决 DNA 序列拼接问题的新的途径,打破了遵循"重叠-排列-生成共有序列"方法的传统。本文举例说明了基于 EULER 路径的拼接算法和基于 Hamilton 路径的拼接算法是怎样解决 repeat 问题的。在 CJ、NM、LL 基因组序列拼工程中,比较了 EULER 算法与 Phrap、CAPS、 TIGR 算法的拼接结果,分析了它们各自的优缺点。由于 EULER 路径算法要求构造一个复杂的 deBruijin 图, 因此用该算法拼接大规模全基因组存在存储瓶颈问题,该文对基于 EULER 路径的拼接算法进行了并行化探讨。
【相似文献】 | ||
|
|||||||||||||||||||||||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|