收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

DNA序列中基于后继数组索引的LPR查找算法

王镝  王国仁  吴青泉  陈白尘  赵毅  毛克明  
【摘要】:DNA序列中的重复片段在人类基因研究中有着非常重要的生物意义,因此,查找给定DNA序列中的重复片段是生物序列分析领域中的一个重要课题.基于重复片段的模式提出了新的重复片段定义LPR(largest pattern repetition)和模式单元的概念.对于长度为n的DNA序列,其中的LPR的数量是O(n)数量级的,但提供了与个数可多达n~2/4的tandem repeat相同的重复片段信息.基于模式单元设计了可用于重复片段查找的全新索引——后继数组.后继数组有效地降低了索引空间,很好地突破了重复片段查找中的索引空间瓶颈.在后继数组上,通过模式单元可发现构成LPR的全部原子模式,并通过判断相同模式是否在原序列中连续出现完成LPR的查找.理论分析和实验结果均表明,设计的LPR查找算法的时间和空间复杂度均为O(n).

知网文化
【相似文献】
中国重要会议论文全文数据库 前3条
1 王镝;王国仁;吴青泉;陈白尘;赵毅;毛克明;;DNA序列中基于后继数组索引的LPR查找算法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
2 吴青泉;王国仁;王镝;胡大斌;汪恒杰;郭烨;朱铭杰;;基于PFD过滤器查找DNA序列中相似性重复片段[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
3 郭顺;管河山;姜青山;;一种新的DNA序列重复片段的查找算法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
中国硕士学位论文全文数据库 前4条
1 王红;MPLS流量工程中动态路由算法研究[D];辽宁工程技术大学;2005年
2 白利波;车牌检测与识别算法研究[D];北京交通大学;2007年
3 孟庆远;车牌识别系统中字符识别技术研究[D];中北大学;2011年
4 李英明;车牌识别系统的研究与实现[D];东北大学;2010年
中国重要报纸全文数据库 前3条
1 记者 陶文忠;大庆炼化驶入高速发展快车道[N];中国石油报;2001年
2 本报记者 常斐;两个30%诠释了什么[N];中国石油报;2002年
3 ;华为支撑网设备中标山东移动[N];人民邮电;2000年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978