收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

pNovo:基于串联质谱的从头测序方法的研究

杨皓  迟浩  刘超  张昆  曾文锋  孙瑞祥  贺思敏  
【摘要】:利用串联质谱进行蛋白质鉴定通常有两大类方法:数据库搜索与肽段从头测序。从头测序方法不需要数据库的辅助,而是直接从谱图中推导出肽段序列[1,2]。理论上,如果一条肽段碎裂得比较充分,以至于质谱中存在它的所有或大多数碎裂位置的离子,那么我们便有可能通过谱图中这样的连续谱峰的质量差推导出整个序列(图1)。我们在已有的p Novo算法研究[3,4]的基础上,使用机器学习算法识别离子类型,并将谱峰转化成相应的结点,将谱图转化成质谱连接图,通过快速计算前N长的路径的p DAG算法,生成候选肽段,通过机器学习方法理论产生带强度信息的理论谱图,与实验谱图匹配打分。p Novo软件主要有三个贡献:1.谱图预处理,识别谱峰的离子类型,减少转化成质谱连接图的结点数,降低图的复杂度。2.细打分,使用机器学习方法自动学习碎裂规律,训练产生的模型用来产生肽段的理论谱图,并与实验谱图进行匹配打分,考虑了更多的离子类型,包括中性丢失离子、内部离子和亚氨离子。3.合并谱图方法,将相同母离子的谱图进行合并,考虑不同电荷的情况,不同电荷的谱图碎裂互补性更好,合并产生的谱图信噪比更高,提高谱图质量。p Novo和PEAKS7.5在多组数据集上进行了对比评测,p Novo的准确度比PEAKS7.5高5%,同时速度稍好于PEAKS7.5。此外,p Novo还能够有效支持HCD和ETD两种碎裂形成的谱图对以及不同酶切形成的谱图。pN ovo软件能够处理绝大多数的从头测序方法的研究工作,在后续阶段我们将优化算法并制作界面,方便生物学家的使用。

知网文化
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978