粗糙脉孢菌基因组中的微卫星序列的组成和分布
【摘要】:本文利用已经公布的粗糙脉孢菌基因组测序结果,对该真菌基因组中的微卫星(SSR)标记进行了系统地分析。结果表明,在已经公布的38.0 Mb的基因组序列中,共有14,788个以1-6个核苷酸为基序的SSR序列(长度大于15 bp,匹配值大于80%),其碱基总数占整个基因组碱基数的0.95%,平均2.57 kb就分布有一个大于15 bp的SSR。其中数量最多的三碱基SSR,数量达到4,729个,其次为六碱基SSR(2,940个)和单碱基SSR(2,489个),这3类SSR总数达10,158个,占SSR总数的68.7%。数量最少的是二碱基SSR,只有691个。在可读框(ORF)中的SSR总数为4,094个,共分布于2,373个ORF中,其中只有1个SSR的ORF为1,056个。与其它生物内SSR的分布类似,在基因编码区中,以三碱基SSR和六碱基SSR占绝对优势,分别为基因组中三碱基和六碱基SSR总数的54.1%和48.8%,由于ORFs和编码区的碱基总数分别为该菌基因组碱基总数的约46%和38.3%,所以这两种长度的SSR在编码区中的密度高于基因组中的平均密度。ORF上下游300 bp调控区域内是各类SSR相对的富集区。尤其是上游区域中的五碱基SSR,为平均密度的3倍,二碱基SSR和四碱基SSR的密度也是基因组中平均密度的2倍多。在下游调控序列中,五碱基、四碱基、二碱基、单碱基SSR的密度,也大大超过了在基因组中的平均密度。在粗糙脉孢菌的64,840 bp线粒体DNA中也发现47个SSR,平均为1.4 kb就有一个SSR分布,其组成特点与基因组中的SSR类似。这些结果说明,SSR在基因组上的分布趋向于集中在基因组中的调控区域。