生物的基因组中,特别是高等生物的基因组中含有大量的重复序列〔14〕,根据重复序列在基因组中的分布形式可将其分为串联重复序列和散布重复序列。其中,串联重复序列是由相关的重复单位首位相连、成串排列而成的。目前发现的串联重复序列主要有两类:一类是由功能基因组成的(如rrna和组蛋白基因);另一类是由无功能的序列组成的。根据重复序列的重复单位的长度,可将串联重复序列分为卫星dna、微卫星dna、小卫星dna等〔3〕。微卫星dna又叫简单重复序列,指的是基因组中由1~6个核苷酸组成的基本单位重复多次构成的一段dna,广泛分布于基因组的不同位置,长度一般在200bp以下。研究表明,微卫星在真核生物的基因组中的含量非常丰富,而且常常是随机分布于核dna中〔15,38〕。在植物中通过对拟南芥〔7〕、玉米〔35〕、水稻〔11〕、小麦〔28,32,33〕等的研究表明微卫星在植物中也很丰富,均匀分布于整个植物基因组中,但不同植物中微卫星出现的频率变化是非常大的,如在主要的农作物中两种最普遍的二核苷酸重复单位(ac)n和(ga)n在水稻、小麦、玉米、烟草中的数量分布频率是不同的。在小麦中估计有3000个(ac)n序列重复和约6000个(ga)n序列重复,两个重复之间的距离平均分别为704kb、440kb〔32,33〕,而在水稻中,(ac)n序列重复约有1000个左右,(ga)n重复约有2000个,重复之间的平均距离分别为450kb、225kb〔41〕。另外在植物中也发现一些三核苷酸和四核苷酸的重复,其中最常见的是(aag)n、(aat)n〔15〕。在单子叶和双子叶植物中ssr数量和分布也有差异,平均分别为64.6kb和21.2kb中有一个ssr。研究还发现,单核苷酸及二核苷酸重复类型的ssr主要位于非编码区,而有部分三核苷酸类型位于编码区。另外在叶绿体基因组中,目前也报道了一些微卫星,以a/t序列重复为主〔3〕。
研究发现,微卫星中重复单位的数目存在高度变异,这些变异表现为微卫星数目的整倍性变异或重复单位序列中的序列有可能不完全相同,因而造成多个位点的多态性。如果能够将这些变异揭示出来,就能发现不同的ssr在不同的种甚至不同个体间的多态性,基于这一想法,人们发展起了ssr标记。ssr标记又称为sequence tagged microsatellite site,简写为stms,是目前最常用的微卫星标记之一。由于基因组中某一特定的微卫星的侧翼序列通常都是保守性较强的单一序列,因而可以将微卫星侧翼的dna片段克隆、测序,然后根据微卫星的侧翼序列就可以人工合成引物进行pcr扩增,从而将单个微卫星位点扩增出来。由于单个微卫星位点重复单元在数量上的变异,个体的扩增产物在长度上的变化就产生长度的多态性,这一多态性称为简单序列重复长度多态性(sslp),每一扩增位点就代表了这一位点的一对等位基因。由于ssr重复数目变化很大,所以ssr标记能揭示比rflp高得多的多态性,这就是ssr标记的原理。
与其它分子标记相比,ssr标记具有以下优点:(1)数量丰富,覆盖整个基因组,揭示的多态性高;(2)具有多等位基因的特性,提供的信息量高;(3)以孟德尔方式遗传,呈共显性;(4)每个位点由设计的引物顺序决定,便于不同的实验室相互交流合作开发引物。因而目前该技术已广泛用于遗传图谱的构建〔11,12,18,19,33〕、目标基因的标定〔8,9,21,22,26〕、指纹图〔22〕的绘制等研究中。但应看到,ssr标记的建立首先要对微卫星侧翼序列进行克隆、测序、人工设计合成引物以及标记的定位、作图等基础性研究,因而其开发费用相当高,各个实验室必须进行合作才能开发更多的标记。由于ssr标记具有较大的应用价值,且种属特异性较强,目前在一些主要的农作物中ssr标记研究都进行了合作,共同进行stms引物的开发。 |
|
|