当前位置:  农事资讯新闻速递乡村建设

基于基因组学的作物种质资源研究:现状与展望

2015-09-11来源:基因农业网
分享到: 更多
   切换手机版

种质资源是作物遗传改良和相关基础研究的物质基础。拥有作物种质资源的数量和质量,以及种质资源研究和创新的深度和广度,直接影响到种质资源利用效率和现代种业的可持续发展。因此,种质资源保护和利用已成为世界各国农业科技创新驱动战略的重要组成部分。

“基因组学”在1986年首次提出后发展十分迅猛,基因组学理论和方法广泛应用于其他学科和不同行业,催生了生物学科大数据时代,促进了生物技术产业的蓬勃发展。与其他学科一样,基因组学的发展对作物种质资源研究思路、技术路线、研究方法等产生了革命性的影响,种质资源研究进入一个新的历史发展阶段。特别是分子标记和测序技术的广泛应用使种质资源的全基因组水平的基因型鉴定成为可能,种质资源的结构多样性和功能多样性研究愈加深入,对阐释作物起源、进化和传播、有效保护种质资源、发掘新基因和高效种质创新将起到重要的推动作用。

1种质资源的基因型鉴定

对种质资源的认识分2个层次,一是某种作物的所有种质资源;另一是特定种质资源。针对所有种质资源,需要全面了解这些种质资源的地理分布、群体结构及其相互关系,也就是结构多样性,还需要了解同一个基因在不同种质资源中的不同形式(即等位基因)及其遗传效应,也就是功能多样性。而针对特定种质资源,需要从5个方面了解:(1)这份资源是什么;(2)这份资源的特性是什么;(3)控制这些特性的基因或等位基因是什么;(4)这份资源有什么利用价值;(5)通过什么途径可高效利用这份资源。

种质资源研究涉及到多门学科,特别是近年来生物组学对其产生了深远影响,其中,基因组学带来的颠覆性技术之一是基因型鉴定(又称基因分型)技术。这些技术不仅可用于作物种质资源保护等基础性工作,还广泛应用于遗传多样性分析、新基因发掘和种质创新等多个方面。

基因型鉴定的必要手段是利用分子标记。最先开发的分子标记是限制性片段长度多态性(RFLP),之后不断出现新的标记类型及其衍生形式,其中,最主要的包括随机扩增多态性DNA(RAPD)、扩增片段长度多态性(AFLP)、简单序列重复(SSR)和单核苷酸多态性(SNP)等。目前,随着高通量检测和测序技术的发展,除SSR和SNP标记在广泛使用外,其他类型的标记已用得越来越少。在大多数情况下,SNP标记与SSR标记的效用相差无几。如Hamblin等用89个SSR标记和847个SNP标记对259份玉米自交系进行基因型鉴定,发现2种标记类型的遗传多样性研究结果近似。VanInghelandt等进一步用359个SSR和8244个SNP对1537份玉米自交系进行了鉴定,发现在群体结构和遗传多样性分析时,2种标记均可正确反映真实结果,但SNP标记数量需要比SSR标记多7—10倍。不过,由于SNP标记具有覆盖全基因组、高通量、位点特异、共显性遗传、误检率低、开发和检测成本急剧降低等优点,将成为未来基因型鉴定的主要标记类型。

SNP芯片技术可广泛用于种质资源的全基因组水平基因型鉴定。目前广泛使用的基于芯片技术的2个基因型鉴定平台是Affymetrix的GeneChipTMmicroarray和Illumina的BeadArrayTMtechnology。近年来,科学界与企业合作开发了一批针对不同作物的芯片。例如,在水稻上,Chen等从801份水稻品种的重测序数据超过1000万SNP位点中,筛选出51478个均匀分布的标记(68%位于基因内),开发出了RiceSNP50芯片。在小麦上,全球多家研究单位合作,开发了含90000个基因相关SNP的芯片,其中46977个SNP已定位在染色体上。Ganal等从80万个玉米SNP中,筛选出49585个SNP构建芯片,并用该芯片对玉米的经典群体IBM(B73×Mo17)和LHRF(F2×F252)进行了图谱构建,分别定位了20913个和14524个标记。Unterseer等开发了一个含616201个SNP和小的插入缺失变异(Indel)芯片,适合欧洲和美国温带玉米材料的关联分析。目前,中国也开发了一个适合同时研究温带和热带玉米的55K玉米芯片(徐云碧,私人通讯)。

在过去的几年中,基于第二代测序的全基因组水平基因型鉴定技术(如全基因组测序、重测序、简化基因组测序、RNA测序等)开始出现。全基因组测序策略适合基因组小的物种(如拟南芥),重测序则对那些基因组相对较小的物种(如水稻、高粱、谷子等)是个较好的策略。例如,Lam等对17份野生大豆和14份栽培大豆进行了重测序,检测到205614个SNP,发现野生大豆中等位基因多样性较高,大豆基因组中连锁不平衡(LD)强。Qi等对115份黄瓜种质资源进行了重测序,检测到3305010个SNP、336081个短于5bp的插入缺失变异(Indel)、594个有无变异(PAVs)。近年来,针对基因组较大的物种,科学家们开发了一系列低成本、高通量的基于简化基因组测序(即通过只对非重复或低重复基因组区域进行测序来降低测序基因组复杂程度)的基因型鉴定方法,如RRLs、CRoPS、GBS、SBG、RAD、RESCAN等。其中,GBS应用较多,其优势是通过降低基因组复杂程度,变得简便、可靠、实用,并且目前的使用成本已降到完全可以接受的程度,但其缺点是需要有参考的基因组序列,缺失数据较多也对进行生物信息学分析造成较大挑战,特别是针对基因组复杂的物种,建库和测序策略以及生物信息学分析方法可能需要针对性制定或开发。Glaubitz等最近开发了基于GBS的生物信息学分析平台TASSEL-GBS,目前,该平台已用于多个物种的GBS数据分析,如在玉米中对45000个样品进行了SNP鉴定。但也有报道没有参考基因组序列而直接利用GBS进行基因型鉴定,从而用于遗传图谱的构建和QTL的分析。

此外,外显子测序、甲基化DNA测序、转录组测序(RNA-seq)和序列捕获技术也可用来鉴定基因型。基于RNA-seq的基因型鉴定成本低廉,更有可能检测到功能SNP,但对其进行生物信息学处理较为困难,需要解决表达丰度的巨大差异性问题和可变剪切问题,特别是在没有参考基因组的物种中进行基因型鉴定时,需慎重使用该方法。序列捕获技术主要针对目标区段进行基因型鉴定,利用SureSelect、Nimblegen和Raindance等方法,在测序前对目标区段进行选择或富集,但这种方法更适合有参考基因组序列的物种。

除全基因组水平的基因型鉴定外,还有一种针对目标基因进行的基因型鉴定,可以用来鉴定特定的等位基因或单倍型haplotype。例如,Pham等针对控制大豆亚麻油酸含量的脂肪酸去饱和酶基因FAD,鉴定出FAD3A的6.4kb缺失以及FAD3B和FAD3C的SNP,前者用普通电泳方法即可分辨杂合子,后者用TaqMan方法即可做高通量标记选择。DeLaFuente等对400份玉米种质资源的脂氧化酶基因ZmLOX4和ZmLOX5进行了基因型鉴定,发现遗传多样性和LD程度很低,并且有1个自交系的ZmLOX5没有功能,1个自交系缺失该基因,5个自交系该基因有重复。

目前,中国的作物种质资源基因型鉴定大多数还使用SSR标记,基于芯片和测序技术的基因型鉴定(SNP标记)仅在玉米、水稻、小麦、大豆、棉花等作物中刚开始应用。因此,进一步提高种质资源基因型鉴定的通量和效率,并对中国库存种质资源进行全面鉴定评价,将是今后种质资源研究的突破口和重点任务。

2种质资源异地保存

据FAO估计,全球收集保存的740万份种质资源中仅100万—200万份是特异的,其他种质都存在不同程度的重复。传统的重复判定方法是通过形态学性状和地理来源来判断,这种方法显然存在缺陷,因为可利用的形态学标记相对较少。更有效的方法是通过基因型鉴定来推断种质重复与否,但要注意的是不同分子标记的分辨率会影响到“重复种质”的判定。利用高分辨率的分子标记类型或测序技术,可以提高遗传材料内及材料间遗传相似度和杂合度的鉴别能力,有利于库存种质资源管理,如国际水稻研究所(IRRI)分别利用384个SNP位点和50对SSR分子标记对2800份水稻种质进行分析,发现SNP比SSR具有更高的分辨率,可将之前认定的“重复种质”进一步加以区分,即认定为非重复种质。

种子保存寿命是种质库管理评价的重要指标。种子保存寿命研究的经典方法是对通过发芽试验对种子活力进行监测,并用分子标记等技术监测其遗传完整性,确定繁殖更新临界值。研究表明,不同作物的种子寿命是受遗传控制的。近年来,在拟南芥、水稻、大麦以及油菜等作物中已鉴定出与种子寿命相关的数量性状位点(QTL)。水稻种子保存寿命QTL被定位在7条染色体上;大麦染色体2H、5H和7H携带有种子老化基因;小麦种子保存寿命受生长和保存环境以及处理过程中种子含水量的影响,与种子寿命相关的QTL定位在染色体2AS上。如果克隆了那些在低温条件下(如长期库-18°C下)种子保存寿命相关的QTL,并对不同种质资源中的等位基因进行系统分析,将有助于了解不同材料种子保存寿命的自然遗传变异,通过检测等位基因或利用功能标记就可预测繁殖更新时间。

对于无性繁殖作物,对茎尖等分生组织进行超低温保存(-196°C到-130°C)是重要的长期保存方式。分子标记或其他基因组学技术可应用于超低温冻存后遗传稳定性研究。研究结果表明,超低温保存后一般可保持遗传稳定性,但也可能影响到DNA甲基化。超低温保存过程中涉及的低温处理和脱水环节对植物组织超低温保存成活有显著影响,研究超低温保存过程中基因组和转录组对冷冻和脱水胁迫的响应,有助于制定最佳保存策略。目前主要以拟南芥茎尖为材料进行了研究,如Volk利用cDNA芯片技术,研究了超低温保护剂处理、液氮保存以及恢复培养条件下的基因表达模式。在作物上的类似研究应该更具实践意义。

中国种质安全保存相关研究取得了一定进展,如利用AFLP标记分析了繁殖群体量及隔离对蚕豆种质遗传完整性的影响、大豆中黄18种质在种子老化处理后的遗传完整性,利用SSR等分子标记研究了马铃薯种质超低温保存后的遗传稳定性,利用转录组学方法开展不同苗龄的拟南芥茎尖材料超低温保存过程差异基因表达研究。但总体来看,在种质资源保存方面基于基因组学水平的研究规模和深度均较欠缺,与种子保存寿命相关、种子老化相关的相关基因研究更少。

3种质资源原生境保护

原生境保护已成为作物野生近缘植物保护的主要方式,广泛应用于濒危野生近缘植物的遗传多样性保护。原生境保护的理论基础是通过对地球上物种形成机制的了解以及调查人类活动对物种、遗传变异和生态系统的影响,建立可操作的方法来维持野生植物的遗传多样性,保护和恢复生物群落及其生态功能。但是,传统原生境保护中的很多科学问题很难用经典遗传学技术加以解决,特别是群体结构、居群间的基因流和进化动态及居群间的亲缘关系等受到遗传和环境因素的双重影响而难以被精确估算。

应用分子标记及基因组数据估计野外居群的群体结构、确定居群间的基因流和亲缘关系等,可较为准确地估计生物多样性,结合野外调查统计数据和生态学信息,即可确定优先保护区域和优先保护居群。例如,杨庆文等通过对东乡普通野生稻原位保存群体遗传分化进行研究,发现该地的2个居群应属于一个大群体,因为人为干扰导致生境片断化,从而形成了2个独立的居群,并据此提出了将2个居群同时保护但侧重于庵家山居群的保护策略,为该地建立原生境保护点提供了科学依据。王家祥等利用SSR分子标记对中国15个普通野生稻原生境保护居群的427份材料和在中国分布区内按照纬度划分后随机挑选的15个未保护居群的357份普通野生稻材料进行了遗传多样性分析,发现中国普通野生稻原生境保护居群具有较高的遗传多样性,已经建立的15个原生境保护点内的普通野生稻基本上能够代表中国普通野生稻的遗传多样性状况,但广东和广西保护居群的遗传多样性水平低于未保护居群,说明该地区原生境保护点数量较少,遗传代表性不够,应该扩大保护范围,增加保护点数量。

新一代测序技术的发展,使得某些基因的序列能够在更多的样品上进行比对,获取基因序列多样性的大量信息,从而阐明基于基因序列的谱系关系及其近缘种间关系,有助于确定物种优先保护顺序。例如,Qiao等对98份栽培稻和普通野生稻糯性基因的序列变异进行了研究,从检测到的栽培稻和野生稻SNP插入或缺失的核苷酸序列得出结论,栽培稻中的糯性基因来源于华南地区的普通野生稻。Wei等对叶绿体中atpA序列、rps16内含子序列、trnP—rp133间隔区、trnG—trnfM序列、trnG—trnfM间隔区序列,线粒体的cox3、cox1、orf224和基因间序列ssv-39/178、rps2—trnfM以及核基因组的ITS、Ehd1、Hd1进行测序,利用生物信息学方法进行比对分析,发现所有与中国栽培稻亲缘关系较近的普通野生稻均来源于华南地区,而且栽培稻的2个亚种籼稻和粳稻在进化过程中分别由该地区偏籼型的普通野生稻和偏粳型的普通野生稻进化而来,因此,推断华南地区是亚洲栽培稻的起源中心,并由此制定了以华南地区为主的野生稻原生境保护策略。此外,Henry在2014年也明确提出,对野生近缘种材料进行测序和深入分析,可在全基因组水平上对作物野生近缘植物的遗传多样性及其变化进行系统调查研究,将有助于种质资源的原生境保护。

目前,基因组学在作物种质资源的原生境保护中的应用案例还较少。这里主要存在2个问题,一是基因组学研究取样数量往往有限,并且没有以居群为单位,不能完全反映现有野生群体的状态;二是对野生居群的研究仅局限于与栽培种的比较,对其本身多样性及其形成机制和环境适应机制的研究较少。因此,在未来的保护基因组学研究中,需首先研究保护基因组学所需的居群取样原则,在此基础上通过对不同生境样本的基因组测序获得基因组的平均多样性变化,有效监测等位基因频率的变化,评估遗传漂变、选择和基因流对原生境保护群体的影响,阐明群体适应环境变化的遗传因素,从而提高对野生群体进行原生境管理的能力。

4作物起源、驯化与传播

驯化是把野生植物变成栽培作物的过程,经过驯化,栽培作物丧失了野生植物的不良特性,具备了种子易萌发、直立生长、籽粒或果实大、不落粒或不炸荚等丰产和适合管理的性状,使其在人工种植条件下单位面积产量显著提高。以大豆为例,栽培大豆由其祖先种一年生野生大豆进化而来,驯化前的野生大豆表现为小粒、植株缠绕生长,驯化后产生植株明显变小、营养生长降低、植株缠绕性减弱、但仍然易于倒伏的原始地方品种之后,现代大豆育种家对地方品种进行了定向改良,培育出植株直立生长、大粒、高产的优良品种。但与对多湿、盐碱、低温等不良环境具有较强的适应能力的作物祖先种相比,人工集约化种植的栽培作物的适应性往往大为降低,不过也存在一些适应性更广的例子,如热带起源的栽培玉米现在广泛种植于南北纬50度之间的辽阔区域。

栽培作物与其祖先野生种在这些表型和适应性上的差异是由遗传控制的。目前,已成功定位并克隆到驯化相关性状(又称为“驯化综合特征”性状)的QTL和基因,如控制玉米分蘖的顶端优势基因Teosintebranched1、水稻单分蘖基因MOC1、落粒基因sh4和qSH1、抗倒伏基因PROG1和籽粒大小基因qSW5、黄瓜苦味基因等。驯化过程涉及到的复杂表型往往是多基因作用的结果,基于表现型先验鉴定的分析方法只是对极少数基因/位点进行分析,不能检测到那些还未测定表现型的位点;另一方面,由于每个基因/位点受选择历史、遗传结构等不尽相同,单一基因/位点不能反映全基因组水平的驯化过程,无法满足全面解析驯化过程中人工选择导致的全基因组范围内遗传变异的发生规律及相互作用机制的需要。

随着高通量测序技术和生物信息学的快速发展,很多作物的参考基因组不断被公布,基因组学数据迅速积累。特别是全基因组重测序、RNA-Seq、miRNA测序、GBS等分析技术的出现,产生了大量可利用的基因组信息,促进了基于全基因组序列的作物比较基因组学和进化基因组学等学科的发展,为全面理解和诠释作物驯化历史及全基因组的遗传变异特征奠定了基础。

4.1作物驯化历史与地理起源

作物被驯化的次数和地理起源是影响作物遗传结构和遗传多样性水平及驯化相关性状形成的根本性因子之一。但由于多方面的原因,迄今为止,大多数作物驯化次数和起源地等驯化历史问题还没有得到解决。近年来,基于重测序分析的比较基因组学研究促进了在全基因组范围内了解作物的驯化历史。例如,对84份桃种质的重测序分析,明确了从西藏光核桃、山桃、甘肃桃到普通桃的分子进化路线。对44份高粱种质的重测序分析发现高粱的驯化历史复杂,至少发生了2次独立的驯化事件,最近一次驯化产生了guinea-margaritiferum类群。通过对60份普通菜豆野生材料和100份地方品种进行重测序,证实了普通菜豆在中美洲和安第斯地区是独立起源的,并且发现这两个基因库是在人类到达前就已分化开来。

亚洲稻有单一起源(粳稻和籼稻皆从野生稻O.rufipogon驯化而来)和多起源(粳稻和籼稻是从亚洲不同地方驯化而来)两种假说,一直是科学争论的焦点问题之一。Huang等通过对446份普通野生稻、1063份粳稻和籼稻品种进行重测序,构建水稻基因组变异图谱,鉴定出驯化过程中发生了55个选择清除事件(selectionsweep,即由于作物驯化过程中选择压力强,累积的遗传重组事件少,导致受选择基因与其邻近区域等位基因间产生牵连效应,形成多样性大幅降低的人工选择区段),认为粳稻最先从普通野生稻一个特定群体中驯化出来,地点发生在珠江流域中游地区,籼稻是粳稻与野生稻杂交而来,然后传入东南亚和南亚。而对非洲稻而言,通过对20份非洲栽培水稻及94份野生近缘种O.barthii的重测序分析,在分子水平上确认非洲栽培水稻独立起源于尼日尔河流域。

4.2作物驯化相关的遗传多样性变化

人类活动在作物驯化过程中扮演着重要角色,其有目的的选择使作物每繁殖一代都只有个别或少部分野生植株通过繁殖保留下来,最终形成遗传瓶颈效应。近年来利用重测序分析方法对水稻、玉米、大豆、黄瓜等栽培作物及其野生近缘种进行群体基因组学分析发现,栽培作物在驯化过程中遗传多样性大量丢失、连锁不平衡水平增高,人工选择对栽培作物的种质资源构成产生了重要影响。各种作物驯化过程中遗传瓶颈效应强度差异明显(表1),其中,西瓜瓶颈效应最强,丢失的多样性最多,玉米丢失的多样性最少,仅为西瓜的20.8%。对黄瓜、西瓜和西红柿等果蔬和水稻、玉米、大豆、高粱等谷类作物的比较分析,发现黄瓜等果实类作物在驯化过程中的遗传多样性下降程度比后者更大。对水稻2个亚种粳稻和籼稻的进一步分析发现,驯化后粳稻只保留了O.rufipogon51%的遗传多样性,而籼稻保留了O.nivara91%的遗传多样性,说明驯化过程中粳稻受人工选择强度更为强烈,导致粳稻的有效群体规模大幅缩小。

驯化过程中作物在丢失了大量遗传多样性的同时,因为突变和基因渐渗等原因又有可能产生了新的遗传多样性。例如,利用全基因组重测序分析,在25份野生大豆和30份栽培大豆中共检测到5102244个SNP位点,其中有10.4%(529724个)为栽培大豆所特有。同样,驯化后的栽培玉米也获得了新的遗传多样性。

4.3人工选择区段的鉴定与驯化相关性状的关系

在经历驯化后,作物的遗传多样性明显降低,是人类有目的地选择期望性状的结果。在控制驯化性状的基因组区段,只有极个别等位变异被保留下来,其他等位变异则逐步被淘汰,使控制这些性状的基因在驯化过程中逐渐被固定下来。

利用群体基因组学理论和方法对栽培作物及其近缘野生种的基因组序列进行对比分析,可以鉴定出符合分化系数(Fst)高、多样性差异显著和不符合中性检验等特点的基因组区段及其包含的重要功能基因,这些在群体间存在巨大频率变化的区段和基因可能是驯化过程中人工选择的靶点。利用这种分析方法,在高粱上鉴定出725个人工选择候选基因、大豆928个、黄瓜2054个、辣椒511个、普通菜豆2524个、粳稻1322个、籼稻1265个,其中73个基因在粳稻和籼稻上同时被检测到。进一步交叉对比分析发现,部分人工选择区段位于控制驯化相关性状的QTL区间,预示着可能与作物的农艺性状相关。例如,果实或籽粒重量是重要的驯化综合特征性状之一,驯化后,现代栽培作物的果实或籽粒重量大大增加。从野生醋栗番茄到樱桃番茄是个驯化过程,检测到186个选择清除事件,其中有5个QTL与之重叠;从樱桃番茄到大果栽培番茄是个改良过程,发生了133个选择清除事件,有13个基因与之重叠,其中包括以前认为是驯化基因的fw2.2。对黄瓜种质资源重测序分析发现控制果实苦味的关键基因位于第5染色体上一个物理长度为442kb的基因组区段,包含67个注释基因,该区段也是发生选择清除事件的区段。

以上主要是对重测序数据发掘的微小遗传变异(SNP或小于5bp的Indel)进行分析的结果,在大片段Indel、拷贝数变异(CNV)、有无变异(PAV)等结构变异检测上则由于具有偏向性和不完整性,无法准确发现那些在人工选择下丢失和新产生的基因。然而,研究表明,这些结构变异与作物重要农艺性状密切相关,越来越受关注。随着高通量测序技术进步和成本降低,为了完整地呈现基因序列及其变异特征的全貌并全面发掘驯化性状相关基因,Li等系统筛选出7份国内外代表性野生大豆,并分别进行从头测序、组装和分析,建立了可代表物种整体特点的野生大豆泛基因组。与栽培大豆参考基因组的比对,鉴定到328个野生大豆特有基因、16个栽培大豆特有基因、1978个拷贝数发生变化基因等结构变异,为研究作物遗传多样性及驯化历程提供了新的启示,奠定了解析重要驯化性状建成、发掘优异基因和相关标记的基础。

4.4作物的传播与地方品种的形成

作物从一个或多个地点驯化而成后,随着人类活动特别是人口迁移而传播到世界不同地区。历史上最突出的作物传播事件是哥伦布发现美洲后,美洲作物(如玉米、马铃薯、食用豆等)向欧洲、亚洲和非洲的迅速传播。在传播过程中,由于环境条件发生了改变,自然选择和人工选择使作物基因组经历了第二次较大的变化,由此产生了大量适应当地生态环境和人类生活习惯的地方品种。

利用基因组学理论和方法,可以追踪作物传播轨迹。最经典的例子是Mir等对玉米传播的研究,法国农业科学院与墨西哥、乌拉圭、泰国等合作,利用SSR标记,对799份来自全球的玉米地方品种(共11985个植株)进行了基因型鉴定,发现地方品种之间的遗传关系与地理来源有对应关系,基本澄清了亚非玉米的来源。有意思的是,研究发现中国南方和黄淮海的地方品种可能来自从葡萄牙和西班牙传入东南亚后再传入的墨西哥地方品种,而中国东北的地方品种可能来自过去100多年里从美国传入的地方品种。

需要指出的是,目的性更强的现代作物育种历史并不长,但所形成的现代品种(或品系)携带的目标性状更符合人类的需求。从基因组水平来说,强烈的人工选择使遗传多样性从地方品种到现代品种进一步降低,基因组中出现了除驯化相关区域之外的新选择区域。应用基因组学方法,全面分析野生近缘种、地方品种、现代品种这些种质资源,可更清楚地了解不同阶段产生的种质资源的遗传变异变化和人工选择区段及其与表型性状的关系。例如,Wang等利用60K油菜芯片对472份来自全球的油菜种质进行了分析,发现不同来源的种质资源遗传多样性存在差异,中国和欧洲油菜从20世纪50年代到80年代的遗传多样性呈增加态势,然后基本处于相似水平。在玉米上,现代育种对玉米基因组带来了剧烈变化,人工选择影响到上千的靶点(包括基因和非基因区域),导致核苷酸多样性降低和稀有等位基因频率提高。在番茄上的类似研究也取得了突破性进展。

5作物种质资源的结构多样性分析

全面了解种质资源的遗传结构是其有效保护和高效利用的前提。遗传多样性、群体结构和连锁不平衡分析是作物种质资源结构多样性分析的3个重要方面,彼此之间既有区别,也有关联。其中,群体结构是结构多样性分析的核心,也是发掘新基因的重要手段之一关联分析的重要基础,本文将着重讨论。

一般来说,SSR等常规标记即可用于群体结构分析。例如,Dang等利用262个SSR标记对419份中国水稻材料和121份越南材料进行了群体结构分析,发现该群体可分为7个亚群,连锁不平衡水平在10—80cM。由于类似论文发表众多,并且涉及很多物种,本文将不再赘述。近年来,直接利用序列信息或高密度标记进行群体结构分析越来越普遍,主要方法包括全基因组测序(如在番茄上)、重测序(在大豆、黄瓜、高粱、西瓜、芝麻、桃、鹰嘴豆、大麦、玉米上)、RNA测序及SNP芯片等,不仅可检测Indel、CNV、PAV等变异,而且能检测到大量SNP、SSR等变异,其中SNP变异广泛用于群体结构分析上。

5.1群体结构的统计学分析方法

通过群体结构分析可以了解种质资源中的亲缘关系、特定材料中某位点的来源等多种信息。分析种质资源遗传结构最常用的方法是层级聚类分析,以前直接用基因型数据估算遗传差异就可聚类分析,最近的研究发现先进行主成分分析(PCA)后再做聚类分析可以提高功效。主成分分析的优势是直观,缺点是难以获得数量化指标来判断群体结构数量及其材料间的相互关系。因此,Pritchard等提出基于贝叶斯模型的方法后迅速得到应用,使STRUCTURE成为目前用得最多的群体结构分析软件。此后,为了适应SNP大数据的快速计算,还开发出一些如基于最大似然法等的算法和软件(如FRAPPE和ADMIXTURE);2014年,Raj等又开发出fastSTRUCTURE,不仅功能强大,而且运算快速,值得推广。

5.2基于SNP数据的种质资源群体结构分析

SNP芯片数据和基于测序的SNP数据均可用于遗传多样性、群体结构和LD分析。但要注意的是,当利用SNP芯片数据分析时,在较少种质材料基础上开发的SNP应用于更广泛的种质资源时,可能出现估计偏差。例如,Frascaroli等对731个AFLP、186个SSR、41434个MaizeSNP50芯片SNP以及该芯片中30068个SNP(Panzea在14个玉米和16个大刍草材料基础上开发)和11366个SNP(Syngenta专为北美马齿种质开发)的基因型鉴定数据分别进行分析,发现尽管分群的总趋势相似,不影响群内种质的亲缘关系估计,但比较群间种质的关系时出现差异,认为相对来说Panzea的SNP标记较好。因此,利用遗传多样性最高的一套材料来开发的SNP芯片应用价值更高。

近年来,SNP用于群体结构分析的报道越来越多,使人们对种质资源认识的深度达到前所未有的程度。例如,在大麦上,Munoz-Amatriain等利用含7842个SNP的大麦SNPiSelect平台,对从来自全球100多个国家的33176份大麦种质资源中挑选出来的2417份大麦核心种质进行了基因型鉴定,STRUCTURE和主成分分析结果表明,这些材料可分为5个与地理来源和穗行数对应的亚群。Comadran等对190份西北欧洲和北美大麦种质进行了4596个SNP标记鉴定。Hamblin等利用1536个SNP标记对1816份美国育种项目的大麦种质进行了基因型鉴定,发现存在7个亚群,群体结构与穗类型、生长习性、育种项目有关。

在小麦上,Cavanagh等开发了一个含9000个基因相关的SNP芯片,对2994份小麦地方品种和育成品种进行了基因型鉴定,发现在现代育种中广泛利用的等位变异可追溯到祖先亲本,通过分析群体间的遗传分化和单倍型共享程度,可鉴定出遗传改良中受到选择的性状(主要是开花期和物候期)的等位变异。此外,Wurschum等利用9KSNP芯片对172份欧洲冬小麦种质资源进行了基因型鉴定,发现利用SNP和SSR获得的群体结构和遗传相似性结果存在一定差异,LD衰减距离在5—10cM,因而认为9000个SNP不能完全解析其群体结构。

在玉米上,Yan等利用含1536个SNP(来自582个位点)的玉米芯片,对632份来自热带、亚热带和温带的玉米自交系进行了基因型鉴定,发现存在亚群结构,LD衰减距离在染色体间存在差异(1—10kb),并且随稀有等位基因频率(MAF)增加和样品减少而变大;温带玉米的LD衰减距离比热带和亚热带玉米高大得多,因为后者多样性高且携带有更多的稀有等位基因。Lu等利用1943个SNP标记对287份热带玉米和160份温带玉米自交系进行了基因型鉴定,发现内含子SNP变异比外显子变异高,单倍型多态性信息含量比单SNP多样性信息含量高,遗传多样性水平和亚群结构与种质来源和驯化后选择存在密切关系;热带玉米比温带玉米遗传多样性高,但没检测到明显的亚群结构,其LD衰减距离(5—10kb)比温带玉米小(10—100kb)。Wu等利用含56110个SNP的玉米芯片对367份中国重要自交系进行了基因型鉴定,发现这些材料可分为国外种质和国内种质两组,在此基础上可进一步分为对应杂种优势群的5个亚组,即瑞德、兰卡斯特、P群、唐四平头和温热I群,并且各亚组中的遗传多样性存在较大差异。有意思的是,各个亚组均存在数目不同的保守基因组区段,平均LD距离为391kb,且不同染色体区域有差异。利用该芯片还对其他玉米种质资源如密里苏达大学培育的玉米自交系进行了基因型鉴定,获得一些重要种质的遗传信息。一个规模较大的玉米种质资源结构多样性分析工作是,Romay等利用GBS技术对美国国家种质库中的2815份玉米自交系进行了基因型鉴定,获得681257个SNP标记,其中半数以上属稀有等位基因;结果表明,尽管绝大多数稀有等位基因已被公益性温带育种项目利用,但商业用种质中并不多。另一方面,这些自交系呈现明显的群体结构,且3个亚群间的遗传分化程度为中等水平,LD衰减很快,但其程度与种质来源和基因组区域有关。

此外,在番茄上,Sim等利用含7720个SNP的芯片,对426份番茄种质进行了基因型鉴定,发现其中410份自交系可分为7个亚群,其中加工番茄亚群和鲜食番茄亚群可进一步细分,通过分析稀有等位基因频率,可鉴定出区分不同亚群的基因组区段,LD衰减与染色体和亚群密切相关,结果表明,栽培番茄种质资源的不同遗传结构是野生近缘种基因渐渗和根据市场目标的育种选择带来的。Wang等利用GBS技术,对242份高粱微核心种质进行了基因型鉴定,最后选出13390个SNP进行遗传结构分析,结果发现这些种质存在与地理来源和类群划分相关的群体结构,LD衰减距离为10—30kb。

5.3骨干亲本及其衍生品种的遗传结构与传递

骨干亲本及其衍生品种(或品系)是种质资源的重要组成部分,对其进行基因组水平的研究具有重要意义。如在玉米上,Wu等发现从骨干亲本黄早四到其衍生系中的基因组区段传递有一定规律,这些材料中存在15个保守区段,它们可能是黄早四成为骨干亲本的重要原因。肖永贵等利用90KSNP芯片分析了小麦骨干亲本京411及其14个衍生品种(系),发现京411衍生群体平均遗传相似性为57.9%,该亲本与其衍生一代和衍生二代相同的等位变异频率分别为63.9%和67.9%,显著高于理论值;在A、B和D基因组间的相同等位变异频率分别为62.2%、61.3%和74.3%。

6基于种质资源的新基因发掘

6.1连锁分析

利用2个材料作为亲本组配人工作图群体来进行新基因发掘,在近20年来已成为一种广泛采用的方法,但由于这种连锁分析方法难以体现种质资源的规模效应,本文将不作为重点进行评述。这里要提到的是,在连锁分析中构建高密度的SNP图谱可提高QTL位置的定位精度、提高QTL效应值估计精度和缩小QTL的置信区间,有利于QTL精细定位、图位克隆和候选基因挖掘,特别是由于近年来二代测序技术成本大幅度降低,构建高密度分子图谱将成为今后重要的发展方向。一种策略是先对双亲进行重测序,在高质量SNP中筛选部分均匀分布的标记构建SNP芯片,再用芯片对群体进行基因型鉴定。另一种策略是对所有作图群体个体或家系直接进行测序,再构建SNP图谱,如Huang等利用低倍测序基因型鉴定技术,对150个水稻重组近交系群体进行基因型鉴定,发现数据采集比常规方法快20倍,重组断点确定精度高35倍,主效QTL可定位到100kb的区间。Xie等提出了一种用低倍数测序(0.05×)建立高密度SNP图谱的方法,并在238个重组近交系群体中得到验证。Spindel等利用384重GBS技术,对包括176个水稻重组近交系的作图群体进行基因型鉴定,定位了30984个SNP标记,通过对叶宽和耐铝性进行QTL定位,检测到用1464个SNP进行作图所检测不到的位点。Liu等利用GBS技术对大麦重组近交系群体进行基因型鉴定、遗传作图和株高的QTL分析,精细定位到3个置信区间很小的重要QTL,对比物理图谱,找到了相关候选基因。

6.2关联分析

关联分析是利用历史积累的自然变异材料(即种质资源)来阐明基因型与表型的相互关系,因此,成为研究种质资源自然变异、发掘有利等位基因最佳的策略之一。关联分析有3种形式,即全基因组水平关联研究(GWAS)、区域水平关联分析和候选基因关联分析。

7种质创新

由于长期的驯化和遗传改良,当今的优良作物品种常遇到遗传基础变窄的瓶颈,迫切需要从育成品种外部导入新基因或引入新的等位变异。由于野生近缘种和地方品种的遗传多样性远远高于现代品种,因此,针对地方品种和野生近缘植物的种质创新研究已成为热点领域。随着基因组学的发展,种质创新研究工作正由过去的以表型选择为主转变为以分子标记选择和全基因组选择等为主,外源优异基因的鉴定和利用不断加快。

野生稻中蕴含着不少有可能用于水稻遗传改良的基因(如产量基因)。野生稻中的有利等位变异被广泛应用,基因组学方法起到了重要的推动作用。比如,将东乡野生稻染色体导入到籼稻品种桂朝2号中,构建了159个导入系,覆盖了东乡野生稻约67.5%的基因组,并从这些导入系中鉴定出一个来自东乡野生稻的抗旱渗入系IL23。构建了在粳稻品种特青背景下的120个云南元江野生稻导入系,并利用图位克隆技术获得一个来源于野生稻并控制水稻从匍匐生长向直立生长转化的基因PROG1。这些导入系中存在丰富的表型变异,为进一步鉴定和利用野生稻的优异等位变异打下了很好的基础。

小麦地方品种和野生近缘物种是拓宽小麦遗传多样性的主要基因源。例如,Hou等通过对1520份来源不同的小麦种质中影响淀粉合成的蔗糖合成酶基因TaSu1(定位在7A/7B/7D染色体上)和TaSu2(定位在2A/2B/2D染色体上)的序列比对,发现这两个基因在现代育种过程中被强烈选择,对千粒重的提高作出了贡献,但大量的稀有等位变异存在于地方品种中。簇毛麦6VS携带的白粉病水平抗性基因Pm21被成功地导入小麦中,在小麦育种中被有效利用。为了鉴定簇毛麦6VS携带的Pm21,Cao等利用大麦基因芯片筛选并克隆出一个簇毛麦抗白粉病基因的关键成员丝氨酸和苏氨酸蛋白激酶基因Stpk-V,该研究提供了一个反向遗传学研究策略,用来解决大片段外源染色体片段目标基因的分离和鉴定困难的问题。Zhang等利用类似抗病R基因序列开发出2个标记可以有效地检测和跟踪中间偃麦草携带的抗黄矮病(BYDV)基因。Sr33从近缘物种粗山羊草引入小麦中,被发现可以增强小麦对Ug99新强毒性生理小种的抗性,Periyannan等采用图位克隆方法将Sr33克隆出来,发现其编码一个含有R基因功能域的抗性蛋白。Munns等报道将二倍体野生栽培一粒小麦的耐盐碱基因TmHKT1;5-A导入四倍体硬粒小麦中,可以增强其抗盐碱能力,在盐碱土地上生长较对照增产25%。

玉米栽培品种中蕴含丰富的遗传变异,因此,野生近缘种的利用相对较少,但也取得一些进展。例如,中国科学院遗传研究所利用远缘杂交方法将大刍草导入自交系330,选育而成遗单6号单交种,提高了茎秆强度和抗倒性,兼抗大、小斑病、青枯病,具有保绿性能好的特点。河南省农业科学院将大刍草基因导入自交系掖478等优良自交系,从中选育出抗逆性强的郑远36、郑远37等新系。Amusan等报道从二倍体多年生大刍草和玉米的回交后代中选出抵抗寄生杂草菟丝子的自交系。Chia等认为可以利用摩擦禾属的多年生、抗寒、抗旱外源等位基因改良玉米。

中国是世界上保存野生大豆资源最多的国家,野生大豆具有高蛋白、多花多荚丰产特性、对病虫害和非生物逆境的环境适应能力和人类需求的特殊功能性状。Concibido等报道引入野生大豆种质PI407305的QTL到栽培大豆中,2年多环境试验表明可以将商业推广的大豆品种产量提高9%。为了鉴定和利用野生大豆种质的优异基因资源,利用野生大豆种质N24852为供体,以栽培大豆优良品种NN1138-2为受体,构建了染色体片段置换系。

8展望

随着多个重要农作物和一些模式植物全基因组测序的完成和高通量重测序技术的普及,为作物种质资源研究提供了跨越式发展的机遇。如何把基因组学理论、方法及其成果与作物种质资源研究的各个环节有机结合起来,提高种质资源保护的安全性和利用的高效性,已成为中国作物种质资源工作者的重点任务。

8.1中国目前的国家作物种质资源保存体系中长期保存库和种质圃保存了45万份种质资源(约2300个物种),此外还建立原生境保护点163个。因此,需要充分应用基因组学理论和方法,对中国保存的种质资源和野生近缘种居群进行系统评价,科学制定中国种质资源下一步的收集策略与保护重点。同时,探索各种基因组学技术方法,为种质资源的有效保护提供新手段。

8.2尽管中国在种质资源表型精准鉴定和全基因组水平的基因型鉴定方面开展了部分工作,但涉及的作物种类及其资源数量极为有限,对库存种质资源的遗传多样性缺乏系统和深入研究,很难为育种家和基础理论研究者提供针对性的资源。因此,一方面,应针对未来育种需求的重要性状,开展多年多点的或控制环境条件下的表型鉴定评价;另一方面,应充分利用高通量的测序技术和SNP芯片技术,在全基因组学水平对中国的作物种质资源进行系统的基因型鉴定,并在此基础上,开展遗传多样性和群体结构等分析,全面了解中国的种质资源自然遗传变异“家底”。

8.3作物种质资源具有数量多、覆盖面广的特点,目前,中国种质资源的深度发掘力度还较为薄弱。因此,需要充分利用关联分析和连锁分析等手段,在强化重要性状表型精准鉴定的基础上,发掘能满足未来育种需求的优异种质资源和基因,使库存种质资源能得到高效利用。如果进一步拓展,可把表型组学、转录组学、蛋白组学、代谢组学、表观组学等有机结合起来,用系统生物学的思路和方法,开展种质资源的变异组学研究,阐明控制重要性状的遗传和分子基础,挖掘有利等位基因并得到应用。

8.4中国的作物种质创新目前在很大程度上还停留在现代品种的进一步改良上。因此,需要充分应用基因组学理论和方法(包括分子标记、全基因组选择、基因组编辑等),重点突破野生近缘种和地方品种的创新利用瓶颈,不断拓展现代作物育种的遗传基础。

8.5目前中国的作物种质信息系统中主要涵盖的是护照信息和基本农艺性状信息,育种家和其他用户感兴趣的信息不多。因此,需要重建数据库系统框架,把基因组信息(包括基因型数据、基因信息、等位基因信息、标记信息等)、目标性状表型信息、谱系信息、生态环境信息进行整合,研发种质资源新型统计分析方法,使信息系统数据更实用、界面更友好、使用更简单、服务更便捷。(作者中国农业科学院作物科学研究所黎裕、李英慧、杨庆文、张锦鹏、张金梅、邱丽娟、王天宇,参考文献略,有删节)


图文来源网络 如有侵权 请联系删除

扫描二维码关注智农361公众号,了解更多农事资讯

手机长按二维码识别

[责任编辑:zhangxuqin] 标签: 种质 基因 基因组 测序 遗传
您可能喜欢的

友情链接

微信分享