当前位置:  农事资讯新闻速递乡村建设

大数据:植物育种的加速器

2015-06-28来源:《高科技与产业化》
分享到: 更多
   切换手机版

人类对植物品种的选育始于约1万多年前。在相当长的一段时间内,植物都是通过天然杂交和变异产生了一些符合人类需求的品种。直到18世纪,才首次出现人工培育的杂交种(石竹和烟草等),此后随着遗传学和生物统计学等相关学科的发展,植物育种也进入快速发展阶段。20世纪60年代后期出现的以小麦半矮秆育种为主的绿色革命,加上杂种优势在玉米和水稻中的推广和应用,以及农药和化肥的大量施用,全球谷物产量在35年内增加了2.5倍以上。

然而,传统的育种手段需要消耗大量的人力物力,培育一个品种需要10年左右的时间。而据联合国统计,到2050年全球人口将激增到90亿。前所未有的人口压力将推动新的技术手段应用于植物育种,这其中包括当前在各行业方兴未艾的大数据技术。

大数据育种

培育出好的品种需要对成千上万份种质资源材料进行杂交配组和筛选。为提高效率,科学家们会对这些材料进行深入了解。早在2000年,孟山都公司就已经在Science上发表了水稻基因组的序列。2009年拜尔公司宣布完成了油菜基因组的测序。随着第二代测序技术的普及,测序成本已经越来越低。种业公司对众多的玉米、大豆、水稻和油菜等材料进行了基因组重测序或转录组测序,分别为这些作物找到了上百万个单核苷酸多态性位点(SNP)。植物基因组数据的大小已经达到了TB甚至PB级别,对这些数据的存储、分析和管理成为目前大数据技术的一个热点。

通过对测序数据进行处理,并应用高度自动化的SNP分子标记检测设备,科学家们能在短时间内检测出成千上万份材料的基因型,从而判断出不同材料之间的关系,为有效进行亲本选配奠定基础。

许多育种项目,尤其是生物技术育种项目,都需要在温室进行表型检测。为减少该环节的人为参与,提高温室使用效率和数据采集的精确性,孟山都和杜邦先锋公司都采用了温室自动化技术,包括对温室中的每一株植物进行编号,定期使用传送带将植物送到数据采集室,通过多方位和多光谱自动照相技术采集相关数据,再通过图像分析处理技术建立相应的生长模型,以还原植物在特定处理条件下的生长情况。

对植物大田表现的观察在育种中必不可少,通常也是最费时费力的一个关键环节。虽然目前的田间数据采集还是以人工采集为主,但移动设备在田间数据采集中已得到广泛应用。加上一些手持式的测量仪器,育种家在田间即可把植物生长的数据,包括照片和视频等录入数据库。随着物联网技术的发展,育种家可以在田间部署各种传感器,记录植物生长期间包括光照、温度、湿度、风力、土壤水分等数据,还可通过高清摄像头定期或连续记录每个小区甚至每个单株的生长情况。此外,无人机和遥感技术在田间也得到越来越多的应用。通过在无人机上装载诸如可见光、近红外、高光谱或全光谱等不同类型的摄像头,育种家们可以对小区或大面积的品种生长进行观察,并测定产量。

表现型数据与基因组数据如何结合呢?大田和温室表现型记载的数据繁多,类型也比较丰富,包括数字、日期、文字、图片和视频等。同一个品种往往需要在不同的年份和不同的环境中进行测试,这样就产生了海量的结构化和非结构化的表现型大数据。要从这些纷杂的数据中找到真实评价品种在不同生态环境下的表现规律,需要进行大量的统计分析来建立数据模型。通过整合表现型大数据与基因组大数据,科学家们已经能够发现基因组分子标记和田间表现的关联,再运用自动化的种子切片技术,在实验室即可对大量材料进行筛选,从而大大减少田间的工作和花费。孟山都和杜邦先锋的科学家们在收获季节都有超大量的数据运算,以在两周到一个月的时间内决定哪些组合材料能进入下一轮种植和选育。

还有农业环境数据。植物品种在推广过程中面临着复杂多变的生态环境,各地区的光、温、水、气、病虫害等条件都有差别,同一地区不同地块之间也存在土壤肥力和小气候的不同。为帮助农户更好选择品种,2013年国际种业巨头孟山都公司斥资近10亿美元收购了气候公司(Climate Incorporation),2014年又收购了Solum公司的土壤分析板块,以增强其在土壤气候观测和模拟以及农业数据模型方面的实力。这一收购立刻成为种业公司应用大数据的典型事件。此外孟山都公司还花费2.5亿美元收购了精确播种公司(Precision Planting),并推出面向农户的应用软件——Field Scripts,为肥力不均的地块提供最佳的作物品种选择和播种方案。另一种业巨头杜邦先锋公司则于2013年与农机巨头约翰迪尔(John Deere)合作,推出具有相似功能的Field360。这些事件充分体现了国际种业公司中重视环境大数据的决心和能力。

大数据在中国

我国目前有5200多家种子企业,销售额过亿元的有119家,前50强种子企业销售额已占全国30%以上,较大型企业如隆平高科、垦丰种业等销售额已近20亿元人民币,市场集中度正逐步提高。但目前我国种业规模普遍较小,育种的主体仍然是科研单位和大专院校。虽然育种方法仍然以杂交选育和田间筛选等常规手段为主,但大数据的身影已在我国种业开始显现,举例如下:

●3K水稻基因组序列。中国农科院、国际水稻所和华大基因对约3000份来自于世界各地的水稻资源材料进行了深度测序,总数据量达到15TB以上,并从中发现了约1900万个SNP数据。

●高通量SNP检测。华智水稻生物技术有限公司一次反应最多能产生20万个数据点,可为种业在短时间内处理检测成千上万个样本。中国种子集团则自行开发了水稻6K和90K的SNP芯片,可对外提供SNP检测服务。

●自动化温室。目前已有中国农科院生物技术研究所、中科院上海逆境研究中心和垦丰种业等单位引进了自动化温室设备,可对生长的材料进行自动化表型采集。

●大田数据采集。北京市农科院正在开发和应用大田环境传感器、大田植物生长高清监控、无人机数据采集和自动化考种等系统,并推出了金种子育种软件系统,可使用手机进行大田数据采集工作。隆平高科等种业公司在建设其商业育种体系中已开始使用育种信息化软件。

大数据带给传统育种的冲击不仅在于数据采集方式上的变化,更是决策体系的变化。未来的植物育种将更多的依靠数据和软件系统,而非育种家的经验来决定某一个材料是否进入下一轮筛选。与国际种业相比,目前我国在种业大数据研发方面的差距不算太大,而应用则落后很多。如果对大数据技术不加以广泛应用,我们在研发水平上将很快落后于世界。为加强科研单位和种业企业之间的交流和成果转化,在农业部指导下,我国12家大型种业企业共同投资成立了华智水稻生物技术有限公司。华智致力于提供高通量分子检测和育种信息管理系统等服务,为种业公司产生、管理和分析育种大数据。

未来5~10年内,我国种业将需要一批既懂植物遗传育种,又懂生物信息和大数据技术的专家来打造企业的研发信息系统,从而促进大数据在种业中的应用。从人才培养上,我们一方面需要加强对农业院校大学生和研究生的计算机、生物信息和统计学方面课程的教学,鼓励学科间的交叉和学术交流。另一方面也要对现在和未来的育种专家进行新技术培训,让信息化和大数据育种被广泛接受。

可以预见,我国的种业将很快应用高通量的测序和自动化检测设备。在田间,育种家们将戴着google眼镜,手持平板电脑,通过无人飞机在大田进行数据采集,各种传感器和摄像头在田间源源不断地将土壤和环境信息传送到位于云端的数据中心。在数据中心,各种信息得到汇总、整合和分析。

作者单位:华智水稻生物技术有限公司


图文来源网络 如有侵权 请联系删除

扫描二维码关注智农361公众号,了解更多农事资讯

手机长按二维码识别

[责任编辑:cuiyongxin] 标签: 大数据 植物 育种

友情链接

微信分享