作者:徐益等   来源:   发布时间:2021-10-12   Tag:   点击:
[麻进展] 主要麻类作物基因组学与遗传改良:现状与展望
 要:随着测序技术的发展,主要麻类作物(黄麻、红麻、苎麻、亚麻和工业大麻)参考基因组从 2011年至2020年陆续完测序,这标志着麻类作物科学已经进入基因组时代。文章首先详细概述主要麻类作物基因组测序。其次,评述了基于基因组学的麻类作物重要应用价值基因挖掘。基于参考基因组和转录组测序,大量关于纤维发育、响应非生物胁迫的候选基因被挖掘,以促进麻类作物纤维的物种特性和“不与粮食争好地”的逆境农业。同时不同麻类作物特异性状候选基因陆续被报道,如红麻雄性不育、亚麻种子含油量和大麻大麻素相关候选基因等。再次,麻类作物基因组测序完成为基于组学的麻类作物遗传改良提供可能:有助于麻类作物种质资源形成和演化机制研究,系统解析纤维产量、纤维品质、抗病耐逆等农艺性状形成的分子基础;有助于建立高通量基因型-表型数据库,挖掘优异基因资源与创制新种质;有助于创新并集成分子标记辅助选择、基因组选择、转基因等技术,建立高效的快速育种技术体系。宜选育高产高效、抗逆抗病、适宜轻简化机械化、优质专用的多用途麻类作物新品种,以满足麻类作物相关产业的市场需求,适应麻类作物生产方式。尽管已经获得重要基因以及位点的信息,但如何高效率利用已有基因资源对麻类作物进行遗传改良仍需面临一系列挑战,如:成熟稳定的遗传转化体系、麻类作物基因编辑体系构建及基因组选择育种等。
关键词:主要麻类作物;基因组;基因;遗传改良
 
黄麻、红麻、苎麻、亚麻与工业大麻在种植历史上曾经超过 300 万公顷面积,属于大面积栽培的麻类作物(以下简称主要麻类作物),与粮、棉、油、菜并列为第 5 大作物群,其种植历史可追溯到远古新石器至尧舜时代。主要麻类作物是重要的天然韧皮部纤维作物,其韧皮部纤维(麻皮)主要用于麻线、麻绳、麻袋、麻布等包装用纺织,还用于家饰板材等多功能用途;其天然活性成分在食品、日用、医药等领域价值逐步开发,推动生命健康产业发展。主要麻类作物分布范围广,在热带、亚热带、温带和寒带均有分布。我国的华南、长江流域、黄淮流域、淮河流域到东北(辽宁、吉林、黑龙江)、西北(新疆、宁夏、内蒙古)等均可以种植。主要麻类作物生物学产量高,且耐盐碱、耐干旱、耐洪涝、适应性广,不与粮、棉、油、菜争好地,可用于盐碱地或重金属污染农田的植物修复,发展主要麻类作物将带动我国逆境农业和麻类作物多功能利用的发展。
1986年提出基因组学的概念,其相关研究不断深入并被广泛接受,目前基因组学已成为生命科学领域活跃且有影响的科学。模式植物拟南芥率先完成全基因组测序,这是第一个完成的植物基因组序列,随后水稻也完成全基因组测序。随着测序技术的发展,越来越多的植物进行了全基因组测序,其中包括主要麻类作物(黄麻、红麻、苎麻、亚麻和工业大麻)。这些主要麻类作物的全基因组测序,可以提供该作物全基因组的遗传信息,尤其是对控制重要农艺性状的位点或基因的深入挖掘,以及对调控复杂性状的分子网络的解析奠定了重要基础。
本文旨在总结主要麻类作物基因组学和遗传改良研究的最新进展,对于引领加快麻类作物遗传育种研究具有重要意义。
1 主要麻类作物全基因组测序研究概况
以联合国粮食及农业组织的 2007 年至 2018 年数据来看,在世界范围内,黄麻和红麻在收获面积、产量和农业生产价值均占据麻类作物之首,其次是亚麻、苎麻和工业大麻。其中我国黄麻和红麻的收获面积、产量和农业生产价值居世界第三(图1)。主要麻类作物基因组测序从 2011 年到 2020 年陆续公布,分别涉及锦葵科、荨麻科、亚麻科和大麻科,基因组最小的是圆果种黄麻336 Mb,最大的是红麻1078Mb(表1)。
1.1 黄麻基因组
黄麻基因组草图于 2017 年发表,经组装发现,长果种 O-4 和圆果种 CVL-1 基因组大小分别为 445 Mb(13.04 Gb raw data,scaffold N50 为 3.3 Mb)和 338 Mb (13.69 Gb raw data,scaffold N50 为 4.1 Mb),分别有约8.4%和 17.8%的数据无法覆盖,表明该研究只是得到了黄麻基因组草图。为了获得高质量的黄麻参考基因组,福建农林大学于 2015 年开展黄麻转录组、基因组调研图和流式细胞仪分析。在此基础上,以黄麻国家区域试验对照品种长果种宽叶长果和圆果种黄麻179为材料,以三代测序技术PacBio RS II 为主体,Hi-C染色体构象捕获技术等技术辅助,获得了长果种和圆果种黄麻染色体级别的参考基因组,其基因组大小分别为361 Mb和336 Mb。与已发表的黄麻长果种O-4和圆果种CVL-1 基因组相比,组装指标有了极大的提升。
黄麻全基因组的系统发育树显示,圆果种和长果种黄麻均与可可和雷蒙德氏棉聚为一类,表明黄麻属于锦葵科。需要指出的是,关于黄麻属于锦葵科还是椴树科一直以来存在争议。为了验证这一结论,考虑到叶绿体表现为母系遗传,其基因组被广泛应用于植物的系统发育关系分析,整理圆果种黄麻和长果种黄麻以及红麻的叶绿体基因组的系统发育关系结果发现,黄麻圆果种和长果种在亲缘关系上与棉属更近(附图1)。这进一步佐证黄麻属于锦葵科,而不是基于植物形态学分类的椴树科。
 
  
1.2 红麻基因组
红麻(Hibiscus cannabinus, 2n=36)是锦葵科木槿属的一年生常异花授粉作物,属于短日照喜温类型。2020年福建农林大学率先绘制高质量红麻参考基因组图谱,该研究以红麻优良品种福红952为材料,采用二代加三代的测序策略,同时结合Hi-C染色体构象捕获技术和高密度遗传图谱,完成红麻全基因组测序和组装工作,其基因组大小约为 1078 Mb,contig N50为2.73Mb,共鉴定到 66,004个基因。红麻与拟南芥、水稻、亚麻和棉花的蛋白编码基因比较发现,2195个基因是红麻所特有的,包括67个NAC和47个MYB转录因子。比较基因组学分析发现,红麻与雷蒙德氏棉在分化后存在一次独立的全基因组复制事件(whole genome duplications, WGD),导致红麻绝大多数基因拷贝数加倍。利用核心种质重测序数据,群体遗传学分析显示,红麻起源于非洲,沿着非洲南部、非洲西部的路线传播到亚洲,并在传播过程中发生了2次驯化事件。在参考基因组基础上,该研究确定了控制红麻叶形的基因为LATE MERISTEM IDENTITY1 (LMI1)转录因子,并用病毒诱导的基因沉默(virus-induced gene silencing, VIGS)验证了其基因功能。
1.3 苎麻基因组
苎麻(Boehmeria nivea, 2n=28)为荨麻科苎麻属多年生宿根性草本植物,单性花,雌雄同株,花序复穗状,雄花花序生在茎的中下部,雌花花序生于梢部。我国的苎麻产量占全世界苎麻产量的90%以上。
2018年2个苎麻基因组草图陆续公布,以Zhongzhu 1为测序品种,得到一个 341.9 Mb的基因组草图,contig N50和scaffold N50分别为22.62 kb和1226.36 kb,鉴定出30,237个蛋白编码基因。苎麻作为荨麻科中第一个被测序的物种,可对该物种的多样性和物种形成等研究提供参考。比较基因组学发现,苎麻有1075个独有的基因家族,包含4082个基因,其中分别有5个和10个被注释为假定的CesA和WAT1相关蛋白。分析这15个基因所编码的蛋白结构域发现,5个假定 CesA 蛋白和3个假定WAT1 蛋白有相应的保守结构域,表明这些基因可能分别是真实的 CesA和WAT1相关基因,且与苎麻纤维产量有关。与其他4个物种(川桑、大枣、西瓜和亚麻)的 CesA和 WAT1相关蛋白的系统发育分析进一步证实,5个 CesA和3个 WAT1相关基因是苎麻特有的。进化树分析发现106个自然选择的基因,其中22个与氮代谢有关,这些基因可能与苎麻的粗蛋白含量和营养生长性状驯化相关。这些研究为苎麻遗传育种和分子研究提供了理论基础。
1.4 亚麻基因组
2012年以CDC Bethune为测序品种,得到一个373 Mb的基因组草图,contig N50为0.02 Mb,scaffoldN50为0.69 Mb,鉴定出43,484个基因。最近,甘肃农科院分别对油用亚麻品种、纤维用亚麻品种和白胡麻测序得到染色体水平参考基因组,组装得到的基因组大小为别为 306.0、303.7和293.5 Mb,其中contig N50/scaffold N50 分别为 131 kb/ 1235 kb、156 kb/700 kb 和 59 kb/384 kb,在每个基因组中大约预测到 43,500个编码基因和2600~2800 个非编码 RNA;系统发育分析表明,栽培亚麻和白胡麻在大约232万年前发生了分化,自古被子植物的六倍化事件以来,亚麻发生了2次WGD事件。在最近一次WGD 事件中,MYB46/MYB83 基因拷贝数发生了扩张,可能促成了亚麻独特的次生细胞壁生物合成,对 MYB46/MYB83基因的定向选择可能形成了当前的油用和纤维用亚麻的形态类型。对83份亚麻种质资源重测序,在油用亚麻中,油脂相关基因(LOX、FatA、LTP 和 PDH-E2)和种子大小相关基因(BIN2和GW5)受到选择;在纤维用亚麻中,次生细胞壁生物合成相关基因(MYB46-1、XTH和ROPGAP3)和植物株高相关基因(GA3ox、GA20ox和GID)受到选择。
1.5 工业大麻基因组
2011年工业大麻基因组草图发表,该研究以一种广泛应用于药用的大麻品种 Purple Kush为测序品种,组装得到一个534 Mb 的基因组草图。2020 年 5 月公安部物证鉴定中心发表了一个高质量染色体水平的野生大麻参考基因组,其基因组大小为 808 Mb,contig N50 为 513.57 kb,scaffold N50 为 83 Mb,相对于 2011 年发表的大麻基因组草图(contig N50 为 2.8 kb;scaffold N50 为 16.2 kb)有很大的提升。统计其重复序列高达 74.75%,注释到了 38,828 个蛋白编码基因。然而目前为止籽用大麻基因组还未公布,待籽用大麻基因组公布之后,以期比较基因组学在 3 种不同用途的大麻之间挖掘更丰富的变异位点,为不同用途的大麻育种提供更多信息。
2 主要麻类作物重要应用价值基因挖掘
纤维发育与非生物胁迫相关基因的挖掘一直是主要麻类作物遗传改良的重要方向。随着主要麻类作物全基因组测序陆续被报道,很有必要系统总结回顾 NGS 技术对主要麻类作物纤维发育相关基因挖掘(附表1)、响应各种非生物胁迫的遗传机制(附表2)和麻类作物特异性状候选基因的最新报道(附表3)。为了表述方便,不同麻类作物分开阐述。每个麻类作物分别从纤维发育、非生物胁迫和麻类作物特异性状3个方面展开。
2.1 黄麻重要应用价值基因挖掘
2.1.1 黄麻纤维发育相关基因
纤维发育的分子机制解析属于麻类作物遗传改良研究的重要方向。为鉴定纤维发育相关的基因,在黄麻纤维发育关键时期进行转录组测序,共组装出48,914 个 unigenes,其中有5个Susy、3个UGPase、9个CesA、18个CSL、2个Kor (Korrigan),它们可能参与黄麻纤维素生物合成。长果种黄麻茎皮转录组分析显示,次生代谢产物的生物合成在代谢途径中显著富集,其中26个基因持续上调,包括4个参与葡聚糖代谢的基因,调控茎皮韧皮部的发育。对一个纤维缺陷突变体进行转录组测序发现,CAD7在突变体的韧皮部组织中的任何生长阶段都显著下调,且CAD7在生长早期的表达下调是伴随着次生细胞壁特异性基因纤维素合成酶A7(CesA7)和阿拉伯半乳聚糖糖蛋白6 (FLA6)的共同上调,这可能与黄麻纤维中协调木聚糖 S 型的沉积有关。黄麻全基因组测序显示,在纤维素合成途径中MYB83、WOX4、APL和HAT22的表达较高。抑制差减杂交被成功应用于黄麻纤维发育过程中相关基因的鉴定,以纤维素含量极低的突变体作为试验组,纤维素含量正常的品种作为对照组,共鉴定出377个功能已知的基因。其中,COMT、CCR和4CL在正常植株中的表达明显高于突变体,表明这些基因可能参与黄麻木质素合成,且4CL是起主要作用。
2.1.2 黄麻非生物胁迫响应基因
解析麻类作物非生物胁迫响应的分子机制是其遗传改良的又一重要方向,包括盐胁迫和干旱胁迫等。黄麻盐胁迫下转录组测序显示,在叶和根中分别检测到 32个和196个差异表达转录因子,其中有11个在2个组织中均被检测到;在叶片中的差异表达转录因子家族包括 HB和 HSF,而在根中的差异表达转录因子家族包括 MYB、WRKY和CCAAT。脱落酸ABA 信号通路是植物盐胁迫反应的核心,在此途径上发现了20个差异表达基因,包括编码PP2C、SnRK2、ABF(上调)和 PYL(下调)的基因。在细胞分裂素途径上发现,在高浓度盐胁迫下,叶和根中的 CRE1、B-ARR和A-ARR 均下调,而大多数 AHP 基因上调,表明它们负调控细胞分裂素信号以提高植物的耐盐性。黄麻耐旱品种和敏感品种的比较转录组分析,在干旱敏感型品种中,鉴定出34个转录因子差异表达基因和23个蛋白激酶差异表达基因,其中包括19个类受体激酶(receptor like kinases, RLKs)。这些 RLKs 在干旱胁迫下大部分下调,说明它们是黄麻抗旱机制的负调控因子。此外,3-ketoacyl-CoA合酶(3-ketoacyl-CoA synthase,KCS)的表达能显著提高黄麻抗旱性,构建 KCS 基因的过表达和基因编辑载体,并用于黄麻植株的转化,发现KCS 基因的过表达不仅增加了叶绿体的数量,还增强了植株的抗旱性,提高了木质素含量、生长速率、茎皮厚度和茎粗。
2.1.3 黄麻特异性状相关基因
黄麻2个栽培种(或亚种)在表型上存在较大差异,如:长果种的果荚为长条形状,种子颜色为墨绿色;圆果种的果荚为球形,种子颜色为棕色等。不仅如此,长果种为常异花授粉作物,圆果种为自花授粉作物,然而造成2个栽培种间形态或重要性状差异的遗传机制目前还有待深入研究。
2.2 红麻重要应用价值基因挖掘
2.2.1 红麻纤维发育相关基因
与黄麻纤维不同的是红麻韧皮纤维中纤维素含量相对较低,木质素含量较高。红麻基因组不仅揭示了一些参与韧皮纤维次生壁合成和纤维素沉积的基因,如:MYB、SND和CesA等,还结合QTL定位鉴定出MYB83和MYB103这2个可能参与细胞壁形成的基因,而MYB83也是红麻在驯化过程中的受选择基因。因此 MYB83 可能在红麻纤维发育过程中发挥重要作用。转录组分析揭示出317个淀粉和糖代谢途径的基因,可能参与纤维素生物合成。在此之前CAD、CCoAOMT、C3H、HCT、F5H和COMT被报道在木质素生物合成中起关键作用。红麻在开花后纤维累积速度显著降低,因此延后红麻开花期也是提高纤维产量的一个途径,在红麻光周期调控途径中可能存在类似拟南芥 GI-CO-FT的保守途径:短日照条件下,GI表达量上调促进CO表达,从而促进植物开花,GI和CO这2个基因在光敏感和光钝感种质中表达存在差异,说明这2个基因可能参与红麻光周期调控。
2.2.2 红麻非生物胁迫响应基因
红麻本身作为一种耐旱、耐盐碱、耐贫瘠、易栽培的作物,研究红麻耐盐碱机制,培育红麻耐盐碱种质可将红麻种植转向盐碱地,减少用地压力。比较盐胁迫下红麻的转录谱发现,盐胁迫下转录因子NAC、BZIP、AP2/EREBP、ARF、AP2/ERF、bHLH、TCP均上调,有8个NAC转录因子和2个WRKY转录因子表达下调,这些转录因子可能通过多种不同途径参与了红麻的耐盐性。基于转录组,不少学者对红麻非生物胁迫产生响应的基因进入了深入挖掘,认为WD40-1基因是红麻ABA 和MeJA信号转导途径、盐和干旱胁迫应答途径的关键枢纽基因;外源镉和盐处理能够显著诱导WRKY20表达,该基因可能参与调控红麻逆境胁迫反应,但仍需要更多试验验证 WRKY20 在红麻逆境胁迫中的生物学功能。Wei 等分离鉴定红麻6个HDACs 基因(HDA2、HHDA6、HDA8、HDA9、HDA19、SRT2),亚细胞定位显示,HDA2 和 HDA8位于细胞核中,HDA6和HDA1位于细胞核和胞质中,而HDA9位于细胞核和质膜中,这6个基因均为红麻盐胁迫和干旱胁迫的响应基因。
2.2.3 红麻特异性状相关基因
作物细胞质雄性不育(cytoplasmic male sterile, CMS)是作物杂种优势利用的主要途径,2004 年选育出红麻 CMS 系 K03A,实现了三系配套,自此红麻育性相关研究越来越多,与红麻育性相关的基因也被陆续报道。赵艳红等在红麻线粒体基因ATP9中发现一个与雄性不育细胞质相关的47bp缺失,这47 bp缺失片段分别与线粒体转运信号和GFP的ATP9融合,形成2个嵌合基因MTS-HM184-GFP和MTS-HM184,将含嵌合基因的载体转入烟草发现,部分转基因植株为雄性不育后半不育,并基于ATP9 基因开发的分子标签MM556可用于红麻不育细胞质的鉴定。对不育系和在保持系花药进行比较转录组分析发现,ATP6在三羧酸循环(tricarboxylic acid cycle,TCA cycle)中起直接作用,在不育系中表达量下降了5.6倍。随后ATP6基因也被报道因为其CDS中存在33-bp的缺失和 3-bp 的插入,导致红麻细胞质雄性不育。ATP6与 MYC2b蛋白之间存在互作,导致红麻细胞质雄性不育,而ATP6与MYC2a、MYC2b蛋白之间均存在互作时,红麻表现为可育。TIR1基因编码一个富含亮氨酸重复的F-box蛋白,而F-bo蛋白被报道出在花器官发育中有重要功能,且在花药期不育系中TIR1基因表达显著高于保持系,这可能导致花药败育。目前认为雄性不育主要包括由线粒体基因和核基因共同控制,然而又有报道通过RNA编辑技术发现叶绿体基因也可能与红麻细胞质雄性不育有关。红麻细胞质雄性不育基因及其调控机制还有待深入研究。
2.3 苎麻重要应用价值基因挖掘
2.3.1 苎麻纤维发育相关基因
苎麻纤维中纤维素含量高于黄麻且木质素含量远低于黄麻,纤维品质比黄麻好。转录组测序鉴定出36个纤维素合酶基因,其中有33个在茎皮中的表达远高于其他组织。随后CesA1、CesA2、CesA3和 CesA4也都被陆续报道在韧皮部或木质部表达参与次生细胞壁合成。对苎麻野生种和栽培种的转录组进行比较发现,高纤维素含量品种的驯化可能与WAT1 基因的正向选择有关。WAT1相关的基因在苎麻基因组中也被注释为与纤维产量的相关基因。对木质素含量的遗传基础进行分析发现,3个位于木质素含量 QTL 区域的基因,在纤维发育的2个不同阶段都有不同的表达,且它们分别编码 MYB 蛋白、莽草酸羟基肉桂酰转移酶和漆酶。Tang 等发现,PAL、C4H、4CL1、F5H、CCAOM和CAD的表达量均与木质素含量成正比,但苎麻4CL3重组蛋白在催化过程中以肉桂酸为底物,因此对木质素合成有负调控作用,推测苎麻4CL3主要参与苎麻黄酮类化合物的合成,4CL1主要参与木质素的合成。探索 NAC 与 MYB 对调控苎麻纤维次生细胞壁发育的作用发现,NAC19 和 NAC24 过表达能够上调苎麻次生壁发育关键基因 MYB46 的表达量,从而导致次生壁纤维的生物合成增加;NAC19 有可能直接参与细胞程序性死亡调控次生细胞壁发育,而 MYB46 可能在苎麻纤维成熟中发挥重要作用。对不同区段的茎皮进行转录组测序发现,乙烯和赤霉素可能参与的苎麻韧皮纤维组织发育,这说明研究调控苎麻纤维发育的相关基因可以间接从乙烯和赤霉素合成酶入手。
2.3.2 苎麻非生物胁迫响应基因
非生物胁迫严重影响苎麻的产量与品质。基于苎麻转录组,筛选出 8个WRKY转录因子,与其他作物已报道的10个具有抗旱功能的WRKY转录因子对比,推断这个8个WRKY转录因子也可能参与苎麻干旱胁迫响应。ACO1、bZIP1和 α-amylase也被证实响应苎麻 ABA、干旱和高盐逆境胁迫,将苎麻 GS2 基因转入烟草发现,其显著提高转基因植株的生物量和氮利用效率,从而减轻外界非生物胁迫。PCS1、MYB83、G6PDH1和 NRAMP1也都被陆续报道出能响应重金属镉胁迫。此外,Chen 等发现 73 个 miRNAs,它们介导苎麻对重金属镉胁迫的响应。
2.3.3 苎麻特异性状相关基因
苎麻是一个杂种优势利用率较高的作物,对苎麻育性相关基因的挖掘能为其雄性不育机理研究奠定基础。目前已经报道出的与苎麻育性相关的基因有 ATPA、ATP6和ATP9。
2.4 亚麻重要应用价值基因挖掘
2.4.1 亚麻纤维发育相关基因
亚麻纤维中纤维素含量高于黄麻,木质素含量远低于黄麻,纤维品质优于黄麻。基于亚麻基因组信息,鉴定出 32 个与亚麻纤维发育相关的候选基因,其中 16 个编码纤维素合成酶(CesA),16 个编码纤维素合成酶类蛋白(Csl),利用 VIGS 沉默这些基因后,韧皮纤维的数量和结构受到了严重的影响。亚麻纤维素生物合成的调节涉及CesA的表达调控、胞质中纤维素合酶复合体的装配、纤维素的沉积等多个方面,但对Csl蛋白的功能尚不清楚,而 CesA 基因的转录水平主要依赖于产生的蛋白质的功能亚类和植物发育阶段。对亚麻不同茎段的转录组分析显示,在次生细胞壁形成的晚期韧皮纤维中(茎底部区域),编码金属硫蛋白、脂质转移蛋白以及参与蛋白质合成/翻译和泛素介导降解的候选基因表达量增加;与顶杆区相比,分化后期的韧皮纤维中有156个基因上调,其中有与细胞壁相关的基因;与其他茎段相比,参与次生细胞壁沉积的转录因子在韧皮纤维中的表达减少。除以上基因家族外,COMT基因主要参与S-木质素的生物合成,转基因植物在 COMT活性被抑制时,木质素含量减少;PHAC1 基因表达量与亚麻纤维拉力强度成正比[68];Ca2+信号通路通过对 PLR1 基因的转录调控,在木质素生物合成的 ABA 调控中起着至关重要的作用,而 CML15b 是该调控的关键调节因子;WRKY36 通过与 PLR1 启动子中的 W-box 结合,在响应 ABA 和尖孢镰刀菌诱导的木质素生物合成中发挥调节作用。
2.4.2 亚麻非生物胁迫响应基因
亚麻基因组测序完成为全基因组水平分析非生物胁迫响应基因提供了前提条件。在亚麻全基因组中共找到 137个NBS类抗病基因,34个HSF基因响应高温胁迫。转录组测序发现,WRKY和JAS基因家族在亚麻对土壤营养胁迫的响应中起着重要的作用,CAX3基因产物可能通过Ca2+介导的胞内调节参与了亚麻对高酸性、高Al3+浓度的响应,MADS-box和 NAC转录因子参与调节植物生长发育和参与亚麻耐铝性细胞壁修饰的酶。干旱胁迫对亚麻产量和油质量的影响主要表现在生育期,选择性扫描发现了与脱落酸途径、生长素信号、Ca2+信号、光合作用调节和干旱应答转录因子有关的各种基因。亚麻锈病感染转录组揭示6个 Avr 基因(AvrM、AvrM14、AvrL2、AvrL567、AvrP123(AvrP)和 AvrP4)参与了亚麻抵御锈病感染,在感染早期表达量达到一个峰值,随着孢子形成逐渐下降。
2.4.3 亚麻特异性状相关基因
籽用亚麻种子含油量一般为30%~45%,早在史前时代就被作为油料作物种植。对亚麻未成熟胚中磷脂酶基因家族的转录组学分析发现,PLA2在亚麻中主要参与甘油磷脂代谢途径和醚酯代谢途径;PLC除参与甘油磷脂代谢和醚酯代谢之外,还在肌醇磷酸代谢途径中发挥重要作用。在TAG合成途径中发现7个关键基因,其中 PDAT1、DGAT1和 DGAT2基因的动态表达模式与含油量的动态积累模式显著正相关,PDAT1的动态表达模式与亚麻酸的动态积累模式显著正相关,且在高油高亚麻酸材料的种子动态发育阶段中 PDAT1基因的累积表达量也显著高于低油低亚麻酸材料,因此 PDAT可能是影响籽用亚麻(胡麻)不同品种(系)中含油量和亚麻酸含量的关键基因。全基因组关联分析和结合转录组测序,筛选出10个候选基因,其中6个基因参与了重要的脂肪酸代谢途径,其中一些基因还具有上下游调节关系。对不同亚麻酸含量的亚麻品种进行不同时期的品质测定发现,FAD2a、FAD3a 和 FAD3b这3个基因参与不饱和脂肪酸积累过程。
2.5 工业大麻重要应用价值基因挖掘
2.5.1 工业大麻纤维发育相关基因
工业大麻是一种多用途作物,韧皮纤维主要用于纺织和生物复合工业。其下胚轴有一个主动伸长,然后变厚形成初生和次生韧皮纤维的阶段,因此工业大麻是研究二次生长过程的合适模型。工业大麻下胚轴的二次生长与转录因子 NST1、MYB46 和 WLIM1 的上调有关。韧皮纤维的伸长依赖于 XTH 的活性,如 XTH5 和 XTH8,这些基因在伸长的大麻下胚轴中表达较多。COBRA 家族中参与纤维素生物合成的 2 个基因 COB 和 COBL4,以及次生细胞壁纤维素合成酶基因(CesA4、7 和 8)在二次生长的下胚轴中均有较高表达量。FLA11 和 FLA12 在工业大麻二次生长的下胚轴中表达量高,此时初生和次生韧皮纤维都存在。已知 FLA 基因家族会影响植物细胞壁中纤维素、阿拉伯糖和半乳糖的含量,因此也可能有助于确定韧皮纤维细胞壁的组成。RNA-Seq 分析发现,在下胚轴二次生长过程中涉及到葡萄糖醛酸苷生物合成的几个基因的上调,特别是涉及到主干延伸(IRX10、IRX10L、IRX14和 IRX15L)、主干乙酰化(ESK1、RWA3)和取代基甲基化(GXM3)有关的基因。
2.5.2 工业大麻特异性状相关基因
工业大麻虽然是一种纤维作物,但大麻素作为工业大麻所特有的一类次生代谢产物,在抗肿瘤、神经系统保护、免疫调节和抗炎抗氧化等方面具有重要的药用价值,因此工业大麻作为药用植物也有很大的前景。工业大麻全基因组测序鉴定出2个参与调控大麻素合成途径的基因 AEE1 和 OLS,此外还鉴定出23 个编码大麻素原酸(CBCA)形成的候选基因,其中4个基因命名为THCAS-like1~THCAS-like4。在 MEP 和 GPP 途径后端的酶基因 CMK、MDS、HDS、HDR和GPP (lsu)表达量和大麻素含量呈现显著正相关,在大麻素合成途径中OLS、PT和THCAS 3 个大麻中特有的酶基因主要在始果期苞片腺毛中对大麻素合成积累起着关键作用。不同工业大麻品种的腺毛转录组分析,鉴定出之前从未报道过的编码活性酶的基因,TPS18VF和 TPS19BL编码橙花醇/芳樟醇合成酶,TPS16CC 编码大根香叶烯B合酶和TPS20CT编码四甲基环癸二烯甲醇合酶。大麻聚酮合酶(PKS)是催化大麻素生物合成的第一步,有研究发现,啤酒花衍生的转录因子和番茄浓密矮化病毒(TBSV)p19 共同参与了PKS 基因启动子的激活。Laverty等利用药用大麻和毒品大麻杂交群体构建遗传图谱发现,大麻素的生物合成基因是不连锁的,但产生THCA和CBDA合成酶底物的芳香族丙烯酰胺转移酶(AP)与已知的大麻素含量标记紧密连锁,这为在大麻中如何产生大麻素提供了不同见解。
大麻作为雌雄异株植物,性染色体进化是其又一特异性状。Prentout等在大麻中发现了超过500个性连锁基因,将这些性连锁基因定位到大麻基因组组合中,其中有363个在1号染色体,并且发现有1对染色体具有较大的非重组区,进一步分析发现,大麻具有一个强烈退化的Y染色体,是迄今为止最古老的植物性染色体系统,这有助于工业大麻性染色体鉴定和性别基因定位。
3 基于基因组学的麻类作物遗传改良
3.1 我国麻类作物品种改良历程
主要麻类作物在我国均拥有悠久的种植历史,其品种改良大致经历了以下4 个阶段:第1阶段是地方种的搜集鉴定及引种利用。在此阶段不仅大量丰富了种质资源类型,而且鉴定出一批具有优良性状的材料,如:黄麻品种D154和翠绿等。第2阶段是杂交育种或回交选育等常规育种方法选育优良种质。此阶段是利用第 1 阶段所得到的优异种质为基础材料进行育种工作,在此阶段利用杂交与诱变育种相结合,选育出一大批高纤维产量和高含油量的亚麻品种,如:黑亚 2 号和亚宁 1 号等。第 3 阶段为高产、优质、多抗育种阶段。在此之前由于长期使用少数几个性状优异的骨干材料作为亲本,使麻类作物品种遗传基础狭窄,导致作物平均单产和品质的降低以及病虫害的发生,如:亚麻枯萎病和红麻炭疽病,因此育种家们在此阶段选育出一批高产、优质、多抗育种的新品种。第 4 阶段为优质高产专用新品种选育和现代生物技术辅助育种阶段。由于常规育种在进一步提高产量、品质和抗性等方面的局限性逐步显现,且很难满足市场需求的优质专用种质培育,与此同时现代生物技术快速发展,利用生物技术辅助育种越来越受到重视,因此麻类作物已经由单一的纤维用新品种选育向多用途、专用型新品种选育发展,如:亚麻轮选1号和天亚7号等,红麻福红2号和福红992等。可见,我国主要麻类作物的育种方法正在从常规育种转变为常规育种结合现代生物技术辅助育种方法,而育种目标也在从高产转变为优质抗病高产并重,逐步过渡到为了适用多用途而进行专用型品种的选育。其遗传改良已经从一个完全基于表型的过程,在某种程度上转变为越来越依赖基于基因型的选择。这得益于基因组学革命极大地提高了我们对作物基因组的理解,使得现代育种家可以更加关注一个新的时代,即基于基因组测序的作物遗传改良。
3.2 麻类作物育种技术的变迁
我国麻类作物育种工作开始于农家品种选育及外来优异种质引进结合常规育种手段,如杂交育种、诱变育种等,选育出性状优良种质。随着生物技术的高速发展,常规育种手段结合现代生物技术的育种方法成了麻类作物的主流育种技术。较常见的3种基于生物技术的育种方法有,一是分子标记辅助育种,目前常用的分子标记有简单重复序列和单核苷酸多态性等。这些分子标记在麻类作物中主要应用于物种演化及亲缘关系研究、群体多样性研究、标记辅助选择和遗传图谱构建等。
另一种是利用全基因组选择(genomic selection,GS),即利用所有可用的标记进行育种值的预测。在GS中,所有的位点、单倍型和标记效应都是在整个基因组水平上进行估计的,根据已知的表型和基因型数据,以计算代表性群体中每个个体的基因组估计育种值(genome estimation breeding values,GEBVs)。连锁不平衡(linkage disequilibrium,LD)在GS方法使用中是一个非常重要的参数,对于LD衰减速率快的物种,利用没有亲缘关系的自然群体,可以使用数量较多的标记可以在不降低检测能力的前提下筛选出用于杂交育种的亲本选择。目前全基因选择育种已经广泛应用于模式作物育种,玉米和水稻等粮食作物育种中有了较深入的研究,但在麻类作物上还鲜有报道。全基因组选择育种研究在麻类作物遗传改良中正处于起步阶段,随着基因型分析成本的降低和统计方法的发展,基因组选择将会逐步完善,加快我国麻类作物育种发展的步伐。
还有一种是利用基因编辑育种。随着科学技术的进步,被称为上帝之手的基因编辑应用于遗传改良,已成为当今的作物遗传改良研究热点。序列特异性核酸酶,包括锌指核酸酶(zinc-finger nuclease, ZFN)和转录激活物样效应核酸酶(transcription activator-like effector nuclease, TALEN)已被初步应用于真核生物中进行靶向基因组编辑。另一种基于双链断裂的基因组编辑技术 CRISPR/Cas9系统,是在细菌和古菌群中利用规则间隔短回文重复序列(clustered regularly interspaced short palindromic repeats, CRISPR)自适应免疫系统的基础上发展起来的,它与ZFN和TALEN相比,操作更简单、精确度和效率也都更高。这种新技术目前已在麻类作物上有所应用,如构建针对 FAD2 基因的敲除载体,为进一步实现在亚麻植株体内对基因高效率的定点编辑,以及 CRISPR/Cas9系统在亚麻基因组编辑中的应用提供参考。
3.3 下一代测序(NGS)技术对麻类作物遗传改良带来新的策略提供可能
在下一代测序(next generation sequencing, NGS)技术之前,一个标准的遗传连锁图谱是基于几百个分子标记来构建。NGS技术的发展与许多其他新技术相结合,使得DNA测序具有高通量和成本低的特点,麻类作物基因组测序完成为基于自然变异的正向遗传学策略提供可能。目前SNP标记在主要麻类作物遗传育种研究中的应用鲜有报道,首个黄麻SNP连锁图谱用于对RIL群体是否抗茎腐病进行基因分型,准确率高达 91%。这表明,NGS技术对麻类作物高密度遗传图谱构建和重要性状定位以及标记辅助育种带来新的策略。
随着NGS技术的发展,我们可以对麻类作物的不同品种进行深度重测序和全基因组从头测序并进行等位基因变异分析,通过序列比对找到了大量与重要性状相关的SNP位点,为品质改良和新品种选育带来了新的科研方法,加快了新品种的育种进程。在没有参考基因组之前,基于酶切的简化基因组测序(restriction-site associated DNA sequencing, RAD-seq)和基因分型测序(genotyping by sequencing, GBS)被应用于植物中,简化基因组测序技术具有不依赖于基因组序列,而进行高通量的SNP标记开发的优点。为了解亚麻锈病致病机制,基于RAD-seq技术检测到的SNP构建高密度遗传图谱,检测到2个新的致病基因,提高了对该病原体致病机制的认识;亚麻和苎麻也都利用GBS技术构建了高密度遗传图谱,分别定位了株高和纤维相关QTL。
随着麻类作物参考基因组图谱绘制,通过利用基因组所有染色体上的标记和性状之间的连锁不平衡(LD),进行全基因组关联分析(genome-wide association study, GWAS),能对自然群体或人工创造群体中的杂表型进行基因鉴定。112份苎麻核心种质GWAS发现6个与分枝数相关的候选基因,为研究苎麻候选数量性状位点和控制苎麻分枝数的基因提供信息。亚麻GWAS报道较多,鉴定出与纤维、亚麻疫病和亚麻种子油含量相关候选基因,大量丰富了亚麻育种遗传资源。这些研究反映出,下一代测序(NGS)技术对麻类作物自然群体的优良等位基因变异发掘以及基因组选择育种带来新的策略。
3.4 麻类作物品种改良的发展趋势
目前的麻类作物育种计划仍是依赖于将分子标记选择整合到常规育种方案中的表型选择,即常规育种与生物技术相结合。过去,麻类作物的育种目标大多是高产优质的纤维品种培育。但随着社会发展,市场需求与产品多样化对麻类育种工作者提出新的挑战,需要选育出高产高效、抗逆抗病、适宜轻简化机械化、优质专用的多用途麻类作物新品种。
一是麻类纤维用途不能只是局限于纺织业。由于麻类纤维可自然降解,因此以麻纤维为主要原料可制作环保型的包装带或可降解地膜等。麻类纤维具有纤维强力好的特点,其地膜的抗拉强力大于普通地膜,适宜机械铺膜,不仅能减少塑料薄膜导致的白色污染,而且能减轻劳动强度和生产成本。麻纤维还能用于建筑或家饰板材等用途。近年来关于麻纤维复合材料的研究越来越多,这是由于与玻璃纤维复合材料相比麻纤维复合材料具有密度低、隔音效果好、价格低和人体亲和性好等优点。因此培育出更适合用于制作复合材料的新品种也是当下麻类作物育种的一大趋势。
二是为了适应现代机械化,麻类作物育种需要满足轻简栽培需要。直播和机械化等轻简栽培技术能大大降低劳动成本,目前已经成为水稻、玉米等作物的主流生产技术,然而麻类作物想要适应轻简栽培还需要克服易倒伏和麻秆易断等问题。为满足麻类作物适应现代机械化,育种家们需要培育出茎秆粗壮、耐密植、抗倒伏能力强和高产优质抗病的麻类作物新品种。对于短日照喜温类型麻类作物,宜采取“南种北植”来延长其营养生长期,提高纤维产量。
三是为了“不与粮争好地”,培育适合逆境农业的品种。麻类作物在贫瘠土壤的种植,能具有更强的生产潜能,这是棉花所不能比拟的,培育适合逆境农业的新品种不仅仅是要求麻类作物能在不良环境下保持正常生长,更要稳定的达到高产和优产的特点。因此,麻类作物育种工作要更注重耐盐碱、抗旱、重金属吸附和抗病虫等性能。
四是根据不同麻类作物特异性状,培育不同用途的专用品种。如菜用黄麻、高大麻二酚(CBD)大麻品种、籽用大麻和籽用亚麻等。福建农林大学针对福建春夏蔬菜淡季的缺口,以中晚熟、高产、食用品质优、抗炭疽病为选育目标, 着力开展菜用黄麻新品种的选育,最终选育出福农系列菜用黄麻,主食嫩茎和幼叶,口感极佳。大麻素作为大麻独有的一类次生代谢物,具有重要的医用价值,培育高CBD大麻品种将一直是大麻遗传改良的重点方向,这也是近年来大麻产业蓬勃发展的重要原因之一。亚麻籽油营养丰富,不仅含α-亚麻酸这一人体所必须的脂肪酸,而且亚油酸等不饱和脂肪酸含量高,对皮肤具有优良的亲和力和渗透力,能用于护肤产品原料,为满足市场需求,培育专用的籽用亚麻是亚麻育种工作必不可少的。
4 展望
从优良品种到地方品种和野生近缘种的种质资源,将仍然是任何育种计划的基础。随着麻类作物参考基因组测序完成,如何高效挖掘这些麻类种质资源的遗传变异和重要应用价值基因位点信息并应用到遗传改良,值得探索。NGS 革命的第一个效果是降低每个测试数据的标记成本,在琼脂糖凝胶或毛细管测序仪上运行的SSRs 或CAPS标记要比在高通量平台上运行的SNPs 昂贵得多。然后,开发一种全基因组选择的育种方法,如GS,正在成为可能;并将有助于设计新的植物品种,不仅应用于少数特定的农艺性状,而且应用于基因组中几乎所有的基因位点;以一种成本合理和相对快速的方式,有望给下一代育种做出显著的贡献。目前基因组选择育种只是在水稻和玉米等主要农作物中有所报道,若能将此育种方法应用于麻类作物,必将加快麻类作物育种步伐。预计在不久的将来,NGS 技术、生物信息学和表型自动化等方法在种质资源的遗传多样性中进一步应用。建立基于优异基因资源挖掘与种质创新的高通量基因型-表型数据库,创制种质资源管理和共享平台。创新并集成分子标记辅助选择、GS、转基因等技术,建立高效的快速育种技术体系,将彻底改变麻类作物育种策略,以实现更有效的遗传改良。
麻类作物作为第5大作物群,其遗传改良越来越受益于基因组学的发展,通过基因组学能发现一批已知位点与功能的基因资源,从而解决育种亲本贫乏和选择效率低的问题,同时还能供转基因育种使用,能大幅度推动主要麻类作物遗传改良。但应该指出的是,这些重要基因以及位点的信息绝大数是基于或依赖于模式植物的同源基因信息。麻类作物纤维相对于模式植物而言,有其独特之处。同样地,麻类作物响应各种非生物胁迫和氮肥等高效利用等方面也有其特异之处。以红麻耐盐碱为例,耐盐红麻品种在400mmolL1 的NaCl 浓度下可正常生长。完成麻类作物参考基因组图谱绘制,采用正向和反向遗传学策略挖掘麻类作物的纤维和重要性状的作用机制值得关注,可开展麻类作物种质资源形成和演化机制研究,系统解析纤维产量、纤维品质、抗病耐逆等农艺性状形成的分子基础。主要麻类作物特异性状的相关基因有所报道,但功能基因鉴定仍较困难,如工业大麻性别相关的基因,这也与功能标记的缺乏有关。同时,在利用这些基因进行麻类作物遗传改良的过程中还面临着遗传转化体系及其基因编辑体系构建等挑战,如在CRISPR-Cas9基因编辑系统中,挖掘适用于特定麻类作物的内源 U6 启动子并建立相应的基因编辑体系,仍需要摸索与优化。克服这些挑战将能显著提高主要麻类作物遗传改良效率。
 
文章来源:徐益,张力岚,祁建民,张列梅,张立武.主要麻类作物基因组学与遗传改良:现状与展望[J/OL].作物学报:1-35[2021-02-17].http://kns.cnki.net/kcms/detail/11.1809.S.20210125.1444.002.html.

更多阅读