近日,3344体育会员、省部共建生物催化与酶工程国家重点实验室杨平仿教授团队在园艺学Top期刊Horticulture Research上发表题为“The high-quality genome of lotus reveal tandem duplicate genes involved in stress response and secondary metabolites synthesis”的研究论文。该研究组装出了高质量莲参考基因组,并揭示了基因组中串联重复基因对莲适应环境和其次生代谢合成具有重要作用。3344体育会员博士生齐欢欢为论文的第一作者,杨平仿教授和浙江大学张亮生教授为论文的共同通讯作者,湖北大学为第一单位。该研究得到了国家自然科学基金的资助。
图1 文章首页
莲为山龙眼目莲科莲属植物,具有重要的观赏、食用和药用价值。莲属植物包含两个种,亚洲莲和美洲莲,“中国古代莲”是一种亚洲野生莲。由于测序技术的限制,莲参考基因组组装质量不高,一定程度上限制了对莲基因组特征和功能基因组深入研究。为提高莲基因组组装质量并探究其功能性化合物合成积累特征的基因组根源,本研究对“中国古代莲”重新进行了测序和从头组装,并结合全长转录组数据进行基因结构与功能注释,在此基础上探究了莲扩张与收缩基因的特征及串联重复基因对莲生物学特性的贡献。
图2 莲基因组特征
利用Illumina、PacBio以及Hi-C数据,组装出大小为817 Mb的莲基因组,contig N50值为44.31 Mb,scaffold N50值为110.63 Mb,染色体挂载率达到了98.71%。注释到27,981个高可信度的蛋白编码基因,基因平均长度为9.52 kb,编码序列平均长度为1232 bp。通过多方面评估发现,新组装的基因组在连续性、完整性和gap数目等方面均表现最优。莲基因组中共检测到了2456个串联重复基因,显著扩张基因中275个表现为串联复制模式,它们主要参与环境适应和次生代谢物的合成。花青素和生物碱是莲中合成的重要次生代谢物,它们相关的合成酶类均以串联重复方式分布在基因组中;环境适应相关的多酮氧化酶、HSP20和含EF-hand结构域基因等也在基因组中呈现串联复制模式。综合说明串联重复是莲基因组的重要特征,基因的串联重复保证了所参与的重要生物过程的发生。此外,本研究还构建了易于访问的莲基因组数据库(lotus-db.cn)。
原文链接:https://academic.oup.com/hr/article/10/5/uhad040/7060412?searchresult=1