提速近10倍!基于深度学习的全基因组选择新方法来了******
近日,中国农业科学院作物科学研究所、三亚南繁研究院大数据智能设计育种创新团队联合多家单位提出利用植物海量多组学数据进行全基因组预测的深度学习方法, 可以实现育种大数据的高效整合与利用,将助力深度学习在全基因组选择中的应用,为智能设计育种及平台构建提供有效工具。相关研究成果发表在《分子植物(Molecular Plant)》上。
全基因组选择作为新一代育种技术,通过构建预测模型,根据基因组估计育种值进行早期个体的预测和选择,从而缩短育种世代间隔,加快育种进程,节约成本,推动现代育种向精准化和高效化方向发展。
统计模型作为全基因组选择的核心,极大地影响了全基因组预测的准确度和效率。传统预测方法基于线性回归模型,难以捕捉基因型和表型间的复杂关系。
相较于传统模型,非线性模型(如深度网络神经)具备分析复杂非加性效应的能力,人工智能和深度学习算法为解决大数据分析和高性能并行运算等难题提供了新的契机,深度学习算法的优化将会提高全基因组选择的预测能力。
该研究团队以玉米、小麦和番茄3种作物的4种不同维度的群体数据为测试材料,通过创新深度学习算法框架开发了全基因组选择新方法。
与其他五种主流预测方法相比,该方法有以下优点: 可以利用多组学数据开展全基因组预测;算法设计中包含批归一化层、回调函数和校正线性激活函数等结构,可以有效降低模型错误率,提高运行速度;预测精度稳健,在小型数据集上的表现与目前主流预测模型相当,在大规模数据集上预测优势更加明显;计算时间与传统方法相近,比已有深度学习方法提速近10倍;超参数调整对用户更加友好。
该研究得到了国家重点研发计划、国家自然科学基金、海南崖州湾种子实验室和中国农业科学院科技创新工程等项目的支持。
学术支持
中国农业科学院作物科学研究所
记者
宋雅娟
科研人员绘制出首个豆科植物根尖单细胞表达图谱******
光明网讯(记者宋雅娟)豆科植物的根系不仅具有吸收运输养分、支持及贮存有机物质的重要作用,而且还具有根瘤固氮的生态意义。近日,中国农业科学院生物技术研究所作物生物技术育种创新团队与国内其他科研单位合作,共同绘制完成首个豆科植物百脉根的根尖单细胞表达图谱,鉴定出根尖的主要细胞类型,发现了新的细胞类型特异基因,并分析了各个细胞类型的潜在功能,对研究豆科植物根系发育、结瘤固氮以及生物育种具有重要意义。相关研究成果发表在《植物学报(Journal of Integrative Plant Biology)》上。
近年来,单细胞技术解析了模式植物拟南芥和作物水稻等根系的单细胞水平的基因表达图谱,然而,豆科植物根系的细胞类型及其功能尚未解析。
研究首先对百脉根基因组进行了组装和注释的提升。在此基础上,对根尖解离出的22,688个原生质体进行了转录组测序,得到了高质量的测序结果,并通过新发现的细胞类型特异表达基因鉴定出了根尖的7种主要细胞类型,在国际上首次绘制了豆科植物百脉根的根尖单细胞表达图谱。
科研人员进一步分析了不同细胞类型的功能,发现9种激素和固氮相关基因在不同细胞类型的表达规律。另外,与拟南芥根尖单细胞转录组比较分析,进一步表明了不同植物细胞类型的功能以及保守性和差异性。
该研究得到国家科技基础资源调查专项、国家自然科学基金、重庆自然科学基金、中国农业科学院科技创新工程项目资助。
(文图:赵筱尘 巫邓炎)