南国都市报3月10日讯(记者 利声富)计算时间比传统统计模型足足缩短290倍!10日,记者从中国农业科学院国家南繁研究院获悉,日前,该院李慧慧团队成功研发了一套新的人工智能算法——自动化机器学习框架。该算法通过将环境数据与基因组信息深度融合,实现了作物精准遗传分析与基因组预测,为作物智能设计育种提供有效工具。
据了解,作物的田间表型是由基因型、环境以及基因型与环境互作共同决定的。实际育种过程中,准确预测作物表型对于提高育种效率、缩短育种周期至关重要。然而,传统的基因组预测方法往往忽略了环境因素对表型的影响,导致在多环境试验中表型预测精度有限。因此,将环境数据纳入基因组预测模型,考虑基因型与环境的相互作用,成为提升预测精度的关键。
李慧慧研究团队利用大规模多环境玉米杂交种数据集,开发了一套自动化机器学习框架,将环境数据与基因组信息深度融合开展遗传分析与基因组预测。“与传统基因组预测方法相比,自动化机器学习框架有3大亮点。”李慧慧介绍,该框架一是集成遗传和环境特征处理功能;二是集成多种先进技术进行模型训练,提升模型训练效率和预测精度,与传统统计模型相比,计算时间可缩短290倍,且能保持较高的预测精度;三是利用独特的SHAP可解释技术解释模型,采用源于博弈论的SHAP可解释技术对模型进行事后解释以量化遗传和环境特征对表型变异及模型性能的贡献。该研究可为解析基因型与环境互作的生物学机制提供重要参考,同时为作物育种提供新工具。