近日,食品科学与营养工程学院国家果蔬加工工程技术研究中心沈群、薛勇课题组在食品领域国际顶级期刊《食品科学与技术趋势》(Trends in Food Science & Technology)发表题综述文章《机器学习筛选食品生物活性化合物的研究进展》(Advances in Machine Learning Screening of Food Bioactive Compounds)。
食品中含有丰富的生物活性化合物,对人体健康起着至关重要的作用。然而,筛选食品生物活性化合物的传统方法面临成本高、耗时耗力等挑战。机器学习技术为筛选潜在的生物活性化合物提供了一种高效且经济的方法,但其在食品领域的应用和研究还有限。为了促进食品生物活性化合物的有效筛选并为研究人员提供有价值的见解,本文介绍了构建机器学习模型的过程,包括数据准备、分子表示、机器学习算法选择和评估方法,并重点介绍了近年来机器学习在筛选具有不同生物活性的化合物方面的研究进展。此外,本文还提出了目前面临的主要的局限性和挑战,并提出了未来的发展方向。
综述全局图
目前,使用机器学习筛选食品生物活性化合物的研究取得了一些进展,尤其是对于具有抗氧化和抗高血压活性的肽,以及具有降血糖活性的非肽化合物。预测和验证生物活性化合物的一般策略遵循图2所示。首先需要开发性能良好的机器学习模型用于筛选出候选物,再使用分子对接、分子动力学模拟等计算方法和一些其他技术进一步对候选物进行考察。此外,还可根据研究需求对候选物进行毒性和溶解度等特性预测。根据计算机筛选的结果,确定目标化合物,最后往往需要进行实验验证,例如通过细胞实验、体外酶实验、动物实验或人体实验等方法验证所选化合物的效果并探索可能的作用机制。值得注意的是,每个步骤中采用的具体技术和方法需因研究目标、可用资源和所研究化合物的性质而异。
预测和验证生物活性化合物的一般策略
目前,建立针对不同生物活性的机器学习模型存在不同的局限性和挑战。未来,为进一步推动机器学习在食品领域的应用,我们建议如下:(1)构建全面的食品生物活性化合物数据库,开发高质量的数据集和新的分子表示方法,增强深度学习的可解释性,整合不同的机器学习算法,开发更有效且更合适的评估指标;(2)将机器学习与其他虚拟筛选技术相结合;(3)结合分类和回归模型;(4)建议研究人员不要忽视具有稳定性或溶解性问题的化合物,并从多个维度全面评估候选化合物的效果;(5)开发能够预测多种生物活性的模型。总体而言,基于机器学习的预测方法能够高效、准确且低成本地筛选化合物,但仍有许多值得改进的地方。
以上研究中国农业大学为第一完成单位,薛勇副教授为通讯作者,本校研究生张译匀为第一作者。相关研究获得了国家重点研发计划项目(2021YFD2100200/2021YFD2100201),国家卫生健康委员会微量元素与营养重点实验室项目(WLKFZ202208),农业农村部杂粮加工重点实验室、成都大学杂粮产业化四川省工程技术研究中心开放项目(2023CC005)的资助。
供稿:食品学院 苗敬
供图:食品学院
编辑:李杨
责编:马文哲