人才强校 | 理学院数学学科在领域自适应研究取得新进展

近日,理学院应用数学系大数据团队与国家数字渔业创新中心等单位合作在领域自适应研究中取得新进展,在国际顶级期刊《IEEE神经网络与学习系统汇刊》(IEEE Transactions on Neural Networks and Learning Systems,中科院1区Top期刊)上发表题为《具有广义相似和相异正则化的异质领域自适应》(Heterogeneous Domain Adaptation With Generalized Similarity and Dissimilarity Regularization)的研究论文,提出了一种新的基于矩阵分解的异质领域自适应算法。

在现实世界中,数据的来源极为多样化且具有异质性,异质领域自适应让模型跨越不同领域的数据差异,实现有效的知识迁移,推动了跨行业的技术革新。领域自适应是中国农业大学数学学科长期聚焦的机器学习领域中的重要方向,其特点是能够实现不同来源的数据集之间的知识迁移,是数学学科与农业中诸多问题的紧密结合点与显著提升点,在养殖生物识别监测、生物量估计、遗传育种等诸多重大课题中有着十分广阔的应用前景。

传统机器学习范式在两个重要假设下表现良好:标记数据数量充足,训练和测试数据满足独立同分布。然而,一方面受到标注成本及数据稀缺等因素限制,在多数实际应用中获得大量标记数据非常困难;另一方面,不能保证从不同视角、不同设备捕获的数据与之前获取的数据服从相同的统计分布,这将导致机器学习算法的精度显着下降。领域自适应是解决该问题的重要技术。当前,大多数领域自适应算法关注同质场景,即源域和目标域的数据来自相同的特征空间,这些方法不能直接应用于跨域数据来自不同特征空间的异质场景,但在实际应用中,异质场景却更为常见。

1.jpg

HGSDR方法流程图

本项研究提出了一种新的基于矩阵分解的异质领域自适应算法(HGSDR)。该算法通过建立跨域拉普拉斯图探索不同域的同类样本间的相似性,以及基于内积策略的不同类样本的可分离性。通过集成上述思想构建广义相似性和相异性正则化,从全局分布和样本匹配两个角度有效地进行知识迁移,从而更好地学习目标域的判别性特征。

中国农业大学理学院为本文的第一完成单位,理学院钟萍教授、申振才副教授和信息与电气工程学院陈英义教授为本文的通讯作者,理学院硕士研究生陈雨晴(指导教师为钟萍教授)为本文的第一作者,本文作者还包括国家数字渔业创新中心李道亮教授。本研究得到了国家自然科学基金和学校“双一流”经费的支持。

中国农业大学理学院数学学科以理论创新为出发点,以农业实际需求为导向,结合当前农业科研及产业一线存在的重难点问题,着力开展应用数学与智慧农业关键技术攻关。在学院和学校的大力支持下,理学院数学大数据团队将秉承“不忘初心、牢记使命,知农爱农,强农兴农”的理想信念,继续服务于农,将学科理论创新研究和实际应用水平推向更高层次。

供稿:理学院

供图:理学院

编辑:李杨

责编:孟祥慈

分享