养牛的喝奶的,都用得到!中国农业大学发布首个国际奶业领域垂直大模型

记者 沈爱群

近日,中国农业大学联合全国畜牧总站、中国奶业协会发布了首个国际奶业领域垂直大模型——“孺子牛大模型-AI4DLLM”。

{59811578-838D-463f-8C64-BF2593CE54FD}.png

孺子牛大模型发布

业内人士评价:2025年中央一号文件,首提“因地制宜发展农业新质生产力”,强调通过科技创新推动农业现代化转型。从良种到良机,再到良技。作为农业领域前沿的科技创新,孺子牛大模型必将引领中国农业发展“新质生产力”。

为什么是奶业?为什么是中国农业大学研发了这个大模型?作为首个国际奶业领域的垂直大模型,其价值又到底在哪里呢?日前,潮新闻记者走进中国农业大学,采访了孺子牛大模型研发团队总负责人曹志军教授及其团队。

为什么是奶业?

众所周知,农业可以细分为多个行业,主要包括种植业、林业、畜牧业、渔业和副业这5种产业形式。而畜牧业又可细分为:家禽养殖、水产养殖、草食畜牧业(主要包括牛和羊的饲养)、特种养殖、生态养殖、观赏类养殖等。

在如此众多的农业细分领域,为什么是奶业率先“冒出”,发布了站在“风口”的垂直大模型呢?

“2024年农业农村部发布《关于大力发展智慧农业的指导意见》,明确提出开发智慧农业基础模型,为各类智慧农业应用提供技术底座,加快推动人工智能大模型在农业重点领域的应用。”曹志军告诉记者,“在此背景下,农业垂直领域的大模型研发成为实现农业‘新质生产力’的关键路径。”

奶牛营养与牛奶质量,是曹志军的主要研究方向。他认为,对比我国农业的其他细分领域,奶业的信息化、精细化程度为孺子牛大模型的研发奠定了基础。

{CE5D0494-BBBC-4666-873A-A5F9B1EEA7F9}.png

牧场超级大脑模块

相关数据显示,近年来我国奶业发展迅猛。从生产规模来看,我国已经成为奶业生产和消费大国,奶牛养殖数量与生鲜乳产量都达到了相当规模。

在质量安全方面,我国乳品质量可以比肩发达国家水平。最新数据显示全国生鲜乳抽检合格率达到100%,乳品总体抽检合格率99.87%,生鲜乳中乳蛋白、乳脂肪等质量安全指标处于较高水平,菌落总数、杂质度和体细胞监测平均值分别符合国际和欧盟限量标准,三聚氰胺等重点监控违禁添加物抽检合格率连续15年保持100%。而且,国产奶在一些关键指标上表现优异,如乳铁蛋白、β-乳球蛋白和糠氨酸等指标均优于进口同类产品。

从产业素质来看,目前全国奶牛存栏百头以上规模养殖比例达到76%,同比提高4个百分点;奶牛平均单产9.4吨,较上年增加200千克;规模牧场99%以上配备全混合日粮搅拌车,原料奶生产100%实现机械化挤奶。

“同时在技术层面,尤其是奶牛养殖的软件系统开发与应用方面,中国已具备显著优势。在精细化管理、数据驱动决策和智能化养殖等领域,中国甚至超越了部分发达国家,展现出强大的技术输出能力。通过国际交流与合作,中国奶业能够为全球提供成熟的技术解决方案和标准化程序,助力其他国家提升养殖效率和管理水平。”曹志军表示,“这些,都为我们研发孺子牛大模型提供了产业基础条件。”

为什么是中国农业大学?

一个模型的研发成功,人才与技术支撑必不可少。

记者了解到,孺子牛大模型研发团队,其成员涉及农业科学、信息工程、计算机科学、数学等多学科,也是个交叉学科团队。

采访时,与记者面对面的团队成员,就出自以上学科方向的硕博士。而且,这支年轻的团队里所有人才都是中国农业大学自己培养的。

“孺子牛大模型的研发成功,光靠单一专业方向团队是远远不够的。其背后,是奶业这条全产业链上的所有人才支撑,包括牧草种植、奶牛养殖、乳品工程、经济管理等10多个学科专业。”据曹志军介绍,2024年3月,他们组建了中国农业大学国家级创新团队——智能养殖与饲料高效利用团队。团队依托中国农大畜牧学、兽医学、草业科学等A+学科优势,深度融合“人工智能+”领域相关学科,成员主要来自动物营养与饲料科学系、计算机系和数学系,具备跨学科协同创新的强大能力。曹志军说,“这也得益于我们在14年前创设的‘牛精英计划’。”

跟“科技小院”类似,“牛精英计划”把产业创新人才培养基地放在了产业一线,但同时,“牛精英计划”更注重人才链和产业链的融合。该计划始终以“培养畜牧领域的未来领导者与决策者”为育人目标,强化全产业链实践培养,引导学生走出校园、走进牧场、走进一线,既要把理论学好,更要实践出真知。

{ACCE3952-2447-4fbb-BC29-154FF0384046}.png

智能决策系统模块

目前,“牛精英计划”的战略合作伙伴覆盖了我国奶牛、肉牛领域顶尖的规模化养殖集团和优质供应链企业,在全国23个省(自治区、直辖市)共建了上百个实践实习基地,提供与养殖、饲料、基建、设备、智能化、市场销售等相关的多种实习岗位。

作为“牛精英计划”的创始人,曹志军对此非常感慨。他说:时至今日,一批批懂理论、肯实干的高素质人才从“牛精英计划”走出来,为中国养牛产业源源不断注入高质量的新鲜血液。

他还告诉记者,在此基础上发展而来的牛精英联盟也于2015年成立。目前,全国已有56所学校加入牛精英联盟,辐射面占到了涉农高校的80%。

“此外,我们还联合了全国畜牧总站、中国奶业协会等部门与行业协会,以及美国康奈尔大学、瑞士苏黎世联邦理工大学、美国维吉尼亚理工大学等世界顶尖高校团队,为研发孺子牛大模型提供了坚实的人力与技术支撑。”曹志军说。

海量数据,从何而来?

与通用大模型不同,垂直大模型需要针对特定领域或任务收集专门的数据集,这些数据集更加专业和精细,包含特定领域的专业知识和数据。

那么,要架构起孺子牛大模型这样一个奶业的垂直大模型,海量数据,又从何而来呢?

据了解,孺子牛大模型团队凭借2016至2024年间积累的国内TOP40奶牛养殖集团的生产一线核心数据,覆盖了全国荷斯坦奶牛存栏的30%,建立了国内领先的数据共享与分析平台,涵盖多样数据类型。

同时,团队还与《Hoard’s Dairyman》合作主编《养牛》杂志,拥有其140年英文专业文章版权,并发表了2000余篇高质量中文文章,年阅读超千万人次。

此外,团队整合了全球顶尖奶业研究语料库,包括《NASEM 2021》、顶尖期刊文章及美国农业部牧草研究中心等独家行业数据,为模型提供了坚实的技术参数支持。

{5FCE91D4-DAB5-4009-AE27-6347D2525FBB}.png

仰廉数字书院模块

马佳莹博士就是《养牛》杂志主编。她举例说,从一头牛全生命周期的生长、繁殖、营养、健康等方面,就会实时产生海量数据。“牧业数据来源广泛且复杂,数据格式不统一、数据缺失和错误较多。我们建立了专门的数据清洗和标准化流程,通过多轮的数据审核和修正,确保输入模型的数据来源真实、质量可靠。”

孺子牛大模型,价值到底在哪里?

据悉,目前该模型已在奶业中首次应用,标志着我国奶业正式迈入数智化。

而在曹志军看来,研发这个模型具有开创性意义。“作为全球首个奶业垂直大模型,它填补了国际空白,为奶业数智化转型铺就了一条全新的道路。简单而言,模型彻底改变了过往奶业数据零散、整合分析困难重重的现状,为整个产业变革提供了技术基石。”

不仅如此,他觉得孺子牛模型的价值大致有三:

首先是对于奶业实现全产业链科普的科学价值。“以往公众对奶业不了解,是因为我们科普得还不够。”曹志军表示,“我们期待能把‘孺子牛’打造成奶业界的‘百度’‘小红书’。公众对于奶业的任何提问,都能在‘孺子牛’得到精准、满意的答案。”

其次,是其在行业应用上的巨大价值。借助AI技术,孺子牛大模型不仅能够将奶业全产业链的数据进行整合分析,它还会基于现有数据和模型基础,针对产业关注的重点问题进行动态预测,助力企业作出更具前瞻性、更优质的决策,全面提升行业在市场中的竞争力。“这就相当于,我们可以通过新质生产力赋能整个产业,推动奶业从传统经验驱动向数据智能驱动转型,从而实现全行业的提质增效。”曹志军说。

{871C8437-EAE4-4319-84C7-09274EB26961}.png

数字孪生牧场模块

这里,记者给大家介绍一下孺子牛大模型包含的四大功能:牧场超级大脑、智能决策系统、仰廉数字书院和数字孪生牧场。

牧场超级大脑模块,专为奶业领域设计。它运用大语言模型结合检索增强技术深度解析奶业数据,化身“智能小牛”提供精准决策支持与权威知识解答。通过中英双语交互、高效信息检索、自动化运营报告生成以及个性化推荐等功能,助力牧场实现智能化升级,开启奶业管理的新篇章。

智能决策系统模块,专为牧场设计,能够实时监测奶牛健康状况,预测牛奶产量,并评估产品质量,确保牧场运营的每一个环节都处于最佳状态,为牧场管理者提供更加精准、全面的决策支持。例如,在奶牛健康监测上,能提前发现疾病隐患,降低奶牛患病率;分析不同饲料来源对土地资源、水资源的消耗以及碳排放情况,帮助牧场选择更环保、更高效的饲料供应方案;评估不同养殖模式对奶牛福利和产品质量的长期影响,从而优化养殖流程,实现奶业的绿色可持续发展……

仰廉数字书院模块,致力于整合国内外权威的奶业资源,为用户提供全方位、多层次的知识服务。未来,它将构建起奶业全方位知识库,不仅能提供文献、标准查询以及文献推荐服务,还可以根据用户需求推送相关成果和资讯;并且,还会提供奶业相关的在线学习课程,使用数字人进行讲解,配备AI伴学功能,助力培养更多专业人才。

数字孪生牧场模块,可以助力实现养殖流程的可视化与模拟优化,全方位推动奶业朝着高效、优质方向发展,创造更大的经济效益。

其三,是由海量有效数据带来的“数据要素X”价值。“作为奶业领域垂直大模型,‘孺子牛’应用场景明确,既是数据要素提供商,也可朝着数据要素运营商和服务商进行有益的尝试,最终目标是实现行业公共数据跨层级、跨地域、跨系统、跨部门、跨业务的有效流通和共享利用,助力农业数字经济发展。”曹志军表示。

(图片,均由受访者提供)

潮新闻2025年3月6日


责编:刘铮

201
分享
分享到
×
分享到微信朋友圈
×
Scan me!