在成都飞往的航班上,透过飞机舷窗俯视,青藏高原雪峰如海,冰川如练。这片250万平方公里的土地,既是世人眼中的“世界屋脊”,更是孕育了长江、黄河、雅鲁藏布江等10多条大江大河的“亚洲水塔”。
但是,要算清这座水塔的水量账,曩昔几乎是不或许的事。“当地氧气淡薄、温度低、风雪大、辐射强,导致一般监测仪器故障率高、寿命短、维护也极为困难。”我国科学院青藏高原研讨所研讨员李新说,“就算仪器扛住了高寒低温的恶劣环境,数据也很难传回来。”
现在,这个局势正在被改动。在北京林萃路,一个由十几名研讨员领衔的“数据工厂”——国家青藏高原科学数据中心(以下简称“中心”),正在为“亚洲水塔”打造牢靠的数字底座。到本年5月,中心发布的数据集总数达8585个,累计下载量达6PB。
高原上,冬季零下二三十度是粗茶淡饭,一般监测设备撑不过一个冬季就“停工”。“有时候辛辛苦苦把设备架好,第二年开春去看,现已被风吹雪掩,没办法使用了。”李新说。
即使设备扛住了,青藏高原近80%的区域没有通讯网络掩盖,4G信号更是奢求,数据存在存储卡里,便是传不出来。曩昔,科考队只能一次次进山,靠人工下载取回数据。“雅鲁藏布江大峡谷便是典型的‘通讯盲区’,高山深谷人力难以抵达,很难收集到有用数据并传输到中心。”李新慨叹道。
为处理这一些难题,中心自主研发了习惯高寒极点环境的卫星物联网观测终端,还研发出无人机高速中继体系、无人机载径流监测体系、“智能鹰眼”等新装备,硬是在高原上织起了一张“天—空—地”立体监测网。
天基层面,中心整合高分系列卫星、风云系列卫星等国产卫星及世界卫星资源,完成对青藏高原全域的周期性监测;空基层面,运用无人机搭载多种智能载荷,对冰川冻土、雅鲁藏布江大峡谷、拉鲁湿地等要点区域施行高分辨率、高频次观测;地基层面,经过在六大流域24个地上观测站布置中心研发的物联网监测信息体系,继续收集水文、气候、生态等62类要害方针的原位数据,累计接纳数据超越20亿条。
此外,中心还建立了掩盖数据全生命周期的动态安全管理机制,为每个数据集赋予全球仅有的DOI“身份证”,完成数据精准溯源。
在做好数据存档的一起,中心还致力于让数据真实“活”起来,开释其科学价值。一组数字足以阐明其作用:中心注册用户超越14万,2025年渠道数据下载量超越2100TB、页面拜访量超越1.65亿次;三分之二的数据彻底揭露、免注册下载,世界下载占比高达27%……
“第三方测评组织按可查找、可拜访、可互操作、可重用准则评价地学范畴的数据中心,咱们中心屡次取得榜首。尽管咱们的数据量不算大,但下载量和流转速度终年排名靠前。”我国科学院青藏高原研讨所研讨员、国家青藏高原科学数据中心副主任冯敏告知记者。
在国家数据中心体系里,中心首先引进同行评定机制。每个数据集不只要先技能评定,查看完整性、元数据规范性,还要送专家库进行同行评议。
“专家要翻开数据、查看办法、评价精度,并给出反应,这相当于给数据做一次‘学术审稿’。像期刊审稿相同,专家不只指出问题,更提出主张,协助数据提交者改善。”冯敏说,依托在线数据库运作体系,观测数据中哪个数值反常、何时收集的、谁收集的,都能追溯到。
得益于严厉的质量把控,中心的数据产品开端在高水平科学研讨中发挥要害作用。以青藏高原湖泊研讨为例,依托中心数据产品,科学家对湖泊数量、面积、水量改变有了更精准的掌握,支撑了一系列高水平作用的产出;研发的首套我国区域75年长时序近地上气候驱动数据,已成为高原气候改变研讨和工程安全评价的要害数据;全球地表太阳辐射数据,为新能源资源评价供给了重要依据。
到本年4月,对中心表明称谢的论文已超越11000篇,且数量呈快速上升态势。2025年10月,中心申报的“地球大数据立异青藏高原高质量数据集”当选国家数据局发布的“高质量数据集典型事例”,总规模超越600TB。
数据不但支撑科研,还直接服务国家需求和工业高质量开展。“中心发布的数据已应用于川藏铁路建造、雅鲁藏布江下流水电工程、冰湖溃决应对等国家严重工程;一起,还有多家企业依托中心发布的产品,优化了工业布局,比方比亚迪轿车股份有限公司使用中心同享的太阳辐射、植被、社会经济数据来进行了大数据剖析,助力公司决议计划。”李新说。
当时,人工智能(AI)赋能千行百业的热潮正席卷而来。在地球科学范畴,遥感、地理信息虽已广泛引进AI,但在支撑地球体系猜测和决议计划层面,AI的潜力仍未得到充沛开释。“怎么让AI真实了解地球体系的杂乱进程,依然是一个难题。”李新说。
这正是中心团队挑选深入研讨的方向。在数据产品研发上,中心已建立起“多源观测+AI智能交融+物理模型同化”的复合出产形式。针对青藏高原杂乱的地势、气候环境,中心经过交融多源观测和模型模仿成果,生成了高分辨率气候驱动、冰川湖泊散布与改变等一系列数据产品。其间,我国区域气候要素驱动数据集两套版别累计被阅读31万余次、下载4.4万余次。
“数据产品的价值,终究要看科学家能不能直接拿来用。AI帮咱们处理了杂乱环境下数据出产的功率问题,但每一个产品背面,都还需求实测数据的校准和专家的把关。”冯敏说。
在此基础上,中心正将目光投向更具挑战性的方针——地球体系的建模与数字孪生。中心团队提出了“AI驱动的青藏高原观测—数据—模型一体化”结构,探究引进多主体强化学习办法,让多个智能体在虚拟环境中模仿推演气温上升、冰川融化、湖泊扩张、人类习惯等进程的演化规则,为地球体系猜测和灾祸预警供给决议计划支撑。
“与通用大言语模型不同,咱们更强调在地球体系猜测和决议计划中发挥作用。不只要猜测,更要能评价决议计划干涉的作用;不只要技能上可行,更要对实践有用。”李新说。
面向未来,中心与我国科学院磐石模型团队、浦江实验室团队等团队沟通,探究数据同化、强化学习、因果剖析在数字孪生地球中的结合,逐渐构建可以模仿和猜测高原地球体系改变的数字孪生渠道。“咱们咱们都期望数据不只是记载高原发生了什么,更能为了解高原改变的机制、应对未来的不确定性供给科学依据。”李新说。
从破解“获取难、传输难”到拥抱“AI”,这群在高原上“追数据”的人,正以数据为笔,在雪域高原书写新的或许。
人民日报社概略关于人民网报社招聘招聘英才广告服务协作加盟版权服务数据服务网站声明网站律师信息维护联络咱们
人 民 网 股 份 有 限 公 司 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用
,pg模拟器