【摘要】 在使用金属同位素的水文研究中,多元线性回归有助于同时研究同位素特征与多个变量之间的关系。

越来越多在流域或集水区尺度的水文研究正在使用金属同位素(如δ44/42Ca、δ26Mg、δ7Li、δ30Si和87Sr/86Sr)来调查人为因素对水质的影响、追踪自然风化过程、表征河流中的溶质收支,或者理解生物地球化学循环。水文现象往往受到多个变量的影响,其中一些变量具有非高斯行为或相互依存关系。

 

常见的方法,如单变量统计、简单线性回归、多元线性回归、混合模型、质量平衡模型或反应性传输模型,往往不足以理清溶解金属同位素特征的主要控制因素。单变量统计和简单线性回归是探索数据集并识别单个变量之间潜在趋势或关系的快速且简单的方法。

 

然而,这两种方法都假设变量之间相互独立,并且单变量统计假设数据呈高斯分布,这可能导致过度简化或忽略在水文学中常见的多个变量之间的关系。在使用金属同位素的水文研究中,多元线性回归有助于同时研究同位素特征与多个变量之间的关系。

 

然而,在水文研究中多元线性回归的一个主要缺点是假设自变量之间不存在相互作用。使用保守金属同位素(如87Sr/86Sr)的混合模型有助于估计来自离散水源/端元的水或溶质的相对输入量,但它们不适用于非保守金属同位素(如δ44/42Ca、δ7Li、δ26Mg或Si),因为这些同位素会因次生矿物形成等河道内过程而发生分馏。

 

虽然这些方法对我们理解金属同位素行为和水文过程做出了有意义的贡献,但它们无法定量地对影响金属同位素特征或它们所追踪的过程的多个(有时相关的)变量的相对影响进行排序。

 

例如,旨在表征北极和亚北极独特而复杂水文状况下风化作用的金属同位素研究尚未完全解决驱动风化作用的过程及其相对重要性。这些地区的水文状况正因气候变化而发生变化,它们正经历着最快速的变暖,预计还将继续加速变暖。

 

北极和亚北极流域水文变化的证据包括热喀斯特地貌的形成、多年冻土的损失、多年冻土的变暖、活动层的加深、年径流量的变化、流域尺度溶解有机碳输出的减少、地下水对径流贡献的增加、地下水流动路径的加深、水 - 岩相互作用的增强以及以前因多年冻土存在而受到抑制的原生矿物的化学风化。

 

要理解变暖如何影响北方流域的风化作用和水文地球化学,需要能够理清并量化气候、地形、岩性和环境变量相对重要性的方法。

 

在过去三十年中,将锂同位素(δ7Li)作为各种环境中硅酸盐风化过程的示踪剂已得到广泛确立,包括在首次对河流进行锂同位素研究中。锂主要存在于硅酸盐矿物中,在碳酸盐矿物或植被中的浓度相对可以忽略不计。

 

在风化过程中,锂同位素会因次生矿物形成和吸附到粘土等过程而发生分馏,这些过程会将6Li分配到固相。剥蚀速率和风化壳停留时间等因素影响硅酸盐风化的一致性,这越来越被视为大型河流中溶解态δ7Li的主要控制因素。

 

风化一致性定义为原生矿物溶解速率与次生矿物沉淀 - 溶解速率的比率。不一致风化会由于次生矿物形成将⁶Li分配到固相而导致δ7Li增加。由于原生矿物溶解不会使锂同位素发生分馏,一致风化会导致溶解态δ7Li接近母质的特征。解释大型河流中的δ7Li值具有挑战性,因为多种因素会影响整个景观中的风化一致性。

 

例如,康等人通过单变量回归表明,锂同位素在整个黄河流域随几个环境协变量(如温度、多年冻土覆盖率、地形、冰川作用历史)而变化。

 

虽然这项研究有意义地推进了我们对硅酸盐和碳酸盐对风化通量相对输入的理解,并强调了冰川和气候过程影响流域内的水 - 岩相互作用,但单变量统计无法评估控制整个流域δ7Li的多个变量的相对影响。

 

除了其复杂的水文和风化状况外,北极和亚北极流域往往相对难以表征,因为由于地处偏远、天气条件和缺乏基础设施,对其进行监测可能具有挑战性且成本高昂,导致数据集在空间或时间上受到限制。开放获取的全球卫星数据对于构建更全面的数据集以模拟北方流域的过程可能特别有用。

 

这些不断增长的环境、气候、岩性和物理化学数据源对流域研究具有巨大潜力。用地理空间数据扩充金属同位素数据集可能是解释其复杂变化并为水文过程提供新见解的一种有前途的方法。

 

然而,将公共地理空间数据与同位素或其他地球化学数据相结合可能会产生庞大而繁琐的数据集,分析起来可能具有挑战性且耗时。

 

机器学习在分析水文研究中常见的大型多维数据集方面具有巨大潜力。机器学习是一组算法从数据中自动学习(无需明确编程)以进行预测、推荐或分类的过程。如果应用得当,机器学习可以比经典统计方法更加稳健和灵活。

 

这是因为它们不依赖于标准统计技术经常做出的限制性假设,如特征独立性、线性或正态性,因此能够识别并从水文地球化学数据中的模式进行推断,而这些模式是其他方法无法利用的。

 

最近,机器学习已成功应用于分析地球科学多个领域的高维数据集,包括地球化学和水文学。除了提高分析大型数据集的效率外,机器学习还可以揭示以前发表数据的新见解,并对给定目标变量的相对控制因素进行排序。

 

在水文地球化学中,机器学习已应用于模拟水质、河流和地下水的物理化学变量、地下水盐度以及河流和地下水污染物。虽然将机器学习应用于水文数据集的兴趣和潜力在不断增长,但研究人员在应用之前必须了解不同机器学习算法的适用情况和局限性。

 

图1育空河流域锂同位素案例研究

 

在这里,我们提出一个将机器学习应用于水文研究的简单、广泛适用的框架,并通过在康等人工作的基础上进行案例研究,完善对育空河流域(YRB)δ⁷Li变化的解释。育空河流域是一个地形和岩性多样、冰川历史复杂且多年冻土覆盖率不同的大型流域。在育空河流域,钙、镁、钠、磷和硫酸根浓度在过去三十年中显著增加。

 

我们用来自育空河源头和流域最北部的另外21个水样扩充了由整个育空河流域采集的水样组成的现有水文地球化学数据集,并使用开放获取的地理空间数据提取了每个排水流域的特征。然后,我们测试了多种机器学习算法以预测整个流域的δ⁷Li变化,并评估了它们的性能和可解释性。

 

最后,我们提出一个简单框架,用于应用机器学习理清控制金属同位素变化的气候、地形和岩性变量之间的相互作用,并确定在流域尺度上通常被常见统计方法遗漏的非线性和阈值关系,该框架可推广到全球其他同位素和流域。

 

1.Sarina Cotroneo, Myunghak Kang, Ian D. Clark, Clément P. Bataille, Applying Machine Learning to investigate metal isotope variations at the watershed scale: A case study with lithium isotopes across the Yukon River Basin, Science of The Total Environment, Volume 896, 2023, 165165, ISSN 0048-9697, https://doi.org/10.1016/j.scitotenv.2023.165165.

 

环境检测是科学指南针旗下综合性的检测技术服务平台,实验室分布南京、北京、上海、青岛等全国30余个城市,测试项目齐全包括但不限于常规理化项目、LCMS、GCMS、同位素、单糖组成、DOM(FT- ICR- MS)、水土抗生素等。其中环境实验室总部坐落于南京市,已取得检验检测机构资质认定CMA证书,国家标准、行业标准,一应俱全。此外,我们还拥有一批技术过硬、科研水平深厚的专业团队,为您提供全面、专业、高质量的环境检测服务。

 

免责声明:部分文章整合自网络,因内容庞杂无法联系到全部作者,如有侵权,请联系删除,我们会在第一时间予以答复,万分感谢。