首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 171 毫秒
1.
耕地土壤有机碳(Soil Organic Carbon,SOC)含量不仅是土壤质量的重要表征,还是农业温室气体的重要源库,而基于环境变量建立的随机森林算法(Random Forest,RF)是当前提高土壤有机碳空间预测精度的方法,但不同组合环境变量对RF模型预测精度的影响仍需深入研究。本文以福建闽东南复杂地貌区为例,以两种环境变量组合(遥感变量+气候因子和遥感变量+气候因子+土壤属性)为输入数据集,利用RF算法对耕地表层SOC含量进行模拟预测和精度对比,并与普通克里格(OrdinaryKriging,OK)插值模型进行比较。结果表明,基于全部环境变量构建的RF模型表现最佳,其模型拟合度和预测精度相较于未加入土壤属性的模型有显著提高(r提高7.95%,为0.95,RMSE下降45.13%),且对SOC空间分异信息的捕获更精确,OK模型总体预测精度最弱。利用最优模型反演得到的研究区耕地SOC含量为14.70±2.95 g·kg~(–1),东部沿海低于西部内陆。变量贡献率分析显示,除了与土壤碳紧密相关的水解性氮(N),遥感变量中数字高程模型(Digital Elevation Modecs,DEM)也是影响闽东南地区SOC预测精度的重要变量,因此,遥感变量、气候因子和土壤属性共同驱动的随机森林模型可作为闽东南复杂地貌区耕地有机碳含量空间预测的有效方法。  相似文献   

2.
应用基于PLSR的土壤-环境模型预测土壤属性   总被引:2,自引:0,他引:2  
土壤-环境模型对于正确理解土壤属性与环境因子间的关系,以及进行土壤属性预测与制图均具有重要的意义。研究区位于陕西省长武县内多年退耕还林还草沟壑区域,采集72个土壤表层样本,选择3/4的样本作为建模集,其余1/4的样本作为验证集;环境因子选择容易获取的地形因子和由遥感影像提取的植被因子和湿度因子,建立基于偏最小二乘回归(PLSR)的土壤-环境模型。结果表明:全氮、速效钾、全钾、有机质与环境因子间均有显著相关性;建立的PLSR模型可解释土壤属性的空间变异从23%(全氮)到27%(全钾);与逐步回归方法构建的模型相比,利用PLSR构建的土壤-环境模型可以更好地表征土壤属性与环境变量间的关系,拟合精度和预测精度也相对较高,说明PLSR建立的模型可以更好地应用于相似区域的土壤属性预测。  相似文献   

3.
基于随机森林模型的安徽省土壤属性空间分布预测   总被引:10,自引:3,他引:7  
卢宏亮  赵明松  刘斌寅  张平  陆龙妹 《土壤》2019,51(3):602-608
为探讨随机森林(random forest,RF)模型对土壤属性空间预测的精度,本文以安徽省为例,收集140个土壤样本,利用GIS和RS技术,获取相关的地形因子、遥感植被指数及气候数据,利用RF模型分析土壤有机碳(SOC)含量、土壤容重和土壤黏粒含量与地形因子、遥感植被指数及气候数据之间的关系,并进行空间分布预测。研究结果表明:①RF建模预测中,当节点分裂次数(mtry)值为1,决策树数量(ntree)值分别为100、1 000和100时,获得的SOC含量、土壤容重和土壤黏粒含量RF模型最优;②高程、归一化植被指数(NDVI)、地貌、多尺度山谷平坦指数(MrVBF)和土壤类型是SOC含量的重要预测因子;地貌、年均降水量(MAP)、MrVBF、高程和土壤类型是土壤容重的重要预测因子;高程、MAP、MrVBF和平面曲率是土壤黏粒含量的重要预测因子;③RF模型可以较好地进行土壤属性空间预测,多源环境变量组合可以分别解释SOC含量、土壤容重和土壤黏粒含量的26%、23%和22%;同时RF模型对于土壤类型和地貌等类型变量的处理具有一定优势。研究表明,在大尺度研究区域内,利用RF模型进行土壤属性空间预测有一定的意义。  相似文献   

4.
土壤有机碳(soil organic carbon,SOC)既是衡量土壤质量的重要指标,也是影响全球碳氮循环的关键因素之一。作为数字土壤制图(digital soil mapping,DSM)研究中起主要作用的环境变量,地形元素在SOC预测制图中也是无可替代的。应用机器学习模型,通过引入不同超参数设置下获得的高分辨率(5 m)Geomorphons(GM)地形分类图作为丘陵地形特征信息的补充,结合数字高程模型(digital elevation model,DEM)衍生变量和光学、合成孔径雷达(synthetic aperture radar,SAR)遥感数据对句容市黄梅镇北部小流域尺度(1︰25 000)丘陵地貌区地表层SOC含量进行预测制图,并评估不同GM变量在SOC含量预测中的表现。基于74个土壤样本和不同环境变量组合,分别采用袋装决策回归树(bagged classification and regression tree,bagged CART)、随机森林(random forest,RF)和立体派(cubist)三种方法构建SOC含量预测模型,并通过四个精度验证指标,采用十...  相似文献   

5.
顾永昇  丁建丽  韩礼敬  李科  周倩 《土壤》2023,55(2):426-432
本文以渭干河–库车河绿洲(简称渭–库绿洲)土壤颗粒为研究对象,采集了绿洲内50个典型表层(0~10 cm)土壤样本,通过相关软件,提取到遥感指数变量、地形和气候等环境变量,经过相关性分析确定环境变量和预测目标间的关系,使用R语言构建了预测土壤颗粒含量的随机森林(random forest,RF)模型和极端梯度提升(extreme gradient boosting,XGBoost)模型。研究结果表明:XGBoost模型的预测结果整体好于RF模型,其中相关系数介于0.39~0.78;土壤pH、高程及衍生变量、光谱变换变量均是两个模型预测土壤颗粒含量的重要因子;将模型预测结果、实测数据和世界土壤数据库(HWSD)中的3种土壤颗粒数据作对比分析,结果表现出模型预测数据的误差小于HWSD与实测数据的误差。综上所述,通过筛选环境变量建立的XGBoost模型,是预测渭–库绿洲土壤颗粒含量的有效方法。  相似文献   

6.
快速准确获取农田土壤重金属含量对区域土地质量评估和粮食安全至关重要。该研究以江西省仙槎河流域小龙钨矿周边农田土壤为研究对象,采用WorldView-3多光谱影像提取光谱反射率并进行光谱变换处理,同时考虑了地形、人类活动和土壤属性等影响农田土壤镉(Cd)含量空间分布的关键环境因子,将光谱、环境变量、光谱与环境变量分别作为模型的自变量,选取了偏最小二乘(Partial Least Squares Regression,PLSR)、支持向量机(Support Vector Machines,SVM)、BP神经网络(Back Propagation Neural Network,BPNN)和随机森林(Random Forest,RF)4种回归算法构建土壤Cd含量预测模型,并利用精度评价指标优选出最佳反演模型。结果表明:仅输入多光谱特征进行Cd含量反演的模型精度总体偏低,R2低于0.2。相比之下,单独输入环境变量的模型精度结果最为理想,最优模型(RF)精度R2可达0.782。然而,融合光谱信息与环境变量共同建模后并未显著提高模型精度,反而导致较优模型(RF)精度略微降低,R2为0.693。研究结果表明,关键环境协变量是决定研究区农田土壤重金属Cd空间分布反演的重要变量,而利用多光谱信息进行土壤重金属反演的能力有限。此外,随机森林模型是预测土壤重金属空间分布的有效手段。  相似文献   

7.
青海省表层土壤属性数字制图   总被引:7,自引:1,他引:6  
对于土壤景观复杂的大区域,样点往往较为稀疏,如何准确地进行土壤预测制图仍是一个需要研究的问题。本文以青海省为研究区,基于近年采集205个土系调查点数据,采用随机森林模型,分别建立了表层(0~20 cm)土壤全氮、有机碳、粉粒含量和pH四个基本土壤属性与环境协同变量(海拔、坡度、地形湿度指数、年降水量、年平均气温、归一化植被指数、地表温度和地表反射率)之间的定量关系模型,对该地区进行了土壤多要素预测制图,分析了影响土壤空间变异的控制性因素。交叉验证结果显示,全氮、有机碳、粉粒含量和pH的R~2分别是0.61、0.53、0.47和0.54,这说明随机森林模型可解释47%以上的土壤空间变异。表层土壤全氮和有机碳空间分布趋势东南高,西北低,pH呈现出相反的空间模式;粉粒含量东高西低,预测结果高值出现在柴达木盆地和南部玉树、果洛地区。环境变量的重要性分析表明,年降水量对表层土壤全氮、有机碳、pH空间分布模式具有控制性影响,夜间地表温度与表层土壤粉粒含量空间变异具有较强的协同关系。  相似文献   

8.
土壤属性空间分布受地学环境要素影响,空间分异特征十分明显,单一的全局插值模型在应用中常受到一定条件的限制。对复杂地貌类型区土壤属性插值所面临的空间不连续、全局插值模型精度有限以及适应性差的缺点,提出了一种融合地学环境信息的土壤属性自适应曲面建模方法(Adaptive surface modeling for soil properties,ASM-SP)。利用2013年采集的110个样点数据,以土壤全钾含量为例,利用ASM-SP、普通克里格法(Ordinary Kriging,OK)、回归克里格法(Regression Kriging,RK)、地理加权回归克里格法(Geographically Weighted Regression Kriging,GWRK)和协同克里格(Ordinary Co-Kriging,OCK)5种插值方法,分别模拟了青海湖流域典型地区土壤全钾含量的空间分布。采用平均误差(Mean Error,ME)、平均相对误差(Mean Relative Error,MRE)、均方根误差(Root Mean Square Error,RMSE)、准确度(Accuracy,AC)、相关系数、回归系数和决定系数7类指标系统评价不同插值方法的预测效果。结果表明:(1)利用常规插值(OK)得到的插值曲面较为平滑,具有弱“牛眼”效应,在刻画土壤全钾含量的空间变异性方面存在明显不足,精度有待提高。(2)在融合地学环境信息的插值方法中,RK,OCK,GWRK和ASM-SP模拟精度较OK有不同程度提高,其中ASM-SP在刻画土壤全钾含量的空间变异和局部细节信息方面表现突出,精度较其他插值方法有较大程度提高,其准确度较OK,RK,GWRK和OCK分别提高9.27%,6.29%,2.66%和7.74%。ASM-SP尤其适合复杂地貌类型区,因其考虑了地学环境变量与土壤属性的非线性关系,并融合了多个模型的适应性优势,其在刻画土壤属性空间分异的复杂性方面也更加符合实际情况,为土壤属性的空间模拟提供了新思路。  相似文献   

9.
郝辰恺  孙孝林  王会利 《土壤学报》2023,60(4):993-1006
数字土壤制图(DSM)在当前的应用越来越广泛,其方法主要包括环境相关模型、空间自相关模型,以及这些模型的混合模型。理论上,混合模型相对单一模型具有明显的优势。广义线性地统计模型(GLGM)也是一种混合模型,相对于最常用的混合模型——回归克里格(RK),又具有能加入随机效应来解决土壤变异的非平稳性等优势。然而,GLGM因计算繁琐等缺点,在国内外应用较少。本文以广西南宁高峰林场内一小面积(3.03km2)丘陵为研究区,以14个地形因子为预测变量,使用GLMM及其与普通克里格(OK)相结合的模型(GLGM),对土壤有机碳(SOC)、pH、黏粒和阳离子交换量(CEC)的空间分布进行预测,并与常用的多元线性回归(MLR)、地理加权回归(GWR)、回归森林(RF)、普通克里格(OK)、RK和广义可加模型(GAM)进行比较。结果表明:GLMM在预测黏粒上准确度较高;GLMM和GLGM在预测CEC上准确度中等;GLMM和GLGM在预测SOC和pH上准确度较低。综合线性回归模型的调整决定系数、块金效应和全局莫兰指数,本文认为,当土壤属性与环境变量具有较低的线性回归调整决定系数(即小于5%)、土壤属性具有较弱的空间自相关性(即块金效应大于71%)和较强的局部空间变异(即全局莫兰指数小于0.09)时,GLMM和GLGM具有较高的适用性,例如本文中的黏粒。反之,GLMM和GLGM的适用性不好,例如本文中的SOC和pH。鉴于土壤空间变异的高度异质性和多尺度性,本文认为GLMM和GLGM具有较好的应用前景。但是,在未来的研究中还需要进一步研究如何提高GLMM和GLGM的模拟效率。  相似文献   

10.
提升土壤属性空间预测精度对实现农田精准施肥和保护生态环境具有重要意义。利用河北省滦平县采集的1 773个样点耕地表层(0~20cm)土壤有机质(SOM)及其地理环境数据,通过逐步回归分析方法筛选出最优环境变量;基于其中1 426个农田样点分别建立多元线性回归(Multiple Linear Regression,MLR)、随机森林(Random Forest,RF)、贝叶斯正则化神经网络(Bayesian regularization neural network,BRNNBP)以及与普通克里格(OK)整合模型(MLR-OK、RF-OK和BRNNBP-OK)预测SOM空间分布,以其余347个样点数据为测试集检验分析不同模型预测精度,并对模型残差进行半方差函数和空间自相关分析以评价模型拟合效果。结果表明,研究区耕地表层土壤SOM处在8.62~35.64 g·kg-1变化区间,变异系数为20.26%,属中等程度空间变异;SOM高值区主要分布在东北及东南海拔较高地区,低值区多分布在西南及中部河谷地区;海拔、坡度和年均温度与SOM关系密切(P<0.001);整合模型...  相似文献   

11.
基于环境变量的中国土壤有机碳空间分布特征   总被引:3,自引:0,他引:3  
研究中国土壤有机碳(Soil Organic Carbon,SOC)的空间分布特征对SOC储量估算以及农业生产管理具有重要意义。以全国第二次土壤普查2473个土壤典型剖面的表层(A层)SOC含量为研究对象,探寻地形、气候和植被等环境因素对SOC空间异质性分布的影响;以普通克里格法为对照,利用地理加权回归、地理加权回归克里格、多元线性回归和回归克里格模型建立SOC空间预测模型;并分别绘制了中国SOC的空间分布预测图。结果表明:(1)SOC含量与年均降水量、年均温、归一化植被指数、高程以及地形粗糙指数呈极显著相关关系;(2)平均绝对估计误差、均方根误差、平均相对误差和皮尔逊相关系数等模型验证指标表明地理加权回归的预测精度优于其他模型,可以更好地绘制SOC在大尺度上的空间分布特征;(3)较高SOC含量主要分布在研究区东北部、西南部以及东南部,而西北部SOC含量普遍偏低。本文以期从大尺度上探讨土壤属性与环境变量之间的相关关系,为全国土壤属性的空间制图提供一定的解决方案和思路。  相似文献   

12.
基于GIS和随机森林算法的宁东土壤饱和导水率分布与预测   总被引:5,自引:2,他引:3  
为探明宁东土壤饱和导水率(Ks)的空间分布特征,在宁东采集136个原状土,采用经典统计和地统计方法分析土壤Ks的空间结构特征,并以地形因子、土壤属性等作为辅助变量,运用随机森林法(RF)、普通克里格法(OK)和逐步回归克里格法(RK)对区域土壤Ks进行预测并对3种方法的预测结果进行精度评价。结果表明:Ks介于0.05~7.13 mm/min,平均值为1.46 mm/min,变异系数为106.86%;Ks与容重、孔隙度、高程、坡度、坡向、平面曲率和剖面曲率在不同滞后距离下具有自相关关系和交互相关关系;土壤Ks块金值为38,表明随机因素引起的土壤Ks变异性较大,空间异质比为15.32%,在空间上呈现强变异性;RF法的预测精度最高,其平均相对误差(MRE)和均方根误差(RMSE)绝对值均为最小,相比OK和RK方法预测精度分别提高了5.53%和2.49%,且对局部细节的描述更准确、模拟效果最佳。RF法可以较为准确的预测宁东土壤Ks,为了解研究区土壤水文过程及林草植被建设提供数据参考。  相似文献   

13.
空气负离子是衡量一个地区空气清洁度的重要指标,对人体的心理和生理机能的调节发挥着重要作用。随着森林生态旅游的兴起,空气负离子的发生过程及影响机制已成为研究热点。本研究基于华北低丘山地森林植被主要生长季的气象数据和栓皮栎人工林空气负离子浓度观测资料,利用机器学习中随机森林模型从非线性角度全面分析确定影响空气负离子浓度变化的重要环境因子,通过独立样本对构建的随机森林模型进行模拟和检验,确定模型的预测精度,同时筛选出对空气负离子影响程度最大的环境因子。结果表明:随机森林模型在分析环境因子对空气负离子影响方面具有较高的精度以及较好的拟合效果,通过对模型的拟合值与实测值进行验证,均方根误差(RMSE)为59.349,决定系数R2达到了0.887。同时利用独立样本数据对随机森林模型进行十折交叉验证,决定系数R2均达到了0.904以上,且均方误差(RMSE)较小,为24.851。此外,模型筛选出影响空气负离子的主要因素,按重要性排序依次为颗粒物PM2.5(48.037)、饱和水汽压差(46.169)、土壤湿度(43.984)、风速(43.779)、紫外辐射(41.130)、土壤温度(40.107)、总辐射(36.838)、大气压力(34.532),其中对模型重要性贡献相对较高的3个变量分别为颗粒物PM2.5、饱和水汽压差和风速,它们对空气负离子的影响起决定性作用。因此,随机森林模型适合分析环境因子对空气负离子影响,且拟合效果精度高,稳定性强。  相似文献   

14.
为指导节水灌溉策略的制定,利用基于多值神经元的复数神经网络(multilayer neural network with multi-valued neurons,MLMVN)方法,建立了土壤墒情多步预测模型。首先,利用均值法替换样本中的异常值并对缺失值进行补充,并由数据分析知土壤墒情数据为非平稳的非线性时间序列。然后,根据土壤墒情与环境因素(降雨量、气温和风速)的相关性分析结果选择降雨量为关键环境因素。最后将土壤墒情、降雨量及目标土壤墒情复数化,作为网络输入和期望输出建立MLMVN预测模型。结果表明,网络结构为240-15-1200-1时单步预测精度为0.883,采用循环预测法进行步长为72的多步预测,平均预测精度为0.853,比实数域误差反向传播神经网络BP提高了9.1%。研究表明,MLMVN模型多步预测误差累计小,预测结果可作为该地区节水灌溉策略制定的理论依据。  相似文献   

15.
为了全面认识土壤中的砾石对土壤可蚀性因子(K)的影响,即砾石效应(stoniness effect on erodibility,SEK),利用全球范围的砾石覆盖影响(St),剖面砾石影响(Kcf)、砾石覆盖和剖面砾石综合影响(Kf-cs)以及高程、坡度、坡向、植被覆盖、土地利用类型、多年平均降雨量、多年平均气温等环境要素数据,通过相关性分析、格局分析以及随机森林回归分析,探索了SEK的空间格局以及影响SEK的主控因素。结果表明:(1)高程和坡度与SEK呈正相关; 植被覆盖度、降雨量和温度与St和Kf-cs呈负相关; 降雨量与Kcf呈负相关; 温度与Kcf呈正相关; 阳坡的砾石效应大于阴坡; 耕地和林地的砾石效应较小,草地、荒漠和裸地的砾石效应较大。(2)St和Kf-cs的主控因子为高程和坡度,降雨量和温度是Kcf的主控因子。因此,在大区域土壤侵蚀评价中,对于砾石含量较大、高程较高、坡度较大的区域,均应给予特别关注,如果不加考虑,则有可能使土壤侵蚀评价结果出现偏差。  相似文献   

16.
杜龙全  刘峰  史舟  赵霞  李德成  张甘霖  董晋鹏  陈东升 《土壤》2022,54(6):1273-1282
土壤养分空间分布是土壤质量监测与可持续管理的关键信息。在大面积高寒山区,土壤调查样本较为稀疏,准确地预测土壤养分的空间变异并建立合理的管理分区,具有重要科学意义。本文基于青海省土系调查的205个土壤剖面数据,利用随机森林模型结合环境因素变量(地形、气候、植被、遥感数据), 分别建立了表层(0-20cm)土壤全氮(TN)、全钾(TK)、全磷(TP)与之间的定量关系,对青海省土壤养分含量的空间分布进行了预测;在此基础上,结合全国土壤养分的分级标准,利用投影寻踪法,生成了土壤养分的管理分区。留一交叉验证结果显示,全氮(TN)、全钾(TK)、全磷(TP)空间预测的R2分别是0.89、0.85、0.82,可解释土壤养分空间变异的80%以上,表明随机森林模型和环境因素变量结合可以在稀疏样本条件下有效地预测大面积高寒山区土壤养分空间变异。青海省土壤养分呈现东高西低的分布模式,土壤综合养分高等级 出现在南部的玉树、果洛、黄南和东部的湟水谷地地区;低等级主要分布在柴达木盆地、可可西里、海南州中南部;全省土壤综合养分分级均在中上等级以上 ,占全省面积是81%。分析发现,植被是影响青海省表层土壤养分全氮(TN)、全磷(TP)、全钾(TK)空间分布的主要环境因素,其中年降水、地表温度是影响青海省表层土壤全氮(TN)空间模式的重要因素;地表覆被、海拔和地表温度等环境因子对表层土壤全磷(TP)的空间变异占主导作用;年降水、昼夜温差是影响表层土壤全钾(TK)的空间模式的重要因素。  相似文献   

17.
以四川省土壤厚度预测为例,为农业生产与生态环境评价中土壤厚度空间分布图的编制提供方法支持。对比分析了随机森林、分位数回归森林、支持向量机、集成学习模型对连续型土壤厚度的预测精度,并提出了一种基于特征集成学习的土壤厚度类型预测算法。研究结果表明:①四川省土壤厚度具有较高的空间异质性,控制其空间变化的主要地形因子包括谷底平坦综合指数、高程与地形湿度指数;②四川省土壤厚度预测模型的决定系数为0.32~0.47,均方根误差为0.28~0.41 m;③面向连续型土壤厚度预测的集成模型具有较高的预测精度与稳健性,能够充分集成子模型的优势。特征集成学习能够有效集成并融合了连续型土壤厚度预测与离散型土壤厚度类型预测结果,通过减少方差来提高预测结果的稳健性。  相似文献   

18.
西南典型岩溶区土壤硒空间分布预测   总被引:4,自引:2,他引:2  
土壤硒精准预测和制图是富硒土壤资源开发利用和环境规划管理的基础。该文以西南典型岩溶区桂林永福百寿河流域为例,在分析影响土壤硒化学行为因子的基础上,通过野外样品采集和室内化学分析以及Arc GIS空间分析,获取了研究区相关地理环境因子和土壤属性因子数据。利用逐步回归方法选择土壤硒空间分布预测的辅助变量,使用协同克里格模型对非连续分布的辅助变量进行插值。在此基础上利用地理加权回归模型对土壤硒空间分布进行预测,同时以普通克里格插值结果作为参照。研究结果表明:使用地理环境因子和影响土壤硒化学行为的土壤属性因子可以提高土壤硒预测精度;协同克里格插值解决了辅助变量数据连续分布的问题;土壤硒的空间分布与地形和影响土壤硒化学行为的因子有关。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号