共查询到19条相似文献,搜索用时 93 毫秒
1.
基于三种空间预测模型的海南岛土壤有机质空间分布研究 总被引:9,自引:0,他引:9
为探索适合热带地形复杂区土壤有机质(SOM)含量的空间预测方法,以海南岛为研究区域,结合地形因子、归一化植被指数、土壤类型、土地利用类型变量,选用普通克里格法(OK)、回归克里格法(RK)、随机森林模型(RF)三种方法对训练集128个样点SOM含量的空间分布规律进行预测,并通过验证集32个验证点比较了三种方法的预测精度。结果表明:(1)0~5 cm土层三种方法的平均预测误差(ME)均接近于0,从均方根预测误差(RMSE)来看,RF(0.8867)RK(0.910 4)OK(0.9641),从决定系数(R~2)来看,RF(0.214 1)RK(0.171 5)OK(0.070 8)。综合以上三个参数,该土层最优拟合模型为RF。同理得出0~20、20~40、40~60 cm土层的最优拟合模型分别为RF、RF、OK。RK和RF能够更好地描述SOM含量局部变异信息;(2)四个土层SOM含量的均值分别为19.67、15.89、10.30、8.07 g kg~(-1),呈现出西南、东北高,西部、东南沿海地区低的空间分布趋势。 相似文献
2.
不同方法预测苏南农田土壤有机质空间分布对比研究 总被引:3,自引:1,他引:3
准确把握土壤有机质(SOM)的空间分布规律对于土壤资源的高效持续利用具有重要意义。以江苏南部为研究区,以辅助因子与SOM的相关性强弱及辅助因子的可获取性为切入点,运用普通克里格(OK)、回归克里格(RK)和随机森林(RF)方法,结合地形、气候、土壤类型、土壤理化性质和施肥、碳投入等辅助数据预测了苏南地区农田SOM含量(0~20 cm)的空间分布。结果表明,三种方法预测的SOM空间分布总体趋势相似,表现为东高西低,但局部分异还存在差异;OK预测的精度最低,100次预测的均方根误差(RMSE)均值为6.97 g·kg~(-1)。RK和RF的预测精度则均高于OK方法,表现为整合与SOM相关性最强的辅助因子全氮(TN)时,RK和RF预测的RMSE分别降低至5.25 g·kg~(-1)和4.97 g·kg~(-1),而移除相关性最强的辅助因子TN后,RK和RF预测的RMSE亦较OK方法低,分别为6.21 g·kg~(-1)和6.29 g·kg~(-1);移除TN后,RK的预测精度稍高于RF,表明在其他辅助数据与SOM相关性相对较弱的条件下,RK方法有助于提高本研究区SOM预测精度;同时,尽管RK和RF的预测精度依然较OK高,但RK和RF对SOM方差的解释度则分别由51%和55%降低至了29%和28%。这表明,目前容易获取且相对廉价的辅助数据,对本研究区的SOM空间预测方面,还面临着数据质量低、预测精度不足等问题。 相似文献
3.
4.
研究不同模型对土壤有机质空间预测的性能差异对制定更加科学合理的采样策略、提升采样效率和提高土壤空间预测精度有着重要的指导意义。本研究将6496个土壤样点按8∶2的比例分层随机分成训练集与验证集,应用普通克里格、随机森林以及随机森林-回归克里格三种有代表性的数字化土壤制图(Digital Soil Mapping,DSM)模型,对河南省许昌市耕地表层土壤有机质含量及空间分布进行预测,对三种模型性能表现进行综合评价。三种模型输出的预测结果显示:研究区耕地表层土壤有机质含量水平一般,均值为18.70 ~ 18.81 g kg?1,变异系数0.15 ~ 0.17,属中等强度变异;空间分布总体格局为西北与西南部分山地褐土区、东南部砂姜黑土区表层有机质含量高,中北部脱潮土、石灰性潮土区表层有机质含量低。验证结果表明:三种模型性能表现无明显差距,预测精度基本一致,输出结果对研究区耕地表层土壤有机质变异解释百分比在33% ~ 34%之间,在相同和相近尺度土壤有机质空间预测案例研究里属中等水平。在协变量有限且样点分布较为均匀的情况下,普通克里格模型便于快速获得研究区目标变量的空间分布;如果协变量比较丰富且易于收集利用,或是进行空间预测的同时还需要甄别不同因素对目标变量的影响大小,则建议采用随机森林模型;协变量有限,但样点密度较大时,随机森林-回归克里格模型可能是对目标变量进行空间预测的不错选择。 相似文献
5.
基于随机森林模型的安徽省土壤属性空间分布预测 总被引:7,自引:3,他引:7
为探讨随机森林(random forest,RF)模型对土壤属性空间预测的精度,本文以安徽省为例,收集140个土壤样本,利用GIS和RS技术,获取相关的地形因子、遥感植被指数及气候数据,利用RF模型分析土壤有机碳(SOC)含量、土壤容重和土壤黏粒含量与地形因子、遥感植被指数及气候数据之间的关系,并进行空间分布预测。研究结果表明:①RF建模预测中,当节点分裂次数(mtry)值为1,决策树数量(ntree)值分别为100、1 000和100时,获得的SOC含量、土壤容重和土壤黏粒含量RF模型最优;②高程、归一化植被指数(NDVI)、地貌、多尺度山谷平坦指数(MrVBF)和土壤类型是SOC含量的重要预测因子;地貌、年均降水量(MAP)、MrVBF、高程和土壤类型是土壤容重的重要预测因子;高程、MAP、MrVBF和平面曲率是土壤黏粒含量的重要预测因子;③RF模型可以较好地进行土壤属性空间预测,多源环境变量组合可以分别解释SOC含量、土壤容重和土壤黏粒含量的26%、23%和22%;同时RF模型对于土壤类型和地貌等类型变量的处理具有一定优势。研究表明,在大尺度研究区域内,利用RF模型进行土壤属性空间预测有一定的意义。 相似文献
6.
黄土高原不同地貌区农田土壤有机质预测方法研究 总被引:1,自引:0,他引:1
[目的]开展黄土高原不同地貌区农田土壤有机质(SOM)预测方法研究,探讨不同预测方法在不同区域的适用性及不确定性,以便更准确地估算农田SOM空间分布特征,对土壤资源高效利用和农田精细化管理具有重要意义.[方法]在黄土高原3种典型地貌区进行试验,包括丘陵沟壑区(庄浪县)、高塬区(宁县)和平原区(武功县),分别布设样点37... 相似文献
7.
样点数量与空间分布对县域尺度土壤属性空间预测效果的影响 总被引:3,自引:1,他引:3
明确样点数量和空间分布对土壤属性空间预测的影响,有助于科学制定土壤采样策略、有效提高土壤空间预测精度。从5 403个土壤样点中随机抽取验证数据集以及包含不同样点数量的训练数据子集(每个子集包括五种样点空间分布实例),在研究区表层土壤有机质含量普通克里格(Ordinary Kriging,OK)和反距离加权(InverseDistanceWeighted,IDW)插值结果的基础上,分析和探讨样点数量与空间分布对土壤空间预测效果的影响。结果显示,当样点数量从5000降至39个时,OK和IDW插值图的局部变异信息逐渐减少,基于20和10个样点的插值图存在失真畸变。当样点数量从5 000降至1 250个时,OK插值精度相近(r变幅为0.55~0.59、RMSE变幅为3.03~3.15);从样点数量减少至625个开始,OK插值精度明显下降,同一训练子集不同样点空间分布的插值精度分异明显。IDW插值精度随样点数量与空间分布的变化与OK插值相似,不同的是从1 875个样点开始出现插值精度的明显下降和不同空间分布插值精度的明显分异。在插值图发生失真畸变之前,OK平均插值精度大于IDW。研究结果表明,样点数量及空间分布均可在不同程度上影响土壤属性空间预测结果,当样点数量足够多时,样点数量和空间分布对预测结果的影响非常有限;当样点数量减少至一定程度时,随着样点数量的减少,空间预测图的局部变异信息逐渐减少,预测精度逐渐下降,同时样点空间分布对预测结果的影响开始凸显;在空间预测结果发生失真畸变之前,与OK相比,IDW插值精度较低且更早响应样点数量和空间分布的变化。 相似文献
8.
基于随机森林模型的耕地表层土壤有机质含量空间预测——以河南省辉县市为例 总被引:5,自引:0,他引:5
耕地表层土壤有机质含量与作物生长发育密切相关,掌握土壤有机质空间分布对土壤肥力定向培养和农业生产指导具有重要意义。本研究以河南省辉县市5 922个耕地资源管理单元图斑中心点为基础数据,并分别按8∶2、7∶3、6∶4的比例随机划分训练数据集和验证数据集,以土壤类型作为辅助定性变量,利用随机森林模型模拟预测土壤有机质含量与自然环境变量(坡向、曲率、坡度、高程、土壤质地、归一化植被指数NDVI)、社会经济因子(排水能力、灌溉状况)之间的复杂非线性关系。结果表明:①当训练集与检验集中样点数量的比例为8∶2时,对应的随机森林模型总体上预测精度较高;②选用80%基础数据作为训练集时,预测得到的地图与已有图件相比,相关性达到0.859;③当用303个实地数据验证时,预测值与实测值的皮尔逊相关系数为0.595。通过对影响因子的重要性排序,发现土壤质地是研究区农用地表层土壤有机质含量的最重要影响因子。因此,随机森林模型作为机器学习和数据挖掘的有效方法,能较好地模拟输入变量与有机质含量之间的关系,预测图件与实际情况相符,但对有机质含量精细的差异不能很好体现。 相似文献
9.
样点密度对土壤有机质空间预测结果的影响——以河南封丘县土壤为例 总被引:5,自引:1,他引:5
以河南省封丘县表层土壤有机质含量为例,探讨土壤样点密度对区域化土壤变量描述性统计特征、半方差函数理论模型拟合效果、普通Kriging插值预测结果的精度与表现目标变量空间变异的能力等多方面的影响。研究结果表明,样点数量从5000个大幅减少至20个,研究区表层样品有机质含量均值未发生显著变化。当土壤样点≥625个时,表层土壤有机质含量半方差函数模型具有较好的拟合效果,可以通过Kriging插值手段获得精度较高且对目标变量空间变异特征解释能力较强的预测结果;当土壤样点≤78个时,半方差函数模型理论上无法通过拟合获得,通过普通Kriging插值手段不能获得研究区表层土壤有机质含量理想的预测结果。 相似文献
10.
基于改进OK模型的土壤有机质空间分布预测——以宜都市红花套镇为例 总被引:1,自引:0,他引:1
选择合适的土壤有机质(SOM)预测模型是提高区域化空间分布模拟精度的前提,也是监测土壤碳库动态变化和指导农田土壤肥力投入的基础。以湖北宜都红花套镇柑橘区为例,设置普通克里格(OK)插值的SOM结果作对照,分别建立SOM及其最显著相关辅助变量碱解氮间的建模协同克里格(COK1)、全局协同克里格(COK2)和两个融合辅助变量协同相关性的改进OK模型(CCOK1、CCOK2),探讨纳入辅助变量、改变辅助信息插值数量以及结合辅助变量协同相关性对SOM含量预测的影响。结果表明:1)OK、CCOK1和CCOK2的块基比为25%~75%,表现出中等空间自相关性,而COK1和COK2的块基比小于25%,具有强烈的空间自相关,SOM的空间异质性受结构性因素影响的比重更大。2)SOM的预测含量范围为7.38~29.03 g·kg-1,使用COK1和COK2模型插值获得的有机质空间分布较OK更为破碎,CCOK1和CCOK2的插值结果则呈连续片状分布,更符合研究区土地利用类型分布的实际情况。3)SOM的空间分布预测精度由高到低依次为CCOK1 ≈ CCOK2 > COK2 > COK1 ≈ OK,OK和COK1两者精度指标相近,COK2的拟合效果有一定改进,但CCOK1和CCOK2的相关系数(r)分别从0.10升高到0.70和0.69,均方根误差(RMSE)分别降低了15.40%和14.78%,预测精度最高。因此,本研究提出的融合辅助变量协同相关性的改进OK模型的估算效果最优且在最大程度上提高辅助信息的参与度,可为SOM预测提供参考。 相似文献
11.
针对现有土壤有机碳(soil organic carbon,SOC)空间分布预测模型难以适用于样点稀少条件下的问题,该研究依据成土环境越相似土壤属性越相似的假设,提出一种基于环境相似性的SOC空间分布预测方法(environmental similarity model,ESM),首先利用影响SOC空间分布的关键环境变量刻画研究区成土环境,然后比较采样点与待估测点处的环境相似度,最后依据环境相似度预测待估测点处的SOC含量。为验证ESM方法的有效性,以云南省作为案例研究区,并设置3个情景:1)从64个采样点中随机抽取10个点作为训练集,余下的采样点作为验证集,随机抽取20次;2)从64个采样点中随机抽取20个点作为训练集,余下的采样点作为验证集,随机抽取20次;3)从64个采样点中随机抽取30个点作为训练集,余下的采样点作为验证集,随机抽取20次。以平均绝对误差(mean absolute error,MAE)和均方根误差(root mean square error,RMSE)评估模型预测精度。方差分析结果表明,采样点分别为10、20和30这3个情景条件下ESM的MAE(12.7、11.7、11.1 g/kg)都显著(P < 0.05)低于多重线性回归(72.6、23.0、16.7 g/kg)和人工神经网络(15.8、14.9、15.8 g/kg),表明ESM模型具有较高的预测精度及较强的鲁棒性,可为成土因素复杂区域SOC空间分布的预测提供借鉴和指导。 相似文献
12.
土壤有机质含量是耕地质量定级的依据,是耕地质量评价的核心内容之一,因此,精准高效地获取土壤有机质含量非常重要。高分辨率遥感技术和谷歌地球引擎(Google Earth Engine,GEE)云计算平台的出现,为土壤有机质的高效反演提供了新的途径和方法。该研究以藁城区的Sentinel-2A MSI数据和Landsat8 OLI 数据为主要的数据源,结合Sentinel-1 SAR数据、ECMWF/ERA5气象数据和USGS/SRTMGL1_003高程数据,分别采用随机森林(Random Forest,RF)、梯度升级树(Gradient Boosting Decision Tree,GBDT)和支持向量机(Support Vector Machine,SVM)算法,在GEE平台对藁城耕地土壤有机质含量进行反演。结果表明:1)基于Sentinel-2A建立的模型(模型A*)在预测SOM含量方面优于基于Landsat8建立的模型(模型B*),GBDT算法下的Sentinel-2A的全变量模型取得了最佳结果(R2=0.759,RMSE= 2.852 g/kg);2)考虑红边波段的Sentinel-2A数据建立的模型(A-1)比不考虑红边波段的模型(A-0),R2提高了9.752%;;3)从不同的预测算法来看,GBDT算法能较好地适用于研究区的土壤有机质预测,GBDT算法、Sentinel-2A与GEE的结合是土壤有机质预测制图的一种有效方法。 相似文献
13.
基于多元地统计的土壤有机质含量空间格局反演 总被引:2,自引:2,他引:2
为了提高土壤有机质含量的空间预测精度,该文采用了一种多元地统计方法来构建遥感定量反演模型。考虑到回归误差在空间上具有一定程度的聚类,该文提出了基于局部变化均值的普通克里金方法,然后用其构建土壤有机质含量遥感定量反演模型。对四川省西南部土壤有机质含量进行空间预测试验,并与普通克里金、普通遥感定量反演、基于回归克里金的遥感定量反演等方法相比较。结果表明:该文提出方法的空间预测结果最优,其原因为该方法通过空间统计来建立采样数据与地表反射率间的联系,充分考虑了数据间的空间相关性,因此可以更精确地获得土壤有机质含量的遥感反演模型;相比基于回归克里金的遥感定量反演方法,基于局部变化均值的普通克里金假设回归误差在局部邻域内的均值也不一定为零,更符合实际情况。该方法为农田养分管理及区域农业的可持续发展提供科学依据。 相似文献
14.
基于环境因子和联合概率方法的土壤有机质空间预测 总被引:1,自引:1,他引:1
<正>土壤连续属性(如土壤中养分含量、重金属含量等)的空间分布特征和定量分布信息是进行土壤质量评价和区域环境综合评估的基础。精准农业战略的实施和各种区域生态评价均需要更详细更精确的土壤属性信息作为依据[1-2]。因此,土壤属性空间预测一直是土壤学研究的热点问题。经典地统计学以各种克里格插值法为代表,是土壤属性空间预测中的常用方法。但该方法缺乏对辅助信息(如环境信息)的有效利用[3-4],导致预测精度降低[5]。而土壤景观定量模型的理论依据就是土壤与环境的关系,但该法忽略了采样点之间的空间相 相似文献
15.
基于RBF神经网络的土壤有机质空间变异研究方法 总被引:7,自引:4,他引:7
通过研究土壤性质的空间变异和空间插值方法,快速准确获取土壤性质的空间分布是精确农业和环境保护的基础。该文以四川眉山一块约40 km2的区域为试验区,采集表层土壤(0~20 cm)样点80个,利用径向基函数(RBF)神经网络建立空间坐标和邻近样点与土壤有机质间的非线性映射关系(RBF2),模拟土壤有机质的空间分布。与普通克里法(OK)和仅以坐标为网络输入的神经网络方法(RBF1)相比,RBF2的插值精度有显著的提高;相同样点密度下其相对预测误差分别较OK和RBF1减小了9.87%、1.97%(样本A)和13.09%、2.36%(样本B);即使样点数减半的情况下RBF2的相对预测误差也分别较OK和RBF1减小了10.23%和2.33%,并且插值图差异相对较小,可以更好地反映土壤有机质空间分布的异质性。因此,利用以坐标和邻近样点为输入的神经网络方法可以相对准确、快速地获取区域土壤性质空间分布的异质性信息。 相似文献
16.
不同降噪方式下基于高分五号影像的土壤有机质反演 总被引:2,自引:3,他引:2
通过遥感技术预测土壤有机质(Soil Organic Matter,SOM)的空间分布是精准农业和土地资源管理研究的重要内容,与粮食安全及环境监测密切相关。该研究主要研究采用高分五号(GF-5)反演土壤有机质的最佳降噪方式。以黑龙江省典型黑土区明水县为研究对象,获取GF-5高光谱遥感影像,对影像进行不同降噪处理,包括奇异值分解(Singular Value Decomposition,SVD),离散小波变换(Discrete Wavelet Transform,DWT)及中值滤波(Median Filtering,MF)降噪。然而,分别结合二维光谱指数,应用随机森林(Random Forest,RF)方法预测不同降噪方式的SOM含量。结果表明:1)所选择的不同降噪方法中,与SOM含量的相关性由高到低依次为DWT、SVD、MF,其中,基于MF降噪后的光谱反射率与SOM含量相关性低于原始反射率与SOM含量的相关性。2)基于降噪方式下的光谱曲线更加平滑,且不同有机质含量对应的光谱曲线形状相似。3)采用DWT降噪方式,基于影像波段和光谱指数,以RF为预测模型的SOM最优反演模型精度R2为0.69,均方根误差为2.26%。研究成果可为利用高光谱卫星数据实现大尺度范围内SOM的数字土壤制图提供参考,为实时定量监测土壤肥力变化提供依据。 相似文献
17.
Alexandre M. J.-C. Wadoux 《European Journal of Soil Science》2023,74(3):e13370
Spectroscopic modelling of soil has advanced greatly with the development of large spectral libraries, computational resources and statistical modelling. The use of complex statistical and algorithmic tools from the field of machine learning has become popular for predicting properties from their visible, near- and mid-infrared spectra. Many users, however, find it difficult to trust the predictions made with machine learning. We lack interpretation and understanding of how the predictions were made, so that these models are often referred to as black boxes. In this study, I report on the development and application of a model-independent method for interpreting complex machine learning spectroscopic models. The method relies on Shapley values, a statistical approach originally developed in coalitional game theory. In a case study for predicting the total organic carbon from a large European mid-infrared spectroscopic database, I fitted a random forest machine learning model and showed how Shapley values can help us understand (i) the average contribution of individual wavenumbers, (ii) the contribution of the spectrum-specific wavenumbers, and (iii) the average contribution of groups of spectra taken together with similar characteristics. The results show that Shapley values revealed more insights than commonly used interpretation methods based on the variable importance. The most striking spectral regions identified as important contributors to the prediction corresponded to the molecular vibration of organic and inorganic compounds that are known to relate to organic carbon. Shapley values are a useful methodological development that will yield a better understanding and trust of complex machine learning and algorithmic tool in soil spectroscopy research. 相似文献
18.
基于CARS算法的不同类型土壤有机质高光谱预测 总被引:2,自引:8,他引:2
不同土壤类型的理化性质和光谱性质存在差异,以往研究多以高光谱反射率或光谱吸收特征建立模型,输入变量类型结构单一,往往导致土壤有机质(Soil Organic Matter,SOM)预测模型的精度不高。为提高SOM高光谱预测模型精度,该研究以黑龙江省海伦市为研究区,将不同类型土壤分别以竞争自适应重加权采样(Competitive Adaptive Reweighted Sampling,CARS)筛选的特征波段、数字高程模型(Digital Elevation Model,DEM)数据和光谱指数作为输入变量,结合随机森林(Random Forest,RF)算法建立SOM预测模型。结果表明:1)通过CARS算法筛选后,各土壤类型特征波段压缩至全波段数目的16%以下,在很大程度上降低土壤高光谱变量维度和计算复杂程度,从而提高了模型的预测能力,说明CARS算法在提取特征关键波段变量、优化模型结构方面起到重要作用;2)不同类型土壤的SOM预测精度存在差异,沼泽土的预测精度最高为0.768,性能与四分位间隔距离的比率(Ratio of Performance to InterQuartile distance,RPIQ)为3.568;黑土次之,草甸土的预测精度最低,仅0.674,RPIQ为1.848。3类土壤的RPIQ均达到1.8以上,模型具有较好的预测能力;3)局部回归预测精度最优,验证集的调整后决定系数为0.777,均方根误差(Root Mean Square Error,RMSE)为0.581%,模型验证RPIQ为2.689,模型稳定性高。该试验筛选的预测因子通过RF模型可实现SOM含量的快速预测,简化了传统复杂的程序,可为中尺度区域不同类型土壤的SOM预测提供依据,为输入量的选择提供参考。 相似文献
19.
以往的土壤有机质预测研究往往只提取一种光谱输入量,忽略了不同光谱输入量之间的互补性。为探究光谱输入量在预测土壤有机质时的最佳组合,以及不同光谱输入量在离散小波变换不同分解尺度下的变化趋势,该研究以宝清县土壤有机质为研究对象,对光谱反射率进行离散小波变换,对各个分解尺度下的特征光谱提取光谱特征参数、光谱指数以及主成分并分别组合,基于8种光谱输入量建立随机森林模型进行土壤有机质预测。结果表明:1)利用不同光谱输入量预测有机质的精度均高于直接使用光谱反射率建模的精度,将不同光谱输入量组合可以提升预测效果,单个光谱输入量中主成分的预测效果最好,组合中光谱特征参数和主成分的组合预测效果最好;2)随着分解尺度的变化,不同光谱输入量的预测精度的变化趋势也不同,并且单个光谱输入量的变化趋势也会影响该光谱输入量组合的变化趋势;3)所有预测结果中,精度最高的是分解尺度为6时光谱特征参数与主成分的组合,R2达到0.78,均方根误差达到1.32%,可以较好地预测土壤有机质。研究结果说明光谱输入量结合离散小波变换预测土壤有机质是可行的,可以为土壤有机质的预测提供可靠思路。 相似文献