基于Spark MLlib中决策树算法对阿尔及利亚森林火灾的预测研究 |
| |
引用本文: | 高丰伟,田睿,周浩,胡洁.基于Spark MLlib中决策树算法对阿尔及利亚森林火灾的预测研究[J].四川林业科技,2023(5):24-31. |
| |
作者姓名: | 高丰伟 田睿 周浩 胡洁 |
| |
作者单位: | 南京林业大学信息科学技术学院 |
| |
基金项目: | 国家自然科学基金(11804162); |
| |
摘 要: | 应用阿尔及利亚森林火灾数据,通过Spark MLlib中的决策树算法,提出过滤相关性高的特征参数提升模型性能,对森林火灾进行预测研究。对温度、风速、雨及加拿大森林火险气候指数(FWI)系统中主要指标等特征参数,结合森林火灾的分类情况,使用信息增益标准为Gini的二叉决策树,建立基于决策树的火灾预测模型,对样本数据进行分类预测;提出分析不同特征参数之间的相关性,剔除相关性高的特征参数,利用大数据计算框架Spark建立机器学习工作流,将计算相关性的皮尔森系数与决策树分类算法结合了起来,从而优化模型,提高预测分类精度。预测模型改进前,即未进行相关性分析的森林火灾预测分类总精度为94.94%;预测模型改进后,即进行相关性分析,剔除了相关性较高的特征参数数据,森林火灾预测分类总精度为97.17%,准确率提高了近3%。使用Spark MLlib中的机器学习算法在森林火灾预测分类方面准确率总体较高,尤其在将多种数据挖掘算法结合后,模型性能得到提高,预测分类精度更高。
|
关 键 词: | 森林火灾 Spark MLlib 决策树 相关性分析 FWI系统 |
|
|