首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于Spark MLlib中决策树算法对阿尔及利亚森林火灾的预测研究
引用本文:高丰伟,田睿,周浩,胡洁.基于Spark MLlib中决策树算法对阿尔及利亚森林火灾的预测研究[J].四川林业科技,2023(5):24-31.
作者姓名:高丰伟  田睿  周浩  胡洁
作者单位:南京林业大学信息科学技术学院
基金项目:国家自然科学基金(11804162);
摘    要:应用阿尔及利亚森林火灾数据,通过Spark MLlib中的决策树算法,提出过滤相关性高的特征参数提升模型性能,对森林火灾进行预测研究。对温度、风速、雨及加拿大森林火险气候指数(FWI)系统中主要指标等特征参数,结合森林火灾的分类情况,使用信息增益标准为Gini的二叉决策树,建立基于决策树的火灾预测模型,对样本数据进行分类预测;提出分析不同特征参数之间的相关性,剔除相关性高的特征参数,利用大数据计算框架Spark建立机器学习工作流,将计算相关性的皮尔森系数与决策树分类算法结合了起来,从而优化模型,提高预测分类精度。预测模型改进前,即未进行相关性分析的森林火灾预测分类总精度为94.94%;预测模型改进后,即进行相关性分析,剔除了相关性较高的特征参数数据,森林火灾预测分类总精度为97.17%,准确率提高了近3%。使用Spark MLlib中的机器学习算法在森林火灾预测分类方面准确率总体较高,尤其在将多种数据挖掘算法结合后,模型性能得到提高,预测分类精度更高。

关 键 词:森林火灾  Spark  MLlib  决策树  相关性分析  FWI系统
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号