基于高斯混合模型的林业信息文本分类算法 |
| |
引用本文: | 陈宇,许莉薇.基于高斯混合模型的林业信息文本分类算法[J].中南林业科技大学学报,2014(8):114-119. |
| |
作者姓名: | 陈宇 许莉薇 |
| |
作者单位: | 东北林业大学信息与计算机工程学院; |
| |
基金项目: | 国家948项目(2011-4-04);中央高校基本科研业务费专项资金项目(DL12CB02);黑龙江省教育厅科学技术研究项目(12513016);黑龙江省博士后基金;黑龙江省自然科学基金项目(F201347);哈尔滨市科技创新人才专项资金项目(2013RFQXJ100) |
| |
摘 要: | 为解决传统林业信息文本分类算法准确率低和正确率分布不均匀的问题,提出了一种基于高斯混合模型的林业信息文本分类算法。在阐述高斯混合模型和EM算法的基础上,使用TF-IDF方法计算林业信息文本特征值,对构造的林业信息文本特征矩阵降维,结合Kmeans算法,通过训练得到各类林业信息文本所对应的高斯混合模型的参数,构造分类器进行精准与快速分类。实验结果表明,该算法与神经网络分类方法、贝叶斯、决策树等常用分类算法相比,该算法有较高的准确率和实用性,为林业信息文本的分类研究开拓了新思路。
|
关 键 词: | 林业信息 文本分类 高斯混合模型 参数估计 |
本文献已被 CNKI 等数据库收录! |
|