首页 | 本学科首页   官方微博 | 高级检索  
     

数字图书馆文本分类特征提取方法研究与改进
引用本文:鲍凌云. 数字图书馆文本分类特征提取方法研究与改进[J]. 农业图书情报学刊, 2014, 26(7): 33-35. DOI: 10.13998/j.cnki.issn1002-1248.2014.7.008
作者姓名:鲍凌云
作者单位:菏泽学院图书馆, 山东 菏泽 274015
基金项目:菏泽学院人文社会科学研究项目“社交网络SNS在高校图书馆服务中的应用研究”(项目编号:XY12SK07)
摘    要:从数字图书馆应用文本分类的重要性入手, 介绍了文本分类的含义及基本技术, 重点分析了文本分类中常用的两种特征提取方法:互信息算法和 统计量算法, 指出两种算法存在的不足并提出相应的改进措施。

关 键 词:文本分类  特征提取  互信息算法   统计量算法  
收稿时间:2014-01-23

Research and Improvement of Feature Selection for Page Categorization in Digital Library
BAO Ling-yun. Research and Improvement of Feature Selection for Page Categorization in Digital Library[J]. Journal of Library and Information Sciences in Agriculture, 2014, 26(7): 33-35. DOI: 10.13998/j.cnki.issn1002-1248.2014.7.008
Authors:BAO Ling-yun
Affiliation:Library, Heze College, Heze 274015, China
Abstract:Firstly this paper analyzed the importance of applying page categorization in digital library, then it introduced the connation and basic technologies of page categorization. Also the author studied two main feature selection methods specially: Mutual Information algorithm and Chi-square algorithm. Meanwhile, the paper pointed the current weaknesses of the two feature selection methods and put forward corresponding improving measures.
Keywords:Page categorization  
本文献已被 CNKI 等数据库收录!
点击此处可从《农业图书情报学刊》浏览原始摘要信息
点击此处可从《农业图书情报学刊》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号