共查询到16条相似文献,搜索用时 125 毫秒
1.
文本分类中特征提取方法的比较与研究 总被引:1,自引:0,他引:1
介绍了进行文本分类的关键技术,着重介绍了常用的文本特征提取方法.选取支持向量机方法作为文本分类器方法,选取不同特征提取方法应用于文本分类,通过实验,比较和分析了由不同的提取方法所构成的分类器的分类性能,确定了信息增益(IG)法和文本证据权(WET)为两种性能优异的特征提取方法.该结论可为分类性能进一步的优化研究奠定理论和实践基础. 相似文献
2.
文本分类中特征质量的好坏,会直接影响到分类的准确率,从特征提取这一环节出发,实现了一种改进的基于基尼指数的特征提取方法Gini,提出一种全局和局部特征提取相融合的特征提取方法。当MI、IG、CE、WET、Gini与χ2这6种特征提取方法用于SVM分类实验时,发现Gini全局特征提取能力强,χ2方法适合局部特征提取;当Gini与χ2两种方法相融合进行特征提取时表现出较强的特征提取能力,明显优于全局和局部的提取效果. 相似文献
3.
针对目前基于规则和基于统计的文本分类方法存在的不足,提出了一种新颖的基于规则和K-近邻分类相融合的文本分类方法。首先,对描述文本特征的传统向量空间模型进行了扩充,给出了具体的扩展模型。然后,基于扩展模型提出了一种规则的表示方法,并为每一条规则赋予了一个强弱系数,根据这个系数可以对识别的文本按级别排序。最后,通过设定一个阀值,将级别低于阀值的文本过滤掉。该方法可有效地排除被K-近邻分类误识别的那些文本,从而在一定程度上提高了分类的正确率。通过小数据集测试实验结果表明,该方法是有效的、可行的。 相似文献
4.
5.
在文本分类系统中,特征选择方法是一种有效的降维方法,在分析了几种常用的特征选择评价函数之后,根据其算法特点,对算法进行改进从而实现类内特征提取。实验结果证明改进后的类内特征选择方法简单可行、有助于提高所选特征子集的有效性。 相似文献
6.
文本信息自动分类系统ITC98(Ⅱ)--基于BP网络的文本分类子系统 总被引:2,自引:0,他引:2
设计并实现了文本信息自动分类系统ITC98的核心模块──基于BP网络的文本分类子系统。介绍系统的分类策略及根据分类问题需求确定BP网络结构和参数的方法。实例测试表明,系统分类精度和效率均达到要求。 相似文献
7.
朱秀华 《农业图书情报学刊》2009,21(8):26-29
针对信息挖掘中的文本自动分类问题,提出了一种基于自组织特征映射网络的分类方法。网络由输入层和竞争层组成。输入层节点与竞争层节点实行全互连接。输入层完成分类样本的输入,竞争层提取输入样本所隐含的模式特征,并对其进行自组织,在竞争层将分类结果表现出来。分无监督和有监督两个阶段完成对网络的分类训练。该方法在特征提取时充分考虑了特征项在文档中的位置信息,构造出模糊特征向量,使自动分类原则更接近手工分类方法。以中国期刊网全文数据库部分文档数据为例验证了该方法的有效性。 相似文献
8.
在文本分类系统中,特征选择方法是一种有效的降维方式,针对互信息方法存在负相关和对低频词倚重的不足,文中对互信息方法进行了改进并用于类内特征提取。在SVM和KNN分类器下,将互信息和改进后的互信息方法用于特征提取实验,实验结果表明改进后的互信息方法简单可行,能够提高所选特征子集的有效性。 相似文献
9.
讨论了基于互信息的特征选取算法在文本分类中的性能问题,分析了利用这种特征选取算法存在分类精度不高的原因,认为互信息为负值的特征在分类中具有很重要的作用.在此基础上提出了一种基于互信息特征选取的改进算法,该算法加强了互信息为负值的特征在分类中的作用.实验结果表明,改进后的算法可以有效地提高文本分类精度。 相似文献
10.
罗新 《农业图书情报学刊》2018,(4):18-22
面对海量、异构、动态的文本信息,对文本进行自动分类具有重要的意义。近年来,逐步发展起来的群集智能理论和方法为文本分类提供了一种新的智能化手段。笔者将群集智能中发展较为成熟的粒子群智能算法尝试性地引入到文本分类领域。构建了文本预处理模型,该模型是文本分类模型的基础。构建了基于PSO的文本分类模型Text PSO-Miner,并在文本集的向量空间矩阵上进行测试和比较。Text PSO-Miner的各项性能指标都优于经典的分类模型(SVM,KNN,NB)和基于ACO的文本分类模型。结果表明:Text PSO-Miner文本分类模型能够更好地应用于文本分类。 相似文献
11.
项目教学法是师生通过共同实施一个完整的项目而进行的教学活动,整个教学过程中既体现教师的主导作用又发挥学生的主观能动性,充分展示项目教学"学中做,做中学"的特点。本文结合教学实践,介绍了项目教学法的实施过程,并对《ASP动态网页设计与制作》课程进行了项目化的教学设计。同时,阐述了项目教学法在本课程中的具体应用。 相似文献
12.
13.
依据氨基酸侧链基团的电子效应,将17种氨基酸(Pro、Gly、Cys除外)划分为供电子效应氨基酸、吸电子效应氨基酸、弱电子效应氨基酸3类。并计算了该分类情况下氨基酸二级结构的倾向性因子,为了更好的说明该分类与蛋白质二级结构的关系,经讨论得到一个最终的分类结果。该结果很好地说明了氨基酸对于螺旋和无规则卷曲的倾向性。 相似文献
14.
15.
高校图书馆服务接触研究有助于提高图书馆用户满意度。分析高校图书馆服务接触内涵、服务接触三要素之间的关系,对服务接触过程中用户满意度进行研究,从服务规划管理、关键时刻管理、服务创新、服务反馈与补救以及新技术利用几方面,提出了高校图书馆服务接触详细改进策略。 相似文献
16.
装修产生的有害物质严重污染室内环境, 近期出现的雾霾天气更引起人们对室内空气质量的关注, 图书馆作为重要的公共场所存在多种污染源, 这些污染源可分为尘埃、有害生物、有害气体、电磁辐射和噪声, 研究室内环境改良策略和技术, 采用科学的通风、防尘、采光和装修策略控制污染源, 降低污染程度, 结合图书馆实际工作经验和环保领域新兴技术提出图书馆室内环境改良技术, 主要有除尘技术、空气净化技术、灭菌消毒技术、室内绿化技术。 相似文献