首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 234 毫秒
1.
文本分类中特征提取方法的比较与研究   总被引:1,自引:0,他引:1  
介绍了进行文本分类的关键技术,着重介绍了常用的文本特征提取方法.选取支持向量机方法作为文本分类器方法,选取不同特征提取方法应用于文本分类,通过实验,比较和分析了由不同的提取方法所构成的分类器的分类性能,确定了信息增益(IG)法和文本证据权(WET)为两种性能优异的特征提取方法.该结论可为分类性能进一步的优化研究奠定理论和实践基础.  相似文献   

2.
为解决电力审计领域中将审计发现问题按标准问题定义进行归类的现实需求,提出了一种两阶段短文本分类方法.该方法包括粗分类和细分类两个阶段.粗分类阶段通过对审计报告文本中的主观问题定性,对国网电力审计问题库文本中的审计问题的一级类目等粗粒度特征进行模糊匹配,实现审计发现问题预分类.细分类阶段通过对审计报告文本中的问题进行描述,对国网电力审计问题库文本中的审计问题的二、三级类目等细粒度属性进行文本特征抽取、特征向量化,并将粗分类阶段的结果用于文本特征和向量化的权值调整和相似性度量的对象范围选择,实现基于非结构化文本的审计问题分类.国网重庆市电力公司2016年审计发现问题汇总数据的实验结果表明,该方法能够有效提升审计问题分类性能,能为电力审计行业规范审计报告、提高审计效率提供有力支持.  相似文献   

3.
为解决文本分类中分类精度低的问题,提出一种混合优化的双模深度学习文本分类方法.该方法设计了一种混合优化算法,对深度学习模型进行权值调优,得到相关度高的特征和高性能文本分类结果.首先对文档进行预处理得到特征集合,设计了基于乌鸦搜索算法(CSA)和蝗虫优化算法(GOA)的混合优化算法,并使用双向门控循环单元(GRU)进行特征选择,得到具有上下文语义信息且相关的特征.最后,将最优特征输入到混合优化的深度置信网络(DBN)中得到文本分类结果.  相似文献   

4.
对基于向量空间模型的文本分类所涉及的关键技术:特征选取、特征向量表示方法、特征向量的维数、文本分类的评价标准进行了分析和研究.为了对比和验证文本分类在特征词选取方法,特征向量表示方法以及在不同维数下对分类的影响,选择了1 600篇中文农业网页进行正交实验,并对这些因素进行比较和分析,选出分类效果最好的组合.研究表明,当使用综合文档频(DFD)特征词选取方法选取特征词,用词频表示特征向量,特征向量维数为300维时,有较好的分类效果,平均查准率可以达到92.63%,平均召回率可以达到91.5%.  相似文献   

5.
[目的/意义]开展面向数字人文的古籍触发动词识别及分类研究,对于古籍文本的深层次挖掘和内容揭示具有重大的意义.本文利用深度学习分类算法,探索依据古籍触发词进行事件句文本多元分类的自动化方法.[方法/过程]在构建了典籍事件触发词分类体系和触发词典的基础上,选取4个不同类别的事件句文本作为实验数据,利用Onehot和Tok...  相似文献   

6.
面对海量、异构、动态的文本信息,对文本进行自动分类具有重要的意义。近年来,逐步发展起来的群集智能理论和方法为文本分类提供了一种新的智能化手段。笔者将群集智能中发展较为成熟的粒子群智能算法尝试性地引入到文本分类领域。构建了文本预处理模型,该模型是文本分类模型的基础。构建了基于PSO的文本分类模型Text PSO-Miner,并在文本集的向量空间矩阵上进行测试和比较。Text PSO-Miner的各项性能指标都优于经典的分类模型(SVM,KNN,NB)和基于ACO的文本分类模型。结果表明:Text PSO-Miner文本分类模型能够更好地应用于文本分类。  相似文献   

7.
CHI是文本分类中特征选择的重要方法.本文分析了CHI特征选择的特点,针对该方法的不足之处,提出了一种新的基于最低词频CHI的特征选择算法.该方法通过设置最低词频阈值去除了部分低频词,减少了CHI特征选择时低频词带来的干扰.同时本文对传统的TF-IDF特征权重计算方法进行了改进,在特征权重计算里加入改进后的CHI特征选择函数,使文本的表示更合理.通过在均衡语料和非均衡语料上的实验验证,新的方法有效提高了文本分类的效果.  相似文献   

8.
一种基于粗糙集理论的特征选择方法   总被引:3,自引:3,他引:0  
目的 特征集中特征质量的好坏能够影响到文本分类的精度,所以选择一种好的特征选择方法对于文本分类的效果起着重要的作用.方法 粗糙集理论为研究不精确数据的分析、推理,挖掘数据间的关系、发现潜在的知识提供了有效的工具.提出了一种基于粗糙集的特征选择方法.结果 通过实验结果表明该方法利用粗糙集的约简理论降低了特征维数,同时保证了分类性能.使用该方法进行特征选择时比目前常用的特征选择方法获得较好的分类效果.结论 粗糙集的属性约简理论可以用在规则提取和特征选择上,利用粗糙集的属性约简理论进行特征选择时能够获得较理想的分类效果.  相似文献   

9.
根据相关反馈技术的基本原理,研究了基于简单向量距离分类方法的文本分类反馈学习技术,给出了具体实现方法并进行了相应的实验验证.实验结果表明,反馈学习能明显提高分类能力.  相似文献   

10.
从数字图书馆应用文本分类的重要性入手, 介绍了文本分类的含义及基本技术, 重点分析了文本分类中常用的两种特征提取方法:互信息算法和 统计量算法, 指出两种算法存在的不足并提出相应的改进措施。  相似文献   

11.
It is not possible at present to demonstrate hominid occupation of southern Africa prior to the middle or late Pliocene, perhaps 3 million years ago. It may be the case that much, if not most, of the subcontinent was in fact uninhabited before that. The earliest hominid known to have lived in southern Africa is Australopithecus africanus. It was apparently replaced by Homo (?evolved into Homo) by 2 million years ago, at approximately the same time as A. robustus is first recorded locally. Homo and A. robustus then coexisted until perhaps 1 million years ago, after which Homo survived alone. There is no solid evidence that either of the southern African australopithecines made tools or accumulated bones. In fact, at the known sites, it now seems more likely that the bones, including those of the australopithecines themselves, were accumulated by carnivores. The known archeological record of southern Africa begins 2 million to 1.5 million years ago and the oldest stone tools may belong to the Oldowan Industry. Far better documentation exists for the succeeding Acheulean Industrial Complex, which was present in southern Africa almost certainly before 1 million years ago and persisted with modifications probably until sometime between 300,000 and 130,000 years ago. Although it is known that Acheulean peoples made handaxes, cleavers, and other stone tools, very little else is known about the activities of Acheuleans in southern Africa. Far more is known about their Middle and Later Stone Age successors. Southern African MSA peoples were perhaps among the earliest anywhere to take systematic advantage of aquatic resources for their subsistence, although they apparently did so far less effectively than did the LSA peoples who followed them. There are also contrasts between the ways in which MSA and LSA peoples dealt with terrestrial prey and between the contents of MSA and LSA artifact assemblages. The LSA peoples, for example, seem to have made much more extensive use of bone as a raw material, and they were the first to manufacture articles that are clearly interpretable as ornaments or art objects. From an evolutionary perspective, the LSA may represent a quantum advance over the MSA, perhaps correlated with the replacement of an archaic human physical type by the modem one. However, this must remain only a working hypothesis until much more is learned about the earliest LSA, dating to 35,000 to 40,000 years ago or more, and until there are adequate samples of well-provenienced MSA and early LSA physical remains. The later LSA, postdating 20,000 to 18,000 years ago, is reasonably well known. Later LSA peoples were probably at least partly responsible for the extinction of several large mammals in southern Africa about 10,000 years ago. By that date or shortly thereafter, at least some LSA peoples established basic hunting-gathering adaptations, which continued until the introduction and spread of agriculture and pastoralism, beginning roughly 2000 years ago. Thereafter, hunters and gatherers became progressively restricted in numbers and distribution, such that today only a very few exist, restricted to some of the most marginal environments of the subcontinent. It remains a major goal of southern African archeology to shed more light on the evolution and operation of hunting-gathering cultures during the vast time span when they covered all of southern Africa.  相似文献   

12.
【目的】氨气是畜禽养殖业中最常见、危害最大的有害气体之一。为了获得用于治理畜禽粪便氨气污染的微生物,从发酵3 d的鸡粪中分离筛选高效氨氮降解菌,研究其对鸡粪的除氨效果。【方法】以硫酸铵为唯一氮源,对鸡粪中具有氨氮降解能力的微生物进行连续10代的富集培养,将获得的富集培养液按10-1梯度稀释后进行分离纯化。分离得到的单菌落接种至富集培养基中,培养24h后,测定培养基中剩余的氨氮含量,比较各菌株之间的氨氮降解率,筛选出具有高效氨氮降解能力的菌株。通过形态观察、分子生物学以及生物化学的方法进行菌株鉴定。研究不同温度(20℃、25℃、30℃、35℃、40℃)和pH(3.0、4.0、5.0、6.0、7.0、8.0、9.0)对菌株生长的影响,探索不同碳源(淀粉、甘露醇、柠檬酸钠、葡萄糖、乙酸钠、碳酸氢钠)、C/N(5、10、20、40)以及初始氨氮浓度(100、300、600、1 200mg·L-1)对菌株氨氮降解性能的影响。最后将得到的目标菌株制成菌悬液,按10%的接种量接种到鸡粪中,同时以等量无菌生理盐水作为对照组,分别培养24 h、48 h、72 h和96 h,测定鸡粪的氨气散发量以及不同形态氮素的变化情况,评价目标菌株对鸡粪的除氨效果。【结果】通过富集培养,从鸡粪中共分离出15株能够降解氨氮的菌株,进一步筛选得到1株氨氮高效降解菌LSA,经鉴定为克柔假丝酵母(Candida krusei),与Candida krusei isolate EM12(JF274497.1)的相似性达到99%,GenBank中的登录号为KT025851。该菌株的对数生长期为6-12h,可在pH 3-7,20-40℃条件下生长,能够分别利用葡萄糖、乙酸钠、淀粉、柠檬酸钠、甘露醇作为碳源,不能利用无机碳,当培养基的C/N为20时氨氮去除效果最佳。随着培养基中初始氨氮浓度的升高,菌株LSA对氨氮的降解率呈现下降趋势;与之相反,氨氮降解速率则随着初始浓度的升高呈现升高趋势。当氨氮初始浓度为327.20mg·L-1时,60h内菌株LSA对氨氮的去除率达到71.88%,菌体含量为OD600 2.45;当氨氮初始浓度为1 105.26mg·L-1时,96h内菌株LSA对氨氮的去除率达到57.44%,菌体含量达到OD600 2.96。将其接种到鸡粪中可以显著降低鸡粪中氨氮的含量,最高可降低22.30%;减少粪中氨气的挥发量,最高可降低15.92%;增加粪便总氮含量;降低粪便氨氮占总氮的比重。【结论】克柔假丝酵母(Candida krusei)LSA菌株具有高效氨氮降解能力和较强的环境适应性,可有效减少鸡粪中的氨氮含量,降低氨气的挥发量。  相似文献   

13.
对大连城市森林群落植物功能性状及其与土壤环境因子的相关性随演替阶段的变化,包括不同群落演替中植物功能性状叶厚度、比叶面积、叶干物质含量、平均冠幅、平均胸径、平均盖度、平均树高、叶碳量的变化规律,以及植物功能性状与土壤环境(土壤养分、植物凋落物重量及分解与地下食物网)的关联进行研究。结果表明,自然群落黑松林、黑松-栎树混交林、栎树林演替过程中叶干物质含量呈上升趋势,叶厚度、比叶面积呈下降趋势;而半人工群落黑松林、黑松洋槐混交林、洋槐阔叶林演替过程叶干物质含量下降、叶厚度下降,比叶面积呈上升的趋势。黑松林、黑松-栎树混交林、栎树林平均胸径、平均冠幅、平均盖度呈上升趋势;而在黑松林、黑松洋槐混交林、洋槐阔叶林呈下降趋势。平均树高在黑松林、黑松-栎树混交林、栎树林呈下降趋势,在黑松林、黑松洋槐混交林、洋槐阔叶林呈上升趋势,其与土壤有机碳显著负相关。围绕植物功能性状与生态系统养分循环功能的关系,进一步讨论了其在群落演替过程中的变化规律,可为研究大连城市森林群落水平的植物功能性状对土壤环境的响应提供科学依据。  相似文献   

14.
分析了使用OSPF路由协议的企业级园区网络典型结构,进行了OSPF协议主要行为分析,对OSPF协议报文单元进行了研究.构建了一个模拟环境,测试了园区网内状态改变时路由器发送的LSA流量,并对流量作出了预测.  相似文献   

15.
筛选出对中药复方免疫增强剂多糖具有较好的吸附解吸效果的大孔树脂。通过静态吸附及解吸试验、动态吸附及解吸试验,利用苯酚 硫酸法跟踪检测多糖质量浓度,以吸附率与解吸率为评价指标,初步研究AB 8、LSA 5B、DM 18、CAD 40、LX 1、D941型大孔树脂对中药复方免疫增强剂中多糖的吸附及解吸性能。结果表明,在6种大孔树脂中, AB 8对中药复方免疫增强剂多糖的动态吸附率和解吸率最高,分别为54%和90%。说明AB 8型大孔树脂可以作为分离纯化多糖的材料。  相似文献   

16.
蛋鸡饲料中添加GRC50×10~(-6),300×10~(-6),600×10~(-6),连续喂4个月。600×10~(-6)组蛋品中残留GRC6×10~(-6),其它组无残留;伊沙公鸡饮水中添加GRC2.5g/L,连续饮用86d,休药3d测定。肌肉、肝、脾、肾、心GRC残留量分别为0.0369×10~(-6)。0.0449×10~(-6),0.031×10~(-6),0.0296×10~(-6),0.029×10~(-6),0.5 g/L,1g/L组无残留;明显肉鸡饲料中添加GRC600×10~(-6),连续喂36d,休药2d测定,肌肉、肝、脾、肾、心GRC残留量分别为0.0432×10~(-6),0.0478×10~(-6),0.0342×10~(-6),0.0524×10~(-6),0.0432×10~(-6),50×10~(-6),300×10~(-6)组无残留;肉猪饲料中添加GRC 600×10~(-6),连续喂115d,休药5d测定,肌肉、肝中GRC残留量分别0.0318×10~(-6),0.0056×10~(-6)。50×10~(-6),300×10~(-6)组无残留。  相似文献   

17.
用50μmol/L茉莉酸和100μmol/L水杨酸预处理葡萄幼苗后,在高温胁迫下,蛋白质含量、抗坏血酸氧化物酶、谷胱甘酞还原酶活性呈现先升后降的变化趋势,抗坏血酸含量持续下降,茉莉酸和水杨酸预处理过的葡萄幼苗中可溶性蛋白质含量、抗坏血酸氧化物酶、谷胱甘酞还原酶活性和抗坏血酸含量与谷胱甘酞含量都高于对照。由此认为茉莉酸和水杨酸能减缓高温胁迫所引起的胁变反应。推测JA和SA处理在诱导葡萄抗热性能上可能具有相似的机理。  相似文献   

18.
科技期刊图表文应一致的内容及编校要领   总被引:2,自引:1,他引:1  
结合编辑实践,总结出科技期刊图表文等应一致的内容,即同一篇论文中图表文内容一致,前后文结果一致,量名与单位符号一致,数字用法一致,专有名词和术语使用一致,比较对象条件一致,人称语气一致,引文与文献一致,中英文对照一致;同一本(卷)期刊中论文题名、作者姓名、页码与目次表一致,中英文目次表一致等。在此基础上进一步提出了树立整体意识,重视一致性内容校对,相应处同步核对,勤与文献和作者核实,加强学习和总结,不断提高校对水平等编辑要领。  相似文献   

19.
对只能获得部分标记的训练文本,将主动学习方法应用到文本信息抽取中,提出了一种基于主动学习隐马尔可夫模型的文本信息抽取方法.在该方法中,通过主动学习,仅将对隐马尔可夫模型的训练最有价值的训练文本挑选出来进行标记.实验表明,通过选择模型信任值的最佳门槛值,该方法在保证文本信息抽取性能的前提下,大大减少了用户标记训练文本的工作量.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号