排序方式: 共有36条查询结果,搜索用时 752 毫秒
11.
12.
鲍凌云 《农业图书情报学刊》2014,26(7):33-35
从数字图书馆应用文本分类的重要性入手, 介绍了文本分类的含义及基本技术, 重点分析了文本分类中常用的两种特征提取方法:互信息算法和 统计量算法, 指出两种算法存在的不足并提出相应的改进措施。 相似文献
13.
新词识别是食品安全信息处理中的一个难点,新词是造成分词错误的重要原因.利用互信息提取新词特征并采用BP神经网络过滤垃圾词串以识别新词,以提高食品安全文本分词准确率.首先在互信息新词识别基础上,得到候选新词的多个统计量特征.然后对候选字串是否成词进行人工标记.最后将统计量特征和人工标记的新词作为训练样本,建立BP神经网络... 相似文献
14.
为了正确评价精噁唑禾草灵·氰氟草酯混配制剂的生态环境效应,采用水培实验的方法研究了精噁唑禾草灵和氰氟草酯对三叶浮萍(Lemma Paucicostata)的单一毒性和联合毒性效应。结果表明,精噁唑禾草灵和氰氟草酯对三叶浮萍96h的IC50分别为3.33mg/L和5.04mg/L,精噁唑禾草灵·氰氟草酯混合处理液对三叶浮萍96h的IC50为3.14mg/L,对联合毒性进行评价,显示出明显的协同效应。精噁唑禾草灵、氰氟草酯及其联合处理均不同程度地减少了浮萍体内的叶绿素a、叶绿素b的含量,影响作用呈良好的浓度(剂量)-效应关系。 相似文献
15.
讨论了基于互信息的特征选取算法在文本分类中的性能问题,分析了利用这种特征选取算法存在分类精度不高的原因,认为互信息为负值的特征在分类中具有很重要的作用.在此基础上提出了一种基于互信息特征选取的改进算法,该算法加强了互信息为负值的特征在分类中的作用.实验结果表明,改进后的算法可以有效地提高文本分类精度。 相似文献
16.
17.
基于传统分散矩阵的特征选择方法易选出具有一定区分性但相互冗余的特征,这些冗余的特征制约了高光谱影像分类正确率的提高,针对此问题,该文对传统方法进行了改进,首先计算每2个类别的基于分散矩阵的可分性值,然后将它们的平均值作为特征选择准则,最后利用序列浮点向前搜索算法选出特定数量的特征,用于后续分类。将所选特征的均方相关系数作为冗余性度量,定量化衡量了所提出方法克服选择冗余特征的能力。利用一景常用的AVIRIS高光谱植被影像,从分类正确率的角度,比较了所提出方法与几种典型的基于互信息和基于可分性准则的特征选择方法,在高光谱影像植被分类中的性能。试验结果表明改进的特征选择方法能较好的避免选择相互冗余的特征,与基于互信息的特征选择方法相比,基于分散矩阵可分性准则的特征选择方法在总体上能获得较高的分类正确率,特别是所提出的特征选择方法,在2个数据集上均获得了最高的总体分类精度87.2%和90.1%,从而阐明了所提出的方法在高光谱影像植被分类中的有效性。 相似文献
18.
完全自交是程度最强的近亲交配方式,对于研究近亲交配有重要价值.从处于哈迪-温伯格平衡的两对等位基因群体开始完全自交,完全的纯合体基因型频率逐代增加、完全的杂合体基因型频率逐代减少,而半纯合半杂合的基因型频率可能增加也可能减少.研究表明:从两位点整体来看,基因型联合申农熵逐代单调减少,配子间互信息逐代单调增加,近交关联信... 相似文献
19.
应用信息论方法研究了在表型同型交配下一对等位基因群体的基因型信息熵和互信息。在表型同型交配下,从随机交配下的平衡状态开始,群体的基因型信息熵逐代减少,但这种减少的趋势越来越慢,最终趋向于零。随着基因型信息熵的减少,群体的遗传多样性程度也越来越小。在表型同型交配下,群体的配子间互信息逐代增加,但这种减少的趋势越来越慢,最终趋向于零。配子间互信息的增加说明,配子间的信息交流程度逐代增加,两性配子间的信息关联程度越来越密切,而这用表型信息关联系数反映会更好。最后应用Matlab软件进行了数学模拟,直观验证了所得的结论。 相似文献
20.
近亲繁殖下一对等位基因群体的熵性质 总被引:9,自引:0,他引:9
研究了在近亲繁殖下一对等位基因群体的基因库信息熵和基因型信息熵 ,并讨论了在世代交替中基因型信息熵的性质、配子间的互信息性质及其与近交系数的关系 ,并定义了配子间的近交关联信息系数。结果表明 ,应用信息论模型研究群体遗传学与统计学方法具有一致性 ,而且还具有信息学含义。 相似文献