首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
汉语自动分词和自动标引方法研究   总被引:1,自引:0,他引:1  
中文自动标引一直是学界研究的热点。本文主要研究了两个方面 :自动分词方法和自动标引方法。通过全面的比较研究 ,本文认为自动分词方法可以分为五个类型 ,自动标引的方法分为七种。  相似文献   

2.
在中文农业文献数据库建库之初,有必要考虑以恰当的地理叙词标引中文农业文献,这可以提高文献数据库的检索及利用效率。从中国的实际出发,除以省名标引农业文献外,还应根据文献的内容,考虑作适当的补充标引。由于中文的《农业主题词表》尚未正式发行,目前只能选用有检索意义的自然词来进行文献的标引,为了保证数据库的质量,保证其今后有较好的检索及利用效率,应该在建库的同时,对建库工作中存在的问题及时进行总结和讨论,以纠正工作中出现的偏差。本文仅就地理叙词的标引提出一些讨论。  相似文献   

3.
本文通过历年《中刊库》利用情况的文献报道,从文献源、标引技术等方面进行评述。  相似文献   

4.
标引是对文献进行主题分析,从自然语言转换成规范化检索语言的过程,即对主题分析结果赋予检索标识的过程。标引的实质是赋予文献检索标识,并用其作为存贮和查询的依据,即检索语言。二次文献通过标引获得的检索标识,必须根据检索要求合理编排,才能具备检索功能,使之成为检索工具。这种处理技术,称为索引技术。标引技术和索引技术与数据库的结构和检索途径的布局及建库条件有密切关系。中国农业文献综合数据库,简称综合库。它的标引标识共分8种,即主题词、功能符、分类号、范  相似文献   

5.
中文农业科技文献自动标引系统通过鉴定1996年1月30日由中国农业科学院科技局主持,在中国农科院科技文献信息中心对“中文农业科技文献自动标引系统”进行了鉴定。此课题是院长基金项目,编号为9311-11,从1993年起实施,1995年结束。鉴定委员会专...  相似文献   

6.
中文分词作为中文信息处理最重要的预处理手段被广泛应用.该文对医学领域文献全文检索的中文分词进行分析研究.提出了一种如何解决同义词,近义词的方法;并对传统正向最大匹配算法进行改进.更全面地实现了“长词优先”的系统功能。本方法应用于医学文献全文检索系统中.取得了很好的效果.具有一定的实用性。  相似文献   

7.
8.
农业与生态环境密切相关,有很大一部分农业文献是论述地貌区域与农业生产关系的,题内地名关键词出现的频率较高,而且地名层次高低不一,其中有一部分文献题名中出现地貌区域名称是广范围的,如:黄河上游地区、黄淮海平原、东南沿海地区、青藏高原等;也有一些是特指的行政区划名称,如:××省××县××村。所以,农业文献地理标引可分为地名标引和地貌标引两种。所谓地名标引是指省、自治区、市、地区、县、公社、乡、村等,地貌标引是指山区、盆地、草原、平原、高原、丘陵等(属非行政区划),地貌分布及划分主要是根据地表形态的高度、起伏度及形态上的完整性而定的,地貌区域与地名区划不同之处表现在地  相似文献   

9.
回溯了国内外农业科技需求的相关文献,对目前的研究方向进行了大致分类。指出目前国内相关研究主要遵循了制度层面和操作层面两种路径,并分析了各自存在的不足之处。在此基础之上提出了目前中国农业科技需求研究所需要突破的几个问题。  相似文献   

10.
张文慧  张冉 《安徽农业科学》2011,39(20):12586-12587
针对农业科技人员和其他农业信息用户面对海量异构农业信息文档缺乏高校检索方法的问题,提出基于中文分词的信息检索平台系统构架,以倒排文档方式来处理各种农业信息文档,采用TF/IDF相似度计算作为评分排序的标准,构建基于中文分词的信息检索系统应用于农业信息领域,取得较好效果。  相似文献   

11.
对河南省农业大专院校、有关科研院(所)的科质文献采集收藏情况进行了分析,揭示了文献收藏中存在的主要问题。  相似文献   

12.
一种基于统计的中文自动文摘方法   总被引:2,自引:1,他引:2  
为开发出实现容易,成本低,实用性强的计算机中文自动文摘系统,研究,设计了一个基于 中文自动文摘系统模型,提出了一种新的特征词加权函数和一种新的句子重要性加权函数,该系统能对任意领域,任意体裁,任意长度的文章以任意比例提取文摘。  相似文献   

13.
本文根据1958年“大跃进”、“十年动乱”和“八五”期间农业出版状况与农业科技发展水准,分析了农业文献出版的数量、质量与农业科技进步的密切关系。  相似文献   

14.
针对TF-IDF算法未考虑到文本关键词分布以及受不均衡数据集影响的问题,提出了一种多特征融合的术语频率-逆文档逆词频率(TF-IDIWF)自动标引算法,并与TF-IDF、TF-IWF、TextRank、LSI及LDA基线算法进行对比验证。利用python爬虫技术获取20万条农业文本语料以csv文件格式存储,用于训练农业词向量模型,随机抽取政策法规类、新闻资讯类、市场类、科技类文章各1 000篇并进行多人独立标注,标注词个数为5~13个,将标注结果整合归纳后生成AGRI2020农业文本均衡数据集。为验证TF-IDIWF算法能否降低不均衡数据集带来的影响,从AGRI2020中随机抽取新闻资讯类1 000篇,其余3个类别各100篇构建出农业文本不均衡数据集。首先利用TF-IDF融合词向量技术对分词后的词语进行过滤、筛选以及近义词归并,再引入词位置、词性及词跨度特征权重融合逆文档频率及逆词频率对农业文本进行关键词自动标引。结果表明,在不均衡数据集上的F1值为57.08%,相较于TF-IDF、TF-IWF算法分别提高了9.12%、1.24%;在均衡数据集上的平均F1值为60.80%,相较于TF-...  相似文献   

15.
国家农业科技创新体系中的文献信息服务——实践与思考   总被引:2,自引:0,他引:2  
分析了农业科技文献信息服务的现状,总结了中国农科院农业信息研究所为适应国家农业科技创新体系建设需要而开展的文献信息服务实践及相关思考。  相似文献   

16.
农业作为国民经济的基础,不仅仅是解决温饱问题,它对国民经济所产生的影响是全局性的。从1985年以来,农业特别是粮棉生产出现了停滞不前的状况,致使当前的农业生产面临着严峻的形势。究其原因,除部分地区遭受自然灾害的影响外,主要是减少了对农业的投入,缺乏农业发展的后劲。除减少了对农业基本建设的投资外,对农业科研、教学及在科研教学工作中必不可少的科技文献的投入也大大地削减了。科技文献在国民经济建设、科技发展和社会进步中发挥着重要作用。要想待续而稳定的发展农业,必须加强农业科技文献的建设。  相似文献   

17.
弓运泽  刘景会 《安徽农业科学》2011,39(28):17577-17579
通过《中国学术期刊网络出版总库》检索我国农业科技教学研究文献分布情况,对文献的年度分布、作者、产出单位及区域、主要期刊、研究资助基金以及研究内容进行统计分析。结果表明,最早的农业科技教学研究文献发表于1953年,20世纪90年代中期开始以年均增长20.1%的速度递增,2010年达到顶峰;山东农业大学的郭风法为发表文献最多的作者;文献分布区域以河南省最多;农林类高校以东北农业大学最多;发表该类文献最多的核心期刊是《黑龙江畜牧兽医》;资助力度总体还很薄弱;研究内容以教学改革和实践教学为主,说明当今中国各农林院校对教学改革和实践的注重程度很高。  相似文献   

18.
农业科技文献情报工作是农业科学研究工作的一个组成部分,“基本任务是为科学研究和科研管理提供文献情报保证”,促进科学研究出成果,出人才。要做好文献情推服务工作,首要任务就是卓有成效地开发文献情报资源,以更有效的为农业现代化建设,为科学研究和生产服务。根据多年来的工作实践。谈谈我们的意见。  相似文献   

19.
综述农业科技创新体系的理论基础、建设思路与原则、结构设计与功能定位、监督与激励机制的运行效率以及主导因素.  相似文献   

20.
农业科技信息与技术市场吴昆,王立柱(黑龙江省农科院牡丹江农科所15704)农业科技图书馆是农业科技智力资源存贮、传递与开发中心,是农业科技信息产业部门,面对社会主义市场经济大潮,如何围绕市场经济开展信息传递与开发,给科技图书馆提出了新任务。笔者认为农...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号