首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对当前我院医学文献查新系统依然是单机操作方式,本文详细介绍了如何使用MS SQL SERVER2000实现全文检索服务.并通过ASP调用ADO控件,提出并实现了一种基于Internet的全文检索系统的快捷方式。  相似文献   

2.
面对与日俱增的中文信息检索需求,Nutch作为一个开源的搜索引擎系统平台受到众多开发者的青睐.但由于Nutch是基于英文的系统,不具备中文分词能力,因此,研究中文分词方法在Nutch中的应用对实现中文搜索引擎具有非常现实的意义.在对中文分词技术进行研究的基础上,设计并实现了具有中文分词功能和新词识别功能的分词器,在Nutch中实现了中文分词功能.实验测试结果表明,算法的分词效果能够达到预期的中文分词的要求.  相似文献   

3.
为了提高Dspace系统的检索性能,本文对DSpace机构知识库系统中的检索工具包Lucene进行了详细分析和研究,对多种常用的中文分词方法通过对比实验,最终确定使用JE - analyzer(极易)方法作为DSpace检索工具包的中文分词方法.  相似文献   

4.
对双数组Trie树(Double—ArrayTrie)分词算法进行了优化:在采用Trie树构造双数组Trie树的过程中,优先处理分支节点多的结点,以减少冲突;构造一个空状态序列;将冲突的结点放入Hash表中,不需要重新分配结点.然后,利用这些方法构造了一个中文分词系统,并与其他几种分词方法进行对比,结果表明,优化后的双数组Trie树插入速度和空间利用率得到了很大提高,且分词查询效率也得到了提高.  相似文献   

5.
采用原中国科学技术情报研究所推出的“微机通用信息管理系统”(MicroISTIC/ISISV2.0).在IBM386微机上建成了中文文摘型森林防火文献数据库,收录中文森林防火文献1200余条,记录标引项目全面.提供有主题词、分类号、作者、年代及全文检索5种检索途径、且可交叉组配。数据库具有操作简便、可任意增删记录、检索功能强、可移置等特点、为系统查找中文森林防火文献提供了现代化的检索手段。  相似文献   

6.
随着社交软件的普及,社交软件中社会关系分析日益凸显。中文分词是社会关系分析的一种重要手段,但是现有中文分词方法的效果不好。提出基于隐马尔科夫模型(Hidden Markov Model,HMM)的中文分词优化算法。它们是将基于词典分词算法产生的结果作为附加信息,添加到HMM模型中,在不改动HMM模型的情况下,有效地增加了HMM模型的分词效果。实验结果表明,改进HMM算法能显著提高中文分词的准确率、召回率和F值。  相似文献   

7.
今天,计算机网络全文检索技术如日中天。当我们建立了自己的网站后,如果已实现网页的数据库管理,即动态网页技术,那么想实现“中文全文检索”功能就会提上议事日程。如果是大型网站,要求速度快是第一要素可以购买现成的全文检索引擎。但如果只是中小型网站,对速度要求不是太高,就没必要再花上几万元购买全文检索引擎。本人在建立“中国家养动物资源信息网站”时,通过使用SQLServer2000自带的字符判别函数,初步实现了ASP语言的中文全文检索功能。MSSQL2000数据库系统是微软推出的中型数据库系统,强大的数据存取性、安全性和可扩充性等是…  相似文献   

8.
张文慧  张冉 《安徽农业科学》2011,39(20):12586-12587
针对农业科技人员和其他农业信息用户面对海量异构农业信息文档缺乏高校检索方法的问题,提出基于中文分词的信息检索平台系统构架,以倒排文档方式来处理各种农业信息文档,采用TF/IDF相似度计算作为评分排序的标准,构建基于中文分词的信息检索系统应用于农业信息领域,取得较好效果。  相似文献   

9.
今天,计算机网络全文检索技术如日中天。当我们建立了自己的网站后,如果实现了网页的数据库管理,即动态网页技术,想实现“中文全文检索”功能就会提上议事日程。如果是大型网站,可以购买现成的全文检索引擎,速度快是第一要素。而如果只是中小型网站,速度不是要求太高,再花上几万元购买全文检索引擎又象是大马拉小车,浪费资源。本人在建立“中国家养动物资源信息网站”时,通过使用SQL Server 2000自带的字符判别函数,初步实现了ASP语言的中文全文检索功能。 MS SQL2000数据库系统是微软推出的中型数据库系统,强大的数据存取…  相似文献   

10.
目的为了对在线考试系统中主观题进行更合理的评分,提出一种基于中文分词的算法对主观题进行评分。方法对中文分词进行了详细介绍,并对已有的算法进行研究和改进,利用基于中文分词技术并结合文本相似度对主观题进行自动评分,从文本串长度相似度、文本串词形相似度和文本串词序相似度,再结合影响因子,形成最终的综合相似度。结果通过综合考虑考试科目的特征,合理的设置3个相对影响因子的值,对试卷通过4个实验进行测试,试卷题目分别为4个Office简答题,标准答案控制在100字内,每个实验回收电子试卷50份,与使用原算法的实验结果进行比对。实验测试表明,优化后的算法准确率有了很大提高。结论优化后的算法准确率有明显提高,在词形相似度较高的情况下评分效果与原算法差距不大,依然有改进的空间。  相似文献   

11.
在农业垂直搜索引擎研究过程中,中文分词是重要的研究方向。针对传统农业垂直搜索引擎搜索信息抽取不准确、速度慢等缺点,采用双数组Trie树为基本模型,利用中文词条首字区位码与数据库表行号相对应的方式,并根据农业垂直搜索引擎的需要设置了农业词汇的词性编码,以My SQL数据库为例设计了农业领域专用的分词词典。该分词词典可充分利用数据库的优势进行词典组织,并且可以进行词库的远程共享和共同维护,方便不同的系统进行访问;词条按首字分类存放构造双数组Trie树,可有效减少构造过程的内存空间。该农业分词词典结构对其他领域和行业也具有借鉴意义。  相似文献   

12.
系统主要研究智能搜索系统在动物医学领域中的应用。该系统包括3个模块,分别是数据采集模块、数据预处理模块、数据应用模块。在数据处理的不同阶段,采用不同的处理技术和算法,有向量空间模型算法、SDD改进算法、网页自动分类技术、中文分词技术、数据压缩和搜索技术。  相似文献   

13.
应用用户—系统交互实证图书馆学方法,对宁夏医科大学图书馆2008—2010年中文中图馆藏文献的分类类目百分比,2010年中文中图馆藏文献藏书比率、文献资源利用率、符合程度等指标进行统计分析,通过数据真实评价本馆馆藏质量,并阐述了用户—系统交互实证图书馆学方法对馆藏建设的指导意义。  相似文献   

14.
《遗传学报》1985—1994年引文分析   总被引:9,自引:3,他引:6  
本文采用文献计量学方法对《遗传学报》1985~1994年论著引用的文献集聚离散的规律进行了分析研究。其结果表明科技期刊占引用文献总量的81.41%.是《遗传学报》的主要文献源;中文文献占总引文的23.12%,外文文献占总引文的76.88%;中外文核心期刊共34种(外文25种,中文9种)。其中高效核心期刊20种,(外文15种,中文5种),可供图书采购人员订购期刊和专业科技人员阅读时参考。  相似文献   

15.
汉语自动分词和自动标引方法研究   总被引:1,自引:0,他引:1  
中文自动标引一直是学界研究的热点。本文主要研究了两个方面 :自动分词方法和自动标引方法。通过全面的比较研究 ,本文认为自动分词方法可以分为五个类型 ,自动标引的方法分为七种。  相似文献   

16.
本文通过对SQL Server 2000全文检索、全文检索语句CONTAINS和FREETE使用等方面的详细阐述,系统说明了SQL Server 2000全文检索的使用方法。  相似文献   

17.
中文医疗领域分词比较困难,导致现有算法对于医疗问题特征提取不充分,针对中文分词的特点,提出基于LCN(Lattice CNN,格子卷积神经网络)的医疗知识问答模型.首先,利用某三甲医院提供的15 000份电子住院记录,基于电子住院记录利用Glove模型训练医学词向量.其次,通过各大医疗网站获得大量医学名词及名词间的关系,构建医学知识图谱,并提取知识图谱中的关系词,结合已训练的词向量获取关系向量.最终,以医学词向量作为模型输入端并利用LCN神经网络提取医疗问题特征,计算问题特征与关系向量的相似度,进而训练医疗知识问答模型.实验表明, LCN模型准确率可达89.0%,与同类问答模型比较,提高了2%.  相似文献   

18.
本文总结了全文检索技术在网络中的应用情况 ,归纳出衡量全文检索系统的基本指标 ,分析了在全文检索技术应用中出现的问题 ,并提出了具体的解决方法 ,希望促进全文检索技术在应用方面更好的发展  相似文献   

19.
针对农业垂直搜索中中文分词要求的特殊性,提出-5基于词典和全切分的中文分词算法。该算法首先对经过预处理的网页进行基于词典的机械式切分,对未识别的字串再进行基于贝叶斯(Bayes)方法的全切分概率计算,通过计算字串的最大切分可信度确定最合理的切分,并更新词典。实验从120万张农业中文网页中随机抽取14组生成测试集,测试结果表明,该算法与正向最大匹配算法(FMM)和逆向最大匹配算法(RMM)相比具有更高的召回率,F1测度平均达到88%。  相似文献   

20.
本文用文献计量学方法,对《山东农业大学学报))1987~1992年发表的论文进行引文统计分析。结果表明:6年共发表论文343篇,有326篇附有引文;平均引文量10.49篇,综述性文献平均引文量331篇,无引率为4.96%;引文类型主要是期刊,占引文总量的71.61%;中文、英文文献分别占引文量的49.47%和47.72%;引用中文期刊245种,引用外文期刊432种,50%以上引文出自26种中文期刊和36种外文期刊;中文文献半衰期5.3年,外文为10.5年。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号