首页 | 本学科首页   官方微博 | 高级检索  
     

中文农业科技文献自动标引技术与实践
作者姓名:王怀惠 王继华
作者单位:中国农科院科技文献信息中心!北京,100081,中国农科院科技文献信息中心!北京,100081,中国农科院科技文献信息中心!北京,100081,中国农科院科技文献信息中心!北京,100081,中国农科院科技文献信息中心!北京,100081
摘    要:
本文介绍了中文农业科技文献自动标引系统,它基于主题词、分类号、范畴代码和网罗词四位一体化词表,在文献标题句法分析的基础上,归纳出7个元标题模式,并应用其模式、主题词表、预匹配词表和停用词表进行预处理和分步匹配,综合采用了正向增字最长匹配算法、结合增字、跳字规则,前后缀扩充规则,模式匹配规则,末二字回溯算法以及自由词和特征词提取技术。系统分词准确率达到95%以上,具有词表维护自由词词频统计、显示浏览标引结果和标引测试等功能。具有主题词、分类号、范畴代码、网罗词以及自由词和特征词一体化自动标引功能。经过四个数据库数万篇文献的实际标引,标引速度达到4000篇/小时(题名)和3000篇/小时(题名加文摘,标引深度达到4.4(题名)和6.7(题名加文摘)个主题词和自由词,各项标引准确率达95%以上,标引环境为AST486/33微机。

关 键 词:自动标引  农业科技文献  中文  分词技术
本文献已被 CNKI 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号