摘 要: | 本文介绍了中文农业科技文献自动标引系统,它基于主题词、分类号、范畴代码和网罗词四位一体化词表,在文献标题句法分析的基础上,归纳出7个元标题模式,并应用其模式、主题词表、预匹配词表和停用词表进行预处理和分步匹配,综合采用了正向增字最长匹配算法、结合增字、跳字规则,前后缀扩充规则,模式匹配规则,末二字回溯算法以及自由词和特征词提取技术。系统分词准确率达到95%以上,具有词表维护自由词词频统计、显示浏览标引结果和标引测试等功能。具有主题词、分类号、范畴代码、网罗词以及自由词和特征词一体化自动标引功能。经过四个数据库数万篇文献的实际标引,标引速度达到4000篇/小时(题名)和3000篇/小时(题名加文摘,标引深度达到4.4(题名)和6.7(题名加文摘)个主题词和自由词,各项标引准确率达95%以上,标引环境为AST486/33微机。
|