首页 | 本学科首页   官方微博 | 高级检索  
     检索      

Nutch中文分词的设计与实现
引用本文:张敏,杜华.Nutch中文分词的设计与实现[J].河北北方学院学报(自然科学版),2010,26(4):53-56,62.
作者姓名:张敏  杜华
作者单位:河北北方学院信息科学与工程学院,河北,张家口,075000
基金项目:河北省张家口市2009年科技攻关计划项目 
摘    要:面对与日俱增的中文信息检索需求,Nutch作为一个开源的搜索引擎系统平台受到众多开发者的青睐.但由于Nutch是基于英文的系统,不具备中文分词能力,因此,研究中文分词方法在Nutch中的应用对实现中文搜索引擎具有非常现实的意义.在对中文分词技术进行研究的基础上,设计并实现了具有中文分词功能和新词识别功能的分词器,在Nutch中实现了中文分词功能.实验测试结果表明,算法的分词效果能够达到预期的中文分词的要求.

关 键 词:搜索引擎  中文分词  分词器  Nutch

Design and Implementation of Chinese Word Segmentation in Nutch
ZHANG Min,DU Hua.Design and Implementation of Chinese Word Segmentation in Nutch[J].Journa of Hebei North University:Natural Science Edition,2010,26(4):53-56,62.
Authors:ZHANG Min  DU Hua
Abstract:
Keywords:Nutch
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号