多格式文档搜索引擎索引系统设计与实现 |
| |
作者姓名: | 方跃胜 董辉 姚宏亮 |
| |
作者单位: | [1]安徽水利水电职业技术学院电子系,安徽合肥231603 [2]亳州职业技术学院信息工程系,安徽亳州236800 [3]合肥工业大学计算机与信息学院,安徽合肥230009 |
| |
基金项目: | 国家自然科学基金资助项目(60705015). |
| |
摘 要: | 随着Internet和计算机的迅猛发展,搜索引擎应需而生,越来越多的企业利用计算机处理运营过程中产生的大量电子文档。如何从这些网络和多格式文档资源中迅速、方便而准确地检索出企业用户所需的信息已成为越来越重要的问题。索引系统是搜索引擎的核心,为提高系统的查全率和查准率,设计了一种适用于文档检索的数据库存储的索引结构并建立索引库来降低索引组织的复杂度,通过布尔逻辑和向量空间的组合模型实现对检索结果排序,以返回最优文档列表。该系统在Windows环境下采用PHP开发组件实现,能够提高检索文档的查全率和查准率。
|
关 键 词: | 文档搜索引擎 索引同步 检索模型 |
本文献已被 维普 等数据库收录! |
|