摘 要: | 潜在语义分析Latent Semantic Analysis(LSA)是向量空间模型Vector Space Model(VSM)的推广。它解决了VSM中假设各词语之间相互独立的不足,有利解决了多义词和同义词等问题,同时它还通过降维,除噪,建立词频和文档矩阵。但由于其主要是从已知关键词和文档数出发,通过矩阵桥梁,进行相似度计算。其实质是一种主层次分析法的分类。鉴于此,我们可以改变而从查询关键词出发,通过不停搜索,建立一些列关键词集,然后对关键词除噪,通过svd降维分解,聚类和关联规则等方法有效解决了在不知文档数情况下,建立起相关文献的链式搜索。
|