首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于Bloom Filter的去重方法研究
引用本文:赵艳红,李洪奇,朱丽萍,詹坤林.基于Bloom Filter的去重方法研究[J].湖南农业大学学报(自然科学版),2016(1):95-100.
作者姓名:赵艳红  李洪奇  朱丽萍  詹坤林
作者单位:(1.中国石油大学(北京) 石油数据挖掘北京市重点实验室,北京102249;2.腾讯科技(北京)网络媒体事业部,北京100080)
摘    要:在个性化新闻推荐系统中,文章去重是一个重要的模块,避免了同一篇文章被重复推荐的现象。在海量用户场景下,采用传统的基于队列的去重方法将会消耗大量的内存。Bloom Filter是一种空间效率很高的随机数据结构,适用于允许有一定误判率的场景。本文基于Bloom Filter,设计双Bloom Filter位数组结构和Bloom Filter位数组链结构。实验证明,基于Bloom Filter位数组链的去重方法,不仅大大降低了程序对服务器内存要求,而且具有较好的灵活性和扩展性。

关 键 词:信息超载  个性化推荐系统  Bloom  Filter

Research on Duplicated News Deletion Method Based on Bloom Filter
ZHAO Yan-hong,LI Hong-qi,ZHU Li-ping,ZHAN Kun-lin.Research on Duplicated News Deletion Method Based on Bloom Filter[J].Journal of Hunan Agricultural University,2016(1):95-100.
Authors:ZHAO Yan-hong  LI Hong-qi  ZHU Li-ping  ZHAN Kun-lin
Institution:(1.Petroleum Engineering and Data Mining Lab, College of Geophysics and Information Engineering, China University of Petroleum-Beijing, Beijing102249,China;2.Online Media Group, Tencent Technology-Beijing,Beijing100080,China)
Abstract:
Keywords:information overload  personalization recommendation system  Bloom Filter
点击此处可从《湖南农业大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《湖南农业大学学报(自然科学版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号