设为首页收藏本站
网站公告 | 这是第一条公告
     

 找回密码
 立即注册
缓存时间23 现在时间23 缓存数据 安全感不是来源于爱,而是偏爱。人只有确定自己是那个例外,才能安心。晚安,好梦。

安全感不是来源于爱,而是偏爱。人只有确定自己是那个例外,才能安心。晚安,好梦。

查看: 1128|回复: 5

详解如何在PHP中使用布隆过滤器

[复制链接]

  离线 

TA的专栏

  • 打卡等级:即来则安
  • 打卡总天数:29
  • 打卡月天数:1
  • 打卡总奖励:346
  • 最近打卡:2025-07-03 14:04:48
等级头衔

等級:晓枫资讯-上等兵

在线时间
0 小时

积分成就
威望
0
贡献
367
主题
331
精华
0
金钱
1425
积分
758
注册时间
2023-2-10
最后登录
2025-7-3

发表于 2023-7-20 11:38:37 | 显示全部楼层 |阅读模式

布隆过滤器(Bloom Filter)是一种用于快速判断一个元素是否属于某个集合的概率型数据结构。它基于哈希函数和位数组实现,可以高效地检索一个元素是否存在,但不提供元素具体的存储和获取功能。

2023629164918058.gif


布隆过滤器原理

上面的思路其实就是布隆过滤器的思想,只不过因为 hash 函数的限制,多个字符串很可能会 hash 成一个值。为了解决这个问题,布隆过滤器引入多个 hash 函数来降低误判率。

下图表示有三个 hash 函数,比如一个集合中有 x,y,z 三个元素,分别用三个 hash 函数映射到二进制序列的某些位上,假设我们判断 w 是否在集合中,同样用三个 hash 函数来映射,结果发现取得的结果不全为 1,则表示 w 不在集合里面。

2023629164918059.gif


布隆过滤器处理流程

布隆过滤器应用很广泛,比如垃圾邮件过滤,爬虫的 url 过滤,防止缓存击穿等等。下面就来说说布隆过滤器的一个完整流程,相信读者看到这里应该能明白布隆过滤器是怎样工作的。


第一步:开辟空间

开辟一个长度为 m 的位数组(或者称二进制向量),这个不同的语言有不同的实现方式,甚至你可以用文件来实现。

第二步:寻找 hash 函数

获取几个 hash 函数,前辈们已经发明了很多运行良好的 hash 函数,比如 BKDRHash,JSHash,RSHash 等等。这些 hash 函数我们直接获取就可以了。

第三步:写入数据

将所需要判断的内容经过这些 hash 函数计算,得到几个值,比如用 3 个 hash 函数,得到值分别是 1000,2000,3000。之后设置 m 位数组的第 1000,2000,3000 位的值位二进制 1。

第四步:判断

接下来就可以判断一个新的内容是不是在我们的集合中。判断的流程和写入的流程是一致的。

在PHP中如何使用

在PHP中,可以使用BloomFilter扩展库或自行实现布隆过滤器。下面我将介绍两种方法。

1. 使用BloomFilter扩展库

PHP中有一些第三方扩展库提供了布隆过滤器的功能。其中比较常用的是
  1. phpbloomd
复制代码
扩展,它提供了对布隆过滤器的支持。你可以按照该扩展库的文档进行安装和使用。
示例代码如下:
  1. // 创建一个布隆过滤器
  2. $filter = new BloomFilter();
  3. // 向过滤器添加元素
  4. $filter->add("element1");
  5. $filter->add("element2");
  6. $filter->add("element3");
  7. // 检查元素是否存在于过滤器中
  8. if ($filter->has("element1")) {
  9.     echo "Element 1 may exist.";
  10. } else {
  11.     echo "Element 1 does not exist.";
  12. }
复制代码

2. 自行实现布隆过滤器

如果你不想使用第三方扩展库,也可以自行实现布隆过滤器。下面是一个简单的自实现布隆过滤器的示例代码:
  1. class BloomFilter {
  2.     private $bitArray;
  3.     private $hashFunctions;
  4.     public function __construct($size, $numHashFunctions) {
  5.         $this->bitArray = array_fill(0, $size, false);
  6.         $this->hashFunctions = $numHashFunctions;
  7.     }
  8.     private function hash($value) {
  9.         $hashes = [];
  10.         $hash1 = crc32($value);
  11.         $hash2 = fnv1a32($value);
  12.         for ($i = 0; $i < $this->hashFunctions; $i++) {
  13.             $hashes[] = ($hash1 + $i * $hash2) % count($this->bitArray);
  14.         }
  15.         return $hashes;
  16.     }
  17.     public function add($value) {
  18.         $hashes = $this->hash($value);
  19.         foreach ($hashes as $hash) {
  20.             $this->bitArray[$hash] = true;
  21.         }
  22.     }
  23.     public function has($value) {
  24.         $hashes = $this->hash($value);
  25.         foreach ($hashes as $hash) {
  26.             if (!$this->bitArray[$hash]) {
  27.                 return false;
  28.             }
  29.         }
  30.         return true;
  31.     }
  32. }
  33. // 创建一个布隆过滤器
  34. $filter = new BloomFilter(100, 3);
  35. // 向过滤器添加元素
  36. $filter->add("element1");
  37. $filter->add("element2");
  38. $filter->add("element3");
  39. // 检查元素是否存在于过滤器中
  40. if ($filter->has("element1")) {
  41.     echo "Element 1 may exist.";
  42. } else {
  43.     echo "Element 1 does not exist.";
  44. }
复制代码
到此这篇关于详解如何在PHP中使用布隆过滤器的文章就介绍到这了,更多相关PHP布隆过滤器内容请搜索晓枫资讯以前的文章或继续浏览下面的相关文章希望大家以后多多支持晓枫资讯!

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
晓枫资讯-科技资讯社区-免责声明
免责声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。
      1、注册用户在本社区发表、转载的任何作品仅代表其个人观点,不代表本社区认同其观点。
      2、管理员及版主有权在不事先通知或不经作者准许的情况下删除其在本社区所发表的文章。
      3、本社区的文章部分内容可能来源于网络,仅供大家学习与参考,如有侵权,举报反馈:点击这里给我发消息进行删除处理。
      4、本社区一切资源不代表本站立场,并不代表本站赞同其观点和对其真实性负责。
      5、以上声明内容的最终解释权归《晓枫资讯-科技资讯社区》所有。
http://bbs.yzwlo.com 晓枫资讯--游戏IT新闻资讯~~~

  离线 

TA的专栏

等级头衔

等級:晓枫资讯-列兵

在线时间
0 小时

积分成就
威望
0
贡献
0
主题
0
精华
0
金钱
18
积分
16
注册时间
2022-12-28
最后登录
2022-12-28

发表于 2023-10-27 21:19:51 | 显示全部楼层
谢谢分享~~~~~
http://bbs.yzwlo.com 晓枫资讯--游戏IT新闻资讯~~~

  离线 

TA的专栏

等级头衔

等級:晓枫资讯-列兵

在线时间
0 小时

积分成就
威望
0
贡献
0
主题
0
精华
0
金钱
17
积分
14
注册时间
2022-12-27
最后登录
2022-12-27

发表于 2023-10-27 22:04:48 | 显示全部楼层
顶顶更健康!!!
http://bbs.yzwlo.com 晓枫资讯--游戏IT新闻资讯~~~

  离线 

TA的专栏

等级头衔

等級:晓枫资讯-列兵

在线时间
0 小时

积分成就
威望
0
贡献
0
主题
0
精华
0
金钱
16
积分
12
注册时间
2022-12-26
最后登录
2022-12-26

发表于 2023-10-27 22:07:46 | 显示全部楼层
感谢大大分享~~~~~~~~
http://bbs.yzwlo.com 晓枫资讯--游戏IT新闻资讯~~~

  离线 

TA的专栏

等级头衔

等級:晓枫资讯-列兵

在线时间
0 小时

积分成就
威望
0
贡献
0
主题
0
精华
0
金钱
12
积分
4
注册时间
2023-5-25
最后登录
2023-5-25

发表于 2023-10-27 22:08:53 | 显示全部楼层
感谢楼主,顶。
http://bbs.yzwlo.com 晓枫资讯--游戏IT新闻资讯~~~

  离线 

TA的专栏

等级头衔

等級:晓枫资讯-列兵

在线时间
0 小时

积分成就
威望
0
贡献
0
主题
0
精华
0
金钱
19
积分
18
注册时间
2022-12-29
最后登录
2022-12-29

发表于 2025-6-25 07:47:31 | 显示全部楼层
感谢楼主分享。
http://bbs.yzwlo.com 晓枫资讯--游戏IT新闻资讯~~~
严禁发布广告,淫秽、色情、赌博、暴力、凶杀、恐怖、间谍及其他违反国家法律法规的内容。!晓枫资讯-社区
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

1楼
2楼
3楼
4楼
5楼
6楼

手机版|晓枫资讯--科技资讯社区 本站已运行

CopyRight © 2022-2025 晓枫资讯--科技资讯社区 ( BBS.yzwlo.com ) . All Rights Reserved .

晓枫资讯--科技资讯社区

本站内容由用户自主分享和转载自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。

如有侵权、违反国家法律政策行为,请联系我们,我们会第一时间及时清除和处理! 举报反馈邮箱:点击这里给我发消息

Powered by Discuz! X3.5

快速回复 返回顶部 返回列表