NIUCLOUD是一款SaaS管理后台框架多应用插件+云编译。上千名开发者、服务商正在积极拥抱开发者生态。欢迎开发者们免费入驻。一起助力发展! 广告
## 问题 现在有50亿个电话号码,现有10W个电话号码,要快速准确判断这些电话号码是否存在? 1. 通过数据库查询:实现快速有点难; 2. 数据预放在集合中:50亿 * 8字节 ==40GB(内存浪费或不够); 3. hyperloglog:准确有点难; ## 相似的问题还有很多 1. 垃圾邮件过滤 2. 文字处理软件(例如Word)错误单词检测; 3. 网络爬虫重复URL检测; 4. Hbase行过滤;