假设有2000万或更多的字符串,并且有1000个关键字。现在需要检测所有字符串命中了哪些关键字,当然,最简单的做法就是一个字符串一个字符串的拿去跟所有的关键字做匹配,但这样效率会很慢,请问有没有什么好的方法可以提高匹配效率?
回复内容: 假设有2000万或更多的字符串,并且有1000个关键字。现在需要检测所有字符串命中了哪些关键字,当然,最简单的做法就是一个字符串一个字符串的拿去跟所有的关键字做匹配,但这样效率会很慢,请问有没有什么好的方法可以提高匹配效率?
http://blog.41ms.com/post/41.html
我现在就在用,你才1000个关键字,我有200w关键字,现在每秒支持500并发,应该能满足你
利用php扩展trie_filter做中文敏感词过滤
http://www.2cto.com/kf/201401/273359.html
ac_bnfa
https://segmentfault.com/q/1010000004159234/a-1020000004162767
看看这个应该会对你有帮助字符串匹配算法
用elasticsearch