Skip to content
This repository has been archived by the owner on May 7, 2020. It is now read-only.

感谢分享代码,checkWord里的$flag || $wordLength = 0;绝对是有问题的 #1

Open
fanybook opened this issue Nov 29, 2017 · 1 comment

Comments

@fanybook
Copy link

fanybook commented Nov 29, 2017

【问题】:
把 = 0 删掉,才能算基本正常。
否则连基本的严格匹配都做不到

【延展】:
我觉得
1.敏感词光有一个词典还是不够的,还要有排除的字典,比入屌和丝一起出现,就不用管
2.在tree匹配到单字还要看后面一个字是否能在字典里严格匹配,比如 "我是"这种竟然也会算为敏感
3.还有同音字,如果能转拼音,然后联想同音字更好

当然,越说越复杂,实现起来需要的精力也越多,随便说说,2333

@chenyRain
Copy link

【问题】:
把 = 0 删掉,才能算基本正常。
否则连基本的严格匹配都做不到

【延展】:
我觉得
1.敏感词光有一个词典还是不够的,还要有排除的字典,比入屌和丝一起出现,就不用管
2.在tree匹配到单字还要看后面一个字是否能在字典里严格匹配,比如 "我是"这种竟然也会算为敏感
3.还有同音字,如果能转拼音,然后联想同音字更好

当然,越说越复杂,实现起来需要的精力也越多,随便说说,2333

都2019年了,已经过了

Sign up for free to subscribe to this conversation on GitHub. Already have an account? Sign in.
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants