求aspx中过滤词的算法?
我想问的不是敏感词过滤的算法,而是以什么方式来进行敏感词过滤。我能想到的几种方式:
第一种,当用户通过前台页面添加信息(如发布评论,发布物品信息之类的),修改信息(如修改物品信息之类的)的时候,调用ajax,把所涉及到的信息传到到后台进行敏感词判断,如果是有敏感词,就禁止发表等等。 这种做法需要把前台所有涉及到增加和修改操作的地方都要加入敏感词判断代码,对每一个用户能输入信息的文本框都需要把里面的内容提取出来,传给后台,工作量有点大。
第二种,在后台执行涉及到add和update等业务逻辑的时候,对内容进行过滤。这样也涉及到很多代码,因为好多业务逻辑都可能会修改数据库,工作量也很大。
第三种,对数据库进行扫描,这种方式可能对性能消耗较大,而且扫描到有敏感内容时不好处理。另外实时性不强,可能会出问题。
这几种方式貌似都不太好,或者是我没想到这些方式下的好办法。另外我比较困惑的是如果发现敏感词,是直接禁止信息发布,还是说先让信息发布,然后把可疑信息存入其他数据库表,由后台工作人员进行专门的人工审核。感觉都很复杂。
我想知道目前主流的敏感词过滤解决方案是怎样的,谢谢。