414. PotatoChat群组敏感词过滤

下面给出一个关于“PotatoChat 群组敏感词过滤”的全面方案，包含设计思路、关键点、实现示例（可直接落地）、扩展策略和运营注意事项，便于你在群聊系统中快速实现稳健的敏感词过滤功能。

一、目标与需求（快速确认）

实时过滤或标记群聊消息中的敏感词（政治/色情/辱骂/广告等）。
支持按群组/用户/角色的差异化策略（屏蔽/替换/告警/仅记录）。
支持快速更新敏感词库（热更新），低延迟、高吞吐。
抵抗常见混淆（空格/符号/字符替换/同音字/全角半角等）。
保留审计日志与申诉流程，避免过度误判。

二、总体架构（中间件模式）

在消息进入群组前加一层过滤中间件（可部署在后端的消息处理 pipeline 或网关）。
中间件职责：规范化 -> 检测 -> 决策（允许/替换/阻断/标记）-> 日志/通知。
敏感词库：集中存储（数据库/配置管理），并通过 Redis Pub/Sub 或消息总线下发到每台应用节点以热更新。
缓存：每个节点将敏感词加载到内存数据结构（Aho-Corasick 自动机/Trie），以获得线性时间匹配。

三、检测技术路线（按准确度与成本）

精准匹配（规则）：
- Trie / Aho-Corasick（多模式匹配），适合硬敏感词、广告黑词，速度快。
模糊/混淆处理：
- 归一化（去空格、去标点、大小写、全/半角、常见字符替换）。
- 同音/拼音/近形映射（对中文），对一些场景使用拼音匹配。
- 正则表达式（比如电话号码、二维码链接、邀请码）。
语义/上下文判定（减少误判）：
- 基于模型的分类器（BERT、CNN 等），判断整句是否含违法/违规内容，适用于语义性内容（仇恨、性暗示）。
人工+审核：
- 告警送审核后台，人工复核并更新词库。

四、策略（按群/用户/词不同处理）

词条属性：类型（色情/政治/广告/辱骂）、严重度、是否可替换、是否需人工复核、是否对 VIP 限制放宽。
决策动作：直接阻断（不发送并告知）、遮掩替换（）、客户端提示并允许修改、仅记录并告警管理员。
可配置按群策略，例如开放群允许广告但私密群不允许。

五、抵抗常见规避手段

规范化管线：统一大小写、全半角转换、去控制字符、删除或折叠连续标点、把数字/拉丁字母与类似汉字映射（例如“0->o”, “1->l”）。
L33t (1337) 替换表、同音替换、字符映射表。
可选：对中文做分词（jieba）并同时做字/词级匹配。
对图像内文本，配合 OCR（用于图片广告/敏感文本）。

六、实现要点与性能

使用 Aho-Corasick 自动机：多个词同时匹配，时间复杂度 O(n + total_matches)。
词库规模大时内存优化：把词分级、只把高优先级词加载到热点节点；将少用词放到后端慢路径或 DB。
并发与延迟：单条消息处理通常几十微秒到几毫秒；目标延迟 <50ms。
日志采样和指标：命中率、误判率、词库更新延迟、每分钟阻断数等。

七、示例代码（Python 版，含归一化与 Aho-Corasick 检测 + 三种处理动作）

依赖：pip install ahocorasick jieba（可选），示例使用 ahocorasick 包便于生产使用。

示例（核心逻辑，简洁示范）：

# 示例依赖: pip install ahocorasick jieba
import ahocorasick
import re
import unicodedata
import jieba

# 简单归一化函数
def normalize(text):
    # 全角转半角、NFKC 标准化、去控制字符、转小写
    text = unicodedata.normalize('NFKC', text)
    text = ''.join(ch for ch in text if unicodedata.category(ch)[0] != 'C')
    text = text.lower()
    # 去掉常见分隔符/空格（部分场景可保留空格）
    text = re.sub(r'[\s\-_\.，。,；;:!！\[\]\(\)（）]+', '', text)
    # 简单字符替换表（可扩展）
    subs = str.maketrans({'0':'o','1':'l','3':'e','@':'a','$':'s'})
    text = text.translate(subs)
    return text

class SensitiveFilter:
    def __init__(self, words=None):
        self.automaton = ahocorasick.Automaton()
        self.words = set()
        if words:
            for w in words:
                self.add_word(w)
        self.automaton.make_automaton()

    def add_word(self, word):
        w = normalize(word)
        if w in self.words:
            return
        self.words.add(w)
        self.automaton.add_word(w, (len(self.words)-1, word))  # store original

    def rebuild(self):
        # call after bulk updates
        self.automaton = ahocorasick.Automaton()
        for i,w in enumerate(self.words):
            self.automaton.add_word(w, (i, w))
        self.automaton.make_automaton()

    def find(self, text):
        norm = normalize(text)
        matches = []
        for end_index, (idx, orig) in self.automaton.iter(norm):
            start = end_index - len(orig) + 1
            matches.append((start, end_index, orig))
        return matches

    def mask(self, text, mask_char='*'):
        # 在原文位置做遮蔽：需要映射回原位置，简单起见这里返回基于归一化的遮蔽示例
        norm = normalize(text)
        arr = list(norm)
        for s,e,w in self.find(text):
            for i in range(s, e+1):
                arr[i] = mask_char
        return ''.join(arr)

# 示例用法
filter = SensitiveFilter(['敏感词','坏词','广告'])
msg = "这是一条含有 敏-感-词 的消息"
print("normalized:", normalize(msg))
print("matches:", filter.find(msg))
print("masked:", filter.mask(msg))

注意：上面 mask 函数为了示例简单化做了归一化后遮蔽；生产中需将匹配结果映射回原字符串的真实索引（可通过同时保留原->归一化索引映射来实现）。

八、部署与运维细节

热更新：使用 Redis Pub/Sub。词库变更时发布消息，节点监听并 rebuild automaton。
权限与白名单：维护 per-group 白名单词/放行用户（管理员、机器人）。
审计与回溯：保存被拦截消息（脱敏）、命中词、用户、时间、群 id，便于申诉和优化词库。
指标报警：敏感消息激增时自动报警，可能是 spam 攻击或词库失效。
测试：构造正负样本集合（包含混淆版本）做回归测试。

九、扩展（可选高级功能）

OCR 与图片识别：识别图片/截图中的文本后同样走文本过滤流程。
视频/语音：先做 ASR（语音转文本）再检测。
ML 模型：为上下文敏感的类目（仇恨言论、骚扰）训练二分类/多分类模型；模型作为第二道防线或用于降噪。
控制台：管理员可在线管理词库、查看命中统计、审核被拦截消息并一键放行或加入旁白/白名单。

十、常见问题与解决建议

误判多：把高误判词设置为“告警且人工复核”而非直接屏蔽；引入上下文分类器减少误杀。
覆盖不足：不断收集用户/审核反馈，扩充混淆规则、同音映射及正则。
性能问题：把核心自动机保存在内存，词库非常大时分级处理（热词/冷词），或使用 C/C++ 实现以减少 GC 开销。

十一、合规与隐私

日志保留需遵循法律法规（敏感数据匿名化），告知用户隐私政策。
对敏感用户交互做合规审计，尤其是涉及举报、封禁、执法请求时保留链路证明。

十二、总结（落地建议）

第一阶段（快速上线）：实现归一化 + Aho-Corasick，支持屏蔽/替换/记录三种动作，Redis 热更新。
第二阶段：加入混淆替换表、分词和部分正则，改进误判处理。
第三阶段：引入语义模型、OCR/ASR 流程、完善审核与运营平台。

如果你需要，我可以：

给出更完整的生产级 Python/Go/Node.js 实现（包含原文索引映射、热更新接口、Redis 集成）。
帮你设计数据库 schema、API 定义、管理后台页面草图或部署计划。
你想先看哪个部分？

414. PotatoChat群组敏感词过滤

更多文章

PotatoChat 怎么开启笔画输入

PotatoChat 兴趣小组怎么发布内容

PotatoChat 团队版怎么创建

PotatoChat 怎么移除群成员