AI 主播幻觉了怎么办?三级审核如何拦截
KAVANA 工程团队 — 2026 年 6 月
AI 大模型会幻觉,这件事广为人知。但在广播播出场景里,幻觉的代价要比其他场景大得多——播出去的错误信息,听众接收到了,没有"撤回"这一说。
这篇文章聊的是一个具体问题:当 AI 主播生成了错误内容,三级审核机制是如何在它进入播出链路之前把它拦住的。
AI 主播的幻觉,在广播场景里是什么样的
不同于通用对话 AI,广播 AI 主播处理的内容类型是有限的:路况播报、天气播报、新闻播报、报时、频率台标等。这些内容有明确的结构模板,输入来自已知数据源(气象 API、路况接口、新闻稿库)。
在这个范围内,幻觉的形式通常不是"编造事件",而是:
- 数字错误:时间、温度、路段编号读错,例如"13:30"播成"03:30"。
- 地名混淆:类似地名混用,例如"解放路"和"解放大道"在不同城市指不同路段。
- 语气不符:AI 生成了书面语感过强的表达,不适合广播播报。
- 结构缺失:模板中必须包含的要素被省略,例如路况播报少了"限行时间"。
这类错误不像幻觉那么戏剧性,但对广播播出来说同样不可接受。
三级审核的设计逻辑
KAVANA 的三级内容审核不是简单的"三次人工复查",而是三个维度的系统性检验:
第一级:内容入库审核
这一级在内容进入媒资库时触发。涵盖:
- 音频格式合规检查(采样率、时长、格式)
- 关键词过滤(涉及政治敏感、广告法禁词等)
- 人工抽查(不逐条审,按规则采样)
通过的内容以 wav9 加密格式存入,后续流转中不可篡改。
第二级:AI 口播内容审核
这一级针对 AI 主播生成的具体播报内容。在内容生成后、进入播出单之前,系统自动触发:
- 结构完整性校验:对照模板检查必要字段是否齐全。
- 数字一致性校验:将生成文本中的数字与输入数据源做对比,偏差超过阈值则拦截。
- 人工确认队列:高风险内容(首次使用的地名、非标准表达)进入人工确认队列,编辑确认后方可通过。
第三级:节目单审核
这一级在节目单进入播出执行前触发。涵盖:
- 节目单时序合法性检查(有无冲突、有无空档)
- 必播内容是否到位(按监管要求,整点新闻、应急内容等必须在位)
- 最终人工确认(由值机主管签发)
三级形成完整链路,任何一级拦截都会阻止内容进入播出。
实践中的拦截效果
以路况播报为例:AI 生成一条路况内容,系统在第二级做数字一致性校验时,发现"限行至 12 月 30 日"和输入数据的"12 月 3 日"不一致,触发拦截,进入人工确认队列。编辑看到后修正,重新生成,通过后进入节目单。整个流程不需要人工逐字盯着 AI 输出,系统自动捞出高风险内容请人决策。
这套机制的关键不是"零幻觉"(那是 AI 能力层的问题),而是把幻觉发生之后到幻觉进入播出之前的时间窗口,用系统性检验填满。
对播出系统选型的启发
如果你在评估广播 AI 播出方案,审核机制是一个值得深究的维度。好的方案应该能回答这几个问题:
- AI 生成的内容,在哪个环节经过什么样的校验?
- 数字、地名、时间等高错误率字段,有没有专门的比对机制?
- 审核记录是否可追溯(谁审的、什么时间、改了什么)?
如果这些问题没有清晰答案,那么"AI 主播"可能只是合成音频,而不是真正能托付播出安全的系统。
本文所述审核机制以 KAVANA 系统实际部署版本为准,具体功能配置以服务合同约定为准。