把一部片子的字幕从"勉强能看"打磨成"行云流水"，最难的从来不是消灭那些时间轴错误——那些用自动引擎一把梭哈就行了。真正让人头痛的，是那些 CPS 或 CPL 超标的字幕段：台词本身没错，但字数就是塞太多了，读者看着累。

传统做法是人工逐条缩写。遇上一部 90 分钟的片子，且有几百条这样的问题，等你改完早就想辞职了。ZiZhun 的 AI 校对功能是专门为这种场景设计的——让大模型替你做那个"用更少的字表达同等意思"的苦差。

规则引擎做不到什么

先说清楚一件事，以免产生误解。

ZiZhun 的自动修复引擎非常擅长数学级别的纠错：负时长？自动对调首尾时间戳。闪轴（不足 800ms）？自动延长结束时间。字幕重叠？精准裁剪或平移，见时间轴重叠修复详解。

ZiZhun 的规则引擎遵循一个原则：绝不改动原文字幕内容。它只调整时间轴、删除空段和清除不可见字符。改文字是翻译/编辑的责任，不是 QC 引擎的责任。

但 R2 类问题（CPS 超标、CPL 超标、行数过多）本质上要求重写台词。比如：

原文：这段字幕包含了大量的冗余修饰词，已经远远超过了正常可读性的上限（CPS 22.4，超标）修复：需要删减约 40% 的文字，且不能改变语义

这种工作必须有语言理解能力的系统来做，规则引擎做不了，AI 可以。

BYOK 是什么，为什么这样设计

ZiZhun 的 AI 功能采用 BYOK（Bring Your Own Key，自带密钥） 架构。

你在 AI 设置面板里填入的 API Key，只会存储在你自己浏览器的 LocalStorage 里。每次调用 AI 时，密钥随请求一起发到 ZiZhun 的后端代理，后端仅做一次转发——不落库、不记录、不缓存。整个流程结束后，密钥原路返回，始终不离开你的控制。

这个选择不是省事，而是对隐私和合规的基本尊重。字幕文件里可能包含未公开的剧透、商业保密台词——用户不应该被迫把 API Key 托管在陌生服务器上。

配置步骤

点击结果页面右上角的 AI 设置（齿轮图标）。
从下拉列表中选择供应商。推荐从 Google Gemini 起步——免费额度高，对中文的理解也够用。
在输入框中粘贴你的 API Key。
选择具体模型（Gemini 推荐选 gemini-2.5-flash，速度和效果平衡最好）。
点击保存，配置立即生效。

首次使用前确认账号有可用额度。Gemini 的免费套餐对普通视频项目已经绰绰有余；如果你每天处理大批量内容，建议按量计费或切换到 DeepSeek 控制成本。

实际操作：AI 如何润色一条超标字幕

第一步：上传文件，找到 R2 告警

把字幕文件拖入上传区，ZiZhun 会立刻给出一份完整的 QC 报告。找到标记为 R2_CPS 或 R2_CPL 的条目——这些就是 AI 校对的适用对象。

第二步：触发 AI 润色

展开任意一条 R2 告警，你会在右侧看到一个 💡 请求 AI 调整 按钮。点击后，ZiZhun 会把这段字幕的原文、当前 CPS 数值以及目标阈值一起打包成 Prompt，发给你配置好的模型。

第三步：审核与采纳

几秒后，AI 的建议会出现在原文旁边。你可以逐字对比，确认语义没有跑偏之后，点击 采纳替换。系统会立刻触发重新校验，CPS 数据实时更新。

修复前 (Before)

42
00:05:12,100 --> 00:05:14,200
这段对话涵盖了整个剧情的核心矛盾，角色之间充满了难以言说的紧张感

CPS：28.6（超标，阈值 17）

修复后 (After)

42
00:05:12,100 --> 00:05:14,200
这场对话触及核心矛盾，张力隐而不发

CPS：13.2（合规）

语义保留，字数减少了将近一半，读起来反而更有力。

支持的 AI 供应商

| 供应商 | 推荐模型 | 特点 | |--------|---------|------| | Google Gemini（默认） | gemini-2.5-flash | 速度快，免费额度高，中英双语表现稳定 | | DeepSeek | deepseek-chat | 国内访问延迟低，性价比最高 | | OpenAI | gpt-4o-mini | 英文字幕润色能力一流 | | Anthropic | claude-sonnet-4-6 | 对复杂语义和语气把控精准 |

四个供应商使用相同的系统 Prompt，确保校对行为一致——只缩减文字，不替换术语，不改变人称或语气。

AI 校对的适用边界

AI 润色不是银弹，有几个场景要注意：

适合用：CPS/CPL 长期超标、大批量字幕需要快速瘦身、中文字幕里有明显废话堆砌的情况。

不适合用：涉及专有名词、人名地名密集的字幕（AI 容易悄悄"纠正"正确的专名）；艺术性极强的台词（AI 倾向于用通顺但平淡的语言替代）。建议遇到这两类情况时，先人工预审再决定是否采纳。

关于批量字幕质检的自动化工作流设计，可以进一步阅读那篇文章，了解如何把 AI 校对步骤嵌入你的整体质检流程。

总结

规则引擎负责精确、无损的数学级修复；AI 校对负责那些规则无能为力的语义重写。两者分工明确，互不越权。BYOK 架构保证了密钥和文本内容不会离开你的掌控范围。

如果你手里正有一批 CPS 超标的字幕等着处理，现在就可以试试——上传文件，配置好 API Key，让模型帮你干最机械的那部分活儿。

立即体验 AI 字幕润色 →