无论你是视频创作者还是字幕组译者，一定遇到过这种让人抓狂的场景：辛辛苦苦完成的 SRT 中文字幕，拖进 Adobe Premiere 或是放在电视机上播放时，全部变成了形如 Ð¡Ã÷»Ø¼Ò 的外星文。

其实，99% 的字幕乱码案件，罪魁祸首只有一个：字符编码不兼容。

什么是字幕乱码？为什么会发生？

在计算机底层，所有文字都被存储为 0 和 1 组成的二进制数字。所谓**“编码集（Charset）”**，就是一本记录着“哪个二进制数字对应哪个汉字或字母”的密码本。

问题在于，不同国家、不同历史时期的操作系统使用的密码本并不一样：

GBK / GB2312：这是源自中国大陆的中文编码标准。早些年 Windows 系统（如 Win7、WinXP）默认使用 ANSI / GBK 编码来保持中文字符。
UTF-8（无 BOM）：这是目前国际互联网的绝对霸主。它包罗万象，支持全球所有语言的混合排版，不论是英文、简体中文、生僻汉字甚至是 Emoji 都能完美兼容。

乱码是如何发生的？ 如果你的字幕文件是以 GBK 保存的，但视频剪辑软件（如 Premiere）默认按照国际标准 UTF-8 去解码读取，这就相当于拿英文密码本去强行解码中文电报，读出来的必然是一堆火星文。

隐蔽的刺客：BOM 头 (Byte Order Mark)

有时我们会遇到一个更诡异的现象：明明查了文件编码已经是 UTF-8 了，但第一条字幕依旧出现乱码，或者系统提示“无效的时间格式”。

这通常是因为文件中暗藏了 BOM (Byte Order Mark)。 BOM 是位于文件最开头不可见的几个字节（通常是 EF BB BF），有些被国内古板软件（如早期的 Windows 记事本）打包保存时强行塞入。对于很多要求严格的流媒体规范（比如 WebVTT）或跨平台播放器，这几个隐身的字符会导致解析器崩溃。

行业规范：标准的数字资产交付要求所有纯文本字幕（包含 SRT、VTT）必须为 纯净的 UTF-8 (无 BOM) 格式。

如何手动转换并修复乱码？

如果你只有偶尔一个文件需要修复，可以利用手边的各种文本编辑器来完成。

方法一：使用 VS Code

将乱码的 .srt 拖入 VS Code。
观察右下角的编码显示（可能是 UTF-8），点击它，选择 Reopen with Encoding (通过编码重新打开)。
在弹出的列表中选择 GBK 或 GB18030，此时文字应该恢复正常。
再次点击右下角已变成 GBK 的文字，选择 Save with Encoding (通过编码保存)。
选择 UTF-8 即可彻底洗白。

方法二：使用 Windows 记事本（Win10/11）

用记事本打开文件（如果已经是乱码，需要先想办法看到正常文字）。
点击左上角 文件 -> 另存为。
在最下方的 编码方式 下拉框中，选择 UTF-8（注意，千万不要选 带有 BOM 的 UTF-8）。
保存覆盖原文件。

终极方案：使用引擎自动清洗编码

在面对大批量的视频素材，或者是由几十个不同外包翻译交上来的格式不一的文件时，手工排查编码会极其耗时。

在 ZiZhun 引擎中，我们内置了高灵敏度的编码嗅探机制（Encoding Analyzer）：无论客户端上传的是含有恶性 BOM 的古老文件，还是被截断的 GBK 亦或乱糟糟的 Big5 繁体编码，当它通过内存解析通道的那一刻，底层算法就会自动将其剥离并重构。只要经过了 ZiZhun 引擎检测导出的字幕文件，系统将强制统一将其下发落盘为最纯净的工业级标准——UTF-8 (无 BOM) 格式。

一次拖拽，永远告别编码噩梦。

前往控制台验证文件编码 →