Whisper+剪映制作精听材料

试了试audiobook最佳的方式可能还是让chatgpt来校正。试了试100行左右的字幕,非常完美,所有的拼写错误、大小写、标点全都替换成正确的文本了。
具体做法是

  1. 先用whisperx生成字幕;
  2. 切割字幕成50-100行,同时切割audiobook的文本,需要匹配上,但不用太严格,可以有一定余裕。
  3. 将切割后的文本逐个交给chatgpt处理,返回结果。
  4. 合并校正后的字幕。
    需要写个脚本来做这事

srt-sync虽然也还不错,但是偶尔还是会出错,主要是标点(特别是引号)会导致错乱,毕竟没有AI
由于Whisperx处理audiobook这种一直在说话的材料,其时间轴非常完美,所以用这种方式制作的audiobook的字幕可以说非常完美了。