Whisper+剪映制作精听材料

很好,很强大!这就是理想中应该有的,理念非常好,效果也不错。

就是他这里的很多环节是需要money支持的。而我实现的,是完全免费的方案。

此外,根据我的实践,whisper及所有语音识别,目前其准确度并非完美,特别是长视频(whisper胡言乱语还是挺常见的),以及科技类的视频(很多话语中间杂着很多代码之类、说话断断续续,有时即使程序已经完美识别语言,但若纯粹只看文本,很可能还是一头雾水完全不能理解,因为需要对照视频内容,才知道在说什么,难以按日常语言来理顺)。此时,如果我们的要求比较高,程序就得支持人工参与编辑修改,而对于人工+AI的交叉参与,程序要想完美实现让普通用户无障碍使用还是挺有难度的。我是取巧一点,毕竟自己写的程序,在其中设置一些类似匹配容忍度的参数,这样遇到简单的修订就可以调试适应新的情况。