12946 发表于 6 天前

视频字幕提取

大家提取字幕基本都是使用whisper模型吗,感觉提取出来的字幕不是很准确啊,不管是medium还是large-v2?

4334343dsd 发表于 6 天前

试试whisper-large-v3-japanese-4k-steps

可能还要其他模型处理一下。

ouve 发表于 6 天前

比金山和阿里强,别的还没试。

有空去小日子那边看看他们提取文字用什么模型
页: [1]
查看完整版本: 视频字幕提取