Whisper-WebUI——基于 Whisper 的浏览器界面工具

Whisper-WebUI 是一个基于 Gradio 的浏览器界面,可作为简易字幕生成器。它支持多种 Whisper 实现方式,能从不同来源生成字幕,具有语音转文本翻译、文本转文本翻译等功能,还可进行音频预处理和后处理。可以通过 Pinokio、Docker 或本地运行。

仓库地址:https://github.com/jhj0517/Whisper-WebUI

核心功能:
1. 多种 Whisper 实现选择:可在 openai/whisper、SYSTRAN/faster-whisper(默认)、Vaibhavs10/insanely-fast-whisper 中选择。
2. 多源字幕生成:从文件、Youtube、麦克风等生成字幕。
3. 支持多种字幕格式:SRT、WebVTT、txt。
4. 语音转文本翻译:从其他语言翻译为英语。
5. 文本转文本翻译:使用 Facebook NLLB 模型或 DeepL API 翻译字幕文件。
6. 音频预处理:使用 Silero VAD 预处理音频输入,使用 UVR 分离 BGM。
7. 音频后处理:使用 pyannote 模型进行说话人区分。
8. 可通过 Pinokio、Docker 或本地运行。
9. 根据需求调整 VRAM 使用。
10. 支持多种 Whisper 模型。 GitHub - jhj0517/Whisper-WebUI: A Web UI for easy subtitle using whisper model.
 
 
Back to Top