Whisper-WebUI——基于 Whisper 的浏览器界面工具Whisper-WebUI 是一个基于 Gradio 的浏览器界面，可作为简易字幕生成器

Whisper-WebUI——基于 Whisper 的浏览器界面工具

Whisper-WebUI 是一个基于 Gradio 的浏览器界面，可作为简易字幕生成器。它支持多种 Whisper 实现方式，能从不同来源生成字幕，具有语音转文本翻译、文本转文本翻译等功能，还可进行音频预处理和后处理。可以通过 Pinokio、Docker 或本地运行。

仓库地址：https://github.com/jhj0517/Whisper-WebUI

核心功能：
1. 多种 Whisper 实现选择：可在 openai/whisper、SYSTRAN/faster-whisper（默认）、Vaibhavs10/insanely-fast-whisper 中选择。
2. 多源字幕生成：从文件、Youtube、麦克风等生成字幕。
3. 支持多种字幕格式：SRT、WebVTT、txt。
4. 语音转文本翻译：从其他语言翻译为英语。
5. 文本转文本翻译：使用 Facebook NLLB 模型或 DeepL API 翻译字幕文件。
6. 音频预处理：使用 Silero VAD 预处理音频输入，使用 UVR 分离 BGM。
7. 音频后处理：使用 pyannote 模型进行说话人区分。
8. 可通过 Pinokio、Docker 或本地运行。
9. 根据需求调整 VRAM 使用。
10. 支持多种 Whisper 模型。

GitHub

GitHub - jhj0517/Whisper-WebUI: A Web UI for easy subtitle using whisper model.

A Web UI for easy subtitle using whisper model. Contribute to jhj0517/Whisper-WebUI development by creating an account on GitHub.