Whisper-WebUI——基于 Whisper 的浏览器界面工具
Whisper-WebUI 是一个基于 Gradio 的浏览器界面,可作为简易字幕生成器。它支持多种 Whisper 实现方式,能从不同来源生成字幕,具有语音转文本翻译、文本转文本翻译等功能,还可进行音频预处理和后处理。可以通过 Pinokio、Docker 或本地运行。
仓库地址:https://github.com/jhj0517/Whisper-WebUI
核心功能:
1. 多种 Whisper 实现选择:可在 openai/whisper、SYSTRAN/faster-whisper(默认)、Vaibhavs10/insanely-fast-whisper 中选择。
2. 多源字幕生成:从文件、Youtube、麦克风等生成字幕。
3. 支持多种字幕格式:SRT、WebVTT、txt。
4. 语音转文本翻译:从其他语言翻译为英语。
5. 文本转文本翻译:使用 Facebook NLLB 模型或 DeepL API 翻译字幕文件。
6. 音频预处理:使用 Silero VAD 预处理音频输入,使用 UVR 分离 BGM。
7. 音频后处理:使用 pyannote 模型进行说话人区分。
8. 可通过 Pinokio、Docker 或本地运行。
9. 根据需求调整 VRAM 使用。
10. 支持多种 Whisper 模型。
Whisper-WebUI 是一个基于 Gradio 的浏览器界面,可作为简易字幕生成器。它支持多种 Whisper 实现方式,能从不同来源生成字幕,具有语音转文本翻译、文本转文本翻译等功能,还可进行音频预处理和后处理。可以通过 Pinokio、Docker 或本地运行。
仓库地址:https://github.com/jhj0517/Whisper-WebUI
核心功能:
1. 多种 Whisper 实现选择:可在 openai/whisper、SYSTRAN/faster-whisper(默认)、Vaibhavs10/insanely-fast-whisper 中选择。
2. 多源字幕生成:从文件、Youtube、麦克风等生成字幕。
3. 支持多种字幕格式:SRT、WebVTT、txt。
4. 语音转文本翻译:从其他语言翻译为英语。
5. 文本转文本翻译:使用 Facebook NLLB 模型或 DeepL API 翻译字幕文件。
6. 音频预处理:使用 Silero VAD 预处理音频输入,使用 UVR 分离 BGM。
7. 音频后处理:使用 pyannote 模型进行说话人区分。
8. 可通过 Pinokio、Docker 或本地运行。
9. 根据需求调整 VRAM 使用。
10. 支持多种 Whisper 模型。
Morphify
标语:免费无限制文件转换器
介绍:释放你的创意,尽在Morphify——终极在线工具,让你轻松无限制地进行多媒体转换。轻松转换图片、音频和视频,不受任何限制。马上开始转换,让你的内容提升到一个全新的层次吧!
产品网站: https://morphify-kappa.vercel.app/
标语:免费无限制文件转换器
介绍:释放你的创意,尽在Morphify——终极在线工具,让你轻松无限制地进行多媒体转换。轻松转换图片、音频和视频,不受任何限制。马上开始转换,让你的内容提升到一个全新的层次吧!
产品网站: https://morphify-kappa.vercel.app/
Free AI Headshot Generator | Supawork AI
标语:100% 免费的AI专业头像生成器
介绍:使用Supawork免费的AI头像生成器,轻松创建专业照片。提供300多种风格,已生成超过2100万张头像,获得超过7000名客户的推荐。适用于简历、作品集、博客等多种场合。
产品网站: https://supawork.ai/zh/ai-professional-headshot-generator
标语:100% 免费的AI专业头像生成器
介绍:使用Supawork免费的AI头像生成器,轻松创建专业照片。提供300多种风格,已生成超过2100万张头像,获得超过7000名客户的推荐。适用于简历、作品集、博客等多种场合。
产品网站: https://supawork.ai/zh/ai-professional-headshot-generator
yutto,一个可爱且任性的 B 站下载器(CLI)
https://github.com/yutto-dev/yutto
https://github.com/yutto-dev/yutto
Chat100.ai
立即免费在线体验ChatGPT 4o和Claude 3.5 Sonnet
通过GPT4o和Claude 3.5 Sonnet免费体验实时、精准的AI对话。无需登录或任何费用,享受高级ChatGPT功能,体验最优ChatGPT替代方案。
https://chat100.ai/zh-CN
立即免费在线体验ChatGPT 4o和Claude 3.5 Sonnet
通过GPT4o和Claude 3.5 Sonnet免费体验实时、精准的AI对话。无需登录或任何费用,享受高级ChatGPT功能,体验最优ChatGPT替代方案。
https://chat100.ai/zh-CN
surya -- OCR 工具包
一个强大的文档 OCR 工具包,支持 90 多种语言,具有多种功能,包括文本检测、布局分析、读取顺序检测和表识别等
https://github.com/VikParuchuri/surya
一个强大的文档 OCR 工具包,支持 90 多种语言,具有多种功能,包括文本检测、布局分析、读取顺序检测和表识别等
https://github.com/VikParuchuri/surya
cloud-document-converter -- 飞书云文档转换为 Markdown
一个 Chrome 插件,可将 Lark 云文档转换为 Markdown。它支持下载 Lark Doc 为 Markdown 和复制 Lark 文档为 Markdown,但生成的图片 URL 只有两小时可访问性。该插件在块、内联等方面对多种格式有不同程度的支持,如标题、代码块、引用、列表、表格、图像等,同时也有一些不支持的格式
https://chrome.google.com/webstore/detail/ehkomhhcinhikfddnmklbloahaakploh
开源地址:https://github.com/lujunji4113/cloud-document-converter
一个 Chrome 插件,可将 Lark 云文档转换为 Markdown。它支持下载 Lark Doc 为 Markdown 和复制 Lark 文档为 Markdown,但生成的图片 URL 只有两小时可访问性。该插件在块、内联等方面对多种格式有不同程度的支持,如标题、代码块、引用、列表、表格、图像等,同时也有一些不支持的格式
https://chrome.google.com/webstore/detail/ehkomhhcinhikfddnmklbloahaakploh
开源地址:https://github.com/lujunji4113/cloud-document-converter
zeli
精选了Hacker News 和 HuggingFace 的Daily Paper,实时解析每个帖子的原文、重写标题、引用一句原文,并生成摘要,然后翻译成你的浏览器语言(是的,不仅支持中文),方便你快速挑选感兴趣的文章深入阅读
https://zeli.app/zh
精选了Hacker News 和 HuggingFace 的Daily Paper,实时解析每个帖子的原文、重写标题、引用一句原文,并生成摘要,然后翻译成你的浏览器语言(是的,不仅支持中文),方便你快速挑选感兴趣的文章深入阅读
https://zeli.app/zh
Silo - 纯前端多模型对话、文生图
一个主要基于 SiliconCloud API 的应用。它支持多个大模型同时对话和文生图,响应极快,具有众多特点,如提供浏览器插件和 Web 端访问方式、配置简单、支持余额自动刷新、可接入更多模型、支持调整模型顺序、有夜间模式和禅模式、多语言支持、手机端支持、纯前端实现以及可调整模型参数和优化输入体验等
https://silo.kwok.ink/
一个主要基于 SiliconCloud API 的应用。它支持多个大模型同时对话和文生图,响应极快,具有众多特点,如提供浏览器插件和 Web 端访问方式、配置简单、支持余额自动刷新、可接入更多模型、支持调整模型顺序、有夜间模式和禅模式、多语言支持、手机端支持、纯前端实现以及可调整模型参数和优化输入体验等
https://silo.kwok.ink/
lenML/ChatTTS-Forge
一款强大的对话式文本转语音模型。它有中英混读和多说话人的能力
https://huggingface.co/spaces/lenML/ChatTTS-Forge
一款强大的对话式文本转语音模型。它有中英混读和多说话人的能力
https://huggingface.co/spaces/lenML/ChatTTS-Forge
BiLin -- AI 搜索
由沉浸式翻译团队开发的一款跨语言搜索引擎,可以选择同时搜索日语、法语、德语的资料,但是你输入的可以是中文,而结果可以展示为英文
https://bilin.ai/zh-CN
由沉浸式翻译团队开发的一款跨语言搜索引擎,可以选择同时搜索日语、法语、德语的资料,但是你输入的可以是中文,而结果可以展示为英文
https://bilin.ai/zh-CN