voicechat2:一款高效快捷且低延迟的本地 AI 语音聊天系统

采用 SRT + LLM + TTS 技术架构。在 4090 设备上,运用 Faster Whisper 和 faster-distil-whisper-large-v2 技术,延迟能够降低至 300 毫秒。

其特点如下:
1. 本地化:所有相关处理均在本地予以完成。
2. 低延迟:在高性能硬件支持下,语音到语音的延迟可达 1 秒甚至更短。
3. 支持 Whisper、Llama 3、VITS 等,可依据需求选取不同模型。

GitHub 链接:
https://github.com/lhl/voicechat2
ChatTTS-Forge-WebUI 加强版ChatTTS
介绍
ChatTTS-Forge 是一个围绕 TTS 生成模型开发的项目,实现了 API 服务器和基于 Gradio 的 WebUI
Github:https://github.com/lenML/ChatTTS-Forge?tab=readme-ov-file
离线安装包
夸克:https://pan.quark.cn/s/b87a64e0f2eb
百度:https://pan.baidu.com/s/1Q1vQV5Gs0VhU5J76dZBK4Q?pwd=d7xu
特征
- ◦ ChatTTS 模型原生功能 Refiner/Generate
◦ 原生 Batch 合成,高效合成超长文本
◦ 样式控制
◦ SSML公司
- 编辑器: 简单的 SSML 编辑,配合其他功能使用
- Spliter:超长文本分割预处理
- Podcast: 支持创建编辑播客脚本
◦ 议长
- 内置音色:内置众多 speaker 可以使用
- speaker creator: 支持试音抽卡,创建 speaker
- embdding: 支持 speaker embdding 上传,可以复用保存下来的… GitHub - lenML/Speech-AI-Forge: 🍦 Speech-AI-Forge is a project developed around TTS generation model, implementing an API Server…
👉 名称:wora
🤖 类型:🤖软件
👏 介绍:开源无损音乐播放器应用。它支持管理播放列表、流式播放多种音乐格式(包括FLAC、WAV等),提供命令菜单快速播放,还能显示歌词并拥有优美的用户界面。
👉 名称:0v0.ai
🤖 类型:🕸网站
👏 介绍:图片背景移除网站:
👉 名称:askaitools.ai
🤖 类型:🕸网站
👏 介绍:专为人工智能产品量身定制的尖端搜索引擎项目,快速搜索查找 1w+ AI 产品:
👉 名称:grammar-club
🤖 类型:👀资料
👏 介绍:旋元佑老师的语法俱乐部书籍电子版,在线阅读地址
👉 名称:pixzip-lite
🤖 类型:🤖软件
👏 介绍:一款快速、免费的图片压缩软件,支持 JPG / PNG / WebP / AVIF 等主流格式,支持 Windows 10+,macOS 11+ 操作系统。
👉 名称:Chenyme-AAVT
🤖 类型:🤖软件
👏 介绍:一个全自动(音频)视频翻译项目。利用Whisper识别声音,AI大模型翻译字幕,最后合并字幕视频,生成翻译后的视频
👉 名称:enhanced-FaaS-in-China
🤖 类型:🎯项目
👏 介绍:提升部署在 cloudflare、vercel、netlify 的网页在中国的访问速度和稳定性。
👉 名称:TidGi-Desktop
🤖 类型:🎯项目
👏 介绍:「 太记 」是一个基于「 太微 TiddlyWiki 」的知识管理桌面应用,能保护隐私内容、高级自动化、自动Git云备份、部署为博客,且可通过RESTAPI与Anki等应用连接。个人笔记记录这块老胡还在坚挺着使用 Joplin,如果有特别推荐的可以评论推荐下。
👉 名称:sql-studio
🤖 类型:🎯项目
👏 介绍:SQL 数据库浏览器,支持 SQLite、libSQL、PostgreSQL、MySQL&DuckDB,可以理解成一个简洁轻量的数据库客户端,安装使用也很简单
curl --proto '=https' --tlsv1.2 -LsSf https://github.com/frectonz/sql-studio/releases/download/0.1.23/sql-studio-installer.sh | sh
# 以周刊数据库为例
sql-studio --address=0.0.0.0:3030 sqlite /Users/howie/Documents/workspace/weekly/weekly.db
这样通过 Web 即可查看数据库信息
- 数据库整体元数据信息概览
- 表格数据浏览
- 自定义查询(提示不全面,如果能接入 AI 感觉会更好)
👉 名称:jpghi
🤖 类型:🕸网站
👏 介绍:jpgHi 支持各种类型图片高清无损放大,为模糊不清的图片增加极致细节,提升图片质感:
👉 名称:removerized
🤖 类型:🕸网站
👏 介绍:开源免费的图片去背景工具网站,交互体验还不错
当然了,模型效果对一些图片比不上一些收费的。
👉 名称:reversing
🤖 类型:👀资料
👏 介绍:免费电子书,面向所有人的逆向工程:
👉 名称:smartedu-download
🤖 类型:🤖软件
👏 介绍:帮助您下载国家中小学智慧教育平台的文件,支持视频、教材(课本)、原版课件(ppt、word、pdf格式)下载:
👉 名称:revezone
🤖 类型:🤖软件
👏 介绍:一款以图形为中心、轻量级、本地优先的用于构建第二大脑的效率工具:
👉 名称:KillWxapkg
🤖 类型:🎯项目
👏 介绍:一个用于自动化反编译微信小程序的工具,小程序安全利器,自动解密,解包,可最大程度还原工程目录。
👉 名称:llamatutor
🤖 类型:🎯项目
👏 介绍:一个开源的 AI 个人专属导师,由 Llama 3 70B 和 Together.ai 提供支持:
Back to Top