gkd
基于无障碍,高级选择器,订阅规则的自定义屏幕点击 Android 应用 |一个 Android 应用程序,具有基于辅助功能、高级选择器和订阅规则的自定义屏幕点击
https://github.com/gkd-kit/gkd
基于无障碍,高级选择器,订阅规则的自定义屏幕点击 Android 应用 |一个 Android 应用程序,具有基于辅助功能、高级选择器和订阅规则的自定义屏幕点击
https://github.com/gkd-kit/gkd
Upscayl
一款免费开源的 AI 图像放大软件。它使用高级 AI 算法放大和增强低分辨率图像且不损失质量,就像魔法一样。支持 Linux、macOS 和 Windows 系统
https://upscayl.org/
一款免费开源的 AI 图像放大软件。它使用高级 AI 算法放大和增强低分辨率图像且不损失质量,就像魔法一样。支持 Linux、macOS 和 Windows 系统
https://upscayl.org/
MDX Notes - 跨平台笔记软件,公众号排版编辑器
MDX Notes 是一个跨平台笔记软件,也是一个微信公众号排版编辑器,使用MDX,可自定义组件、样式、生成二维码、代码 diff 高亮,可导出 markdown 和 PDF
https://mdxnotes.com/
MDX Notes 是一个跨平台笔记软件,也是一个微信公众号排版编辑器,使用MDX,可自定义组件、样式、生成二维码、代码 diff 高亮,可导出 markdown 和 PDF
https://mdxnotes.com/
🆔 网站名称:PICKFREE
⭐️ 网站功能:设计资源导航
📁 网站简介:一个汇总各种免费资源的导航网站,提供丰富的免版权素材和在线工具。
涵盖了免版权图片、字体、音频、视频等设计素材的下载,还提供在线生成背景、纹理、图标等功能。
🔗 网站链接:https://www.pickfree.cn/
⭐️ 网站功能:设计资源导航
📁 网站简介:一个汇总各种免费资源的导航网站,提供丰富的免版权素材和在线工具。
涵盖了免版权图片、字体、音频、视频等设计素材的下载,还提供在线生成背景、纹理、图标等功能。
🔗 网站链接:https://www.pickfree.cn/
Meta Spirit LM——混合文本和语音的开源多模态语言模型
Meta Spirit LM 是 Meta AI 发布的开源多模态语言模型,能够在语音和文本之间无缝转换,有 Base 版本和 Expressive 版本。
仓库地址:https://github.com/facebookresearch/spiritlm
论文地址:https://arxiv.org/abs/2402.05755
DEMO 演示:https://speechbot.github.io/spiritlm/
核心功能:
1. 基本语音转换:Base 版本可以处理语音的基本转换,适合一般的语音识别和生成任务。
2. 情感捕捉与生成:Expressive 版本能够捕捉语音中的情感,生成带有这种情感的语音,使机器说话更加自然。
3. 自动语音识别(ASR):将语音输入转换为文本输出。
4. 文本转语音(TTS):将文本输入转换为语音输出。
5. 语音与文本的混合生成:根据输入的模式自由生成文本或语音,并能够在生成过程中切换模态。
6. 情感理解与表现力生成:SPIRIT-LM-EXPRESSIVE 版本不仅能够理解情感,还能够通过不同的音调和风格生成具有表现力的语音,如生成带有“愤怒”“悲伤”“兴奋”等情感色彩的内容。
Meta Spirit LM 是 Meta AI 发布的开源多模态语言模型,能够在语音和文本之间无缝转换,有 Base 版本和 Expressive 版本。
仓库地址:https://github.com/facebookresearch/spiritlm
论文地址:https://arxiv.org/abs/2402.05755
DEMO 演示:https://speechbot.github.io/spiritlm/
核心功能:
1. 基本语音转换:Base 版本可以处理语音的基本转换,适合一般的语音识别和生成任务。
2. 情感捕捉与生成:Expressive 版本能够捕捉语音中的情感,生成带有这种情感的语音,使机器说话更加自然。
3. 自动语音识别(ASR):将语音输入转换为文本输出。
4. 文本转语音(TTS):将文本输入转换为语音输出。
5. 语音与文本的混合生成:根据输入的模式自由生成文本或语音,并能够在生成过程中切换模态。
6. 情感理解与表现力生成:SPIRIT-LM-EXPRESSIVE 版本不仅能够理解情感,还能够通过不同的音调和风格生成具有表现力的语音,如生成带有“愤怒”“悲伤”“兴奋”等情感色彩的内容。
Batch Tool:免费在线 AI 图片处理神器,批量去水印/去背景/WebGPU加速/免费无限次数
🌟 工具名称:Batch Tool
🌐 使用环境:无需梯子🪜,无需登录
🔗 工具地址:https://images.batchtool.com/zh
🌈 官方推特:https://x.com/gucho2001827756
Batch Tool 是一款完全免费、浏览器本地运行、性能优秀的在线 AI 图片处理工具,支持 CPU 和 WebGPU 处理,提供批量去除背景和移除物体功能。
Batch Tool 的特点包括:
1.简单易用:免登录、操作简单,即开即用。
2.高性能:支持 WebGPU 加速,速度超快。
3.高效批处理:支持一键处理多个文件。
4.支持多语言:支持中文、英语、日语等 6 种语言。
5.隐私优先:使用本地 AI 模型,无需上传到服务器。
🌟 工具名称:Batch Tool
🌐 使用环境:无需梯子🪜,无需登录
🔗 工具地址:https://images.batchtool.com/zh
🌈 官方推特:https://x.com/gucho2001827756
Batch Tool 是一款完全免费、浏览器本地运行、性能优秀的在线 AI 图片处理工具,支持 CPU 和 WebGPU 处理,提供批量去除背景和移除物体功能。
Batch Tool 的特点包括:
1.简单易用:免登录、操作简单,即开即用。
2.高性能:支持 WebGPU 加速,速度超快。
3.高效批处理:支持一键处理多个文件。
4.支持多语言:支持中文、英语、日语等 6 种语言。
5.隐私优先:使用本地 AI 模型,无需上传到服务器。
GitHub - OpenSource-O1/Open-O1:开源项目实现 O1 级别的 AI 模型
一个尝试复刻GPT-O1的开源项目
🧐 Open-O1 项目旨在通过开源方式提供强大的大语言模型,以匹敌 OpenAI 的 O1 模型,侧重于复杂推理和广泛任务的处理能力。
➡️ 链接:https://github.com/OpenSource-O1/Open-O1
✨重点
●🔍 高级推理与问题解决:Open-O1 模型基于 O1 风格的数据进行训练,展现出强大的逻辑推理和复杂问题解决能力,支持多种应用场景。
●💻 开源替代方案:该项目使用 Hugging Face 提供的 LLaMA 和 Qwen 模型,构建开源替代方案,降低企业和个人获取先进 AI 能力的成本。
●🛠 多模型与部署支持:提供 OpenO1-Qwen-7B 和 OpenO1-LLama-8B 等多个模型版本,并支持快速部署,用户可以根据需求选择合适的模型进行推理和开发。
●🌐 强大的社群支持:项目设有社区沟通渠道(如 Discord 和 Slack),并计划持续发布更新,包括奖励模型和数据、RLHF 支持等,进一步推动社区协作和开放 AI 技术的发展。
一个尝试复刻GPT-O1的开源项目
🧐 Open-O1 项目旨在通过开源方式提供强大的大语言模型,以匹敌 OpenAI 的 O1 模型,侧重于复杂推理和广泛任务的处理能力。
➡️ 链接:https://github.com/OpenSource-O1/Open-O1
✨重点
●🔍 高级推理与问题解决:Open-O1 模型基于 O1 风格的数据进行训练,展现出强大的逻辑推理和复杂问题解决能力,支持多种应用场景。
●💻 开源替代方案:该项目使用 Hugging Face 提供的 LLaMA 和 Qwen 模型,构建开源替代方案,降低企业和个人获取先进 AI 能力的成本。
●🛠 多模型与部署支持:提供 OpenO1-Qwen-7B 和 OpenO1-LLama-8B 等多个模型版本,并支持快速部署,用户可以根据需求选择合适的模型进行推理和开发。
●🌐 强大的社群支持:项目设有社区沟通渠道(如 Discord 和 Slack),并计划持续发布更新,包括奖励模型和数据、RLHF 支持等,进一步推动社区协作和开放 AI 技术的发展。
eSearch:一款集截屏、OCR、搜索、翻译、贴图、屏幕翻译、以图搜图、滚动截屏、录屏等多种功能于一身的工具
eSearch 支持在进行 OCR 操作后,可调用翻译功能,并且实现了跨平台支持,包括 Linux、indows 和 Mac。
官方网站:https://esearch-app.netlify.app/
仓库地址:https://github.com/xushengfeng/eSearch
下载地址:https://esearch-app.netlify.app/#download
eSearch 支持在进行 OCR 操作后,可调用翻译功能,并且实现了跨平台支持,包括 Linux、indows 和 Mac。
官方网站:https://esearch-app.netlify.app/
仓库地址:https://github.com/xushengfeng/eSearch
下载地址:https://esearch-app.netlify.app/#download
Whisper-WebUI——基于 Whisper 的浏览器界面工具
Whisper-WebUI 是一个基于 Gradio 的浏览器界面,可作为简易字幕生成器。它支持多种 Whisper 实现方式,能从不同来源生成字幕,具有语音转文本翻译、文本转文本翻译等功能,还可进行音频预处理和后处理。可以通过 Pinokio、Docker 或本地运行。
仓库地址:https://github.com/jhj0517/Whisper-WebUI
核心功能:
1. 多种 Whisper 实现选择:可在 openai/whisper、SYSTRAN/faster-whisper(默认)、Vaibhavs10/insanely-fast-whisper 中选择。
2. 多源字幕生成:从文件、Youtube、麦克风等生成字幕。
3. 支持多种字幕格式:SRT、WebVTT、txt。
4. 语音转文本翻译:从其他语言翻译为英语。
5. 文本转文本翻译:使用 Facebook NLLB 模型或 DeepL API 翻译字幕文件。
6. 音频预处理:使用 Silero VAD 预处理音频输入,使用 UVR 分离 BGM。
7. 音频后处理:使用 pyannote 模型进行说话人区分。
8. 可通过 Pinokio、Docker 或本地运行。
9. 根据需求调整 VRAM 使用。
10. 支持多种 Whisper 模型。
Whisper-WebUI 是一个基于 Gradio 的浏览器界面,可作为简易字幕生成器。它支持多种 Whisper 实现方式,能从不同来源生成字幕,具有语音转文本翻译、文本转文本翻译等功能,还可进行音频预处理和后处理。可以通过 Pinokio、Docker 或本地运行。
仓库地址:https://github.com/jhj0517/Whisper-WebUI
核心功能:
1. 多种 Whisper 实现选择:可在 openai/whisper、SYSTRAN/faster-whisper(默认)、Vaibhavs10/insanely-fast-whisper 中选择。
2. 多源字幕生成:从文件、Youtube、麦克风等生成字幕。
3. 支持多种字幕格式:SRT、WebVTT、txt。
4. 语音转文本翻译:从其他语言翻译为英语。
5. 文本转文本翻译:使用 Facebook NLLB 模型或 DeepL API 翻译字幕文件。
6. 音频预处理:使用 Silero VAD 预处理音频输入,使用 UVR 分离 BGM。
7. 音频后处理:使用 pyannote 模型进行说话人区分。
8. 可通过 Pinokio、Docker 或本地运行。
9. 根据需求调整 VRAM 使用。
10. 支持多种 Whisper 模型。
Morphify
标语:免费无限制文件转换器
介绍:释放你的创意,尽在Morphify——终极在线工具,让你轻松无限制地进行多媒体转换。轻松转换图片、音频和视频,不受任何限制。马上开始转换,让你的内容提升到一个全新的层次吧!
产品网站: https://morphify-kappa.vercel.app/
标语:免费无限制文件转换器
介绍:释放你的创意,尽在Morphify——终极在线工具,让你轻松无限制地进行多媒体转换。轻松转换图片、音频和视频,不受任何限制。马上开始转换,让你的内容提升到一个全新的层次吧!
产品网站: https://morphify-kappa.vercel.app/
Free AI Headshot Generator | Supawork AI
标语:100% 免费的AI专业头像生成器
介绍:使用Supawork免费的AI头像生成器,轻松创建专业照片。提供300多种风格,已生成超过2100万张头像,获得超过7000名客户的推荐。适用于简历、作品集、博客等多种场合。
产品网站: https://supawork.ai/zh/ai-professional-headshot-generator
标语:100% 免费的AI专业头像生成器
介绍:使用Supawork免费的AI头像生成器,轻松创建专业照片。提供300多种风格,已生成超过2100万张头像,获得超过7000名客户的推荐。适用于简历、作品集、博客等多种场合。
产品网站: https://supawork.ai/zh/ai-professional-headshot-generator
yutto,一个可爱且任性的 B 站下载器(CLI)
https://github.com/yutto-dev/yutto
https://github.com/yutto-dev/yutto
Chat100.ai
立即免费在线体验ChatGPT 4o和Claude 3.5 Sonnet
通过GPT4o和Claude 3.5 Sonnet免费体验实时、精准的AI对话。无需登录或任何费用,享受高级ChatGPT功能,体验最优ChatGPT替代方案。
https://chat100.ai/zh-CN
立即免费在线体验ChatGPT 4o和Claude 3.5 Sonnet
通过GPT4o和Claude 3.5 Sonnet免费体验实时、精准的AI对话。无需登录或任何费用,享受高级ChatGPT功能,体验最优ChatGPT替代方案。
https://chat100.ai/zh-CN
surya -- OCR 工具包
一个强大的文档 OCR 工具包,支持 90 多种语言,具有多种功能,包括文本检测、布局分析、读取顺序检测和表识别等
https://github.com/VikParuchuri/surya
一个强大的文档 OCR 工具包,支持 90 多种语言,具有多种功能,包括文本检测、布局分析、读取顺序检测和表识别等
https://github.com/VikParuchuri/surya
cloud-document-converter -- 飞书云文档转换为 Markdown
一个 Chrome 插件,可将 Lark 云文档转换为 Markdown。它支持下载 Lark Doc 为 Markdown 和复制 Lark 文档为 Markdown,但生成的图片 URL 只有两小时可访问性。该插件在块、内联等方面对多种格式有不同程度的支持,如标题、代码块、引用、列表、表格、图像等,同时也有一些不支持的格式
https://chrome.google.com/webstore/detail/ehkomhhcinhikfddnmklbloahaakploh
开源地址:https://github.com/lujunji4113/cloud-document-converter
一个 Chrome 插件,可将 Lark 云文档转换为 Markdown。它支持下载 Lark Doc 为 Markdown 和复制 Lark 文档为 Markdown,但生成的图片 URL 只有两小时可访问性。该插件在块、内联等方面对多种格式有不同程度的支持,如标题、代码块、引用、列表、表格、图像等,同时也有一些不支持的格式
https://chrome.google.com/webstore/detail/ehkomhhcinhikfddnmklbloahaakploh
开源地址:https://github.com/lujunji4113/cloud-document-converter