Upscayl ​
一款免费开源的 AI 图像放大软件。它使用高级 AI 算法放大和增强低分辨率图像且不损失质量,就像魔法一样。支持 Linux、macOS 和 Windows 系统
https://upscayl.org/ Upscayl - AI Image Upscaler
mutable.ai
一个可以帮助你理解某个仓库是做什么或者仓库内文件的 AI ,对于程序员来说比较使用,可以学习 GitHub 项目
https://mutable.ai/
NotesHub
一个 Markdown 笔记软件,具有插入图表、曲谱、公式等多种功能,有 Web/桌面/手机客户端,支持 Git 仓库同步。
https://about.noteshub.app/ NotesHub - Take Notes, Sync and Collaborate
MDX Notes - 跨平台笔记软件,公众号排版编辑器
MDX Notes 是一个跨平台笔记软件,也是一个微信公众号排版编辑器,使用MDX,可自定义组件、样式、生成二维码、代码 diff 高亮,可导出 markdown 和 PDF
https://mdxnotes.com/
🆔 网站名称:PICKFREE

⭐️ 网站功能:设计资源导航

📁 网站简介:一个汇总各种免费资源的导航网站,提供丰富的免版权素材和在线工具。

涵盖了免版权图片、字体、音频、视频等设计素材的下载,还提供在线生成背景、纹理、图标等功能。

🔗 网站链接:https://www.pickfree.cn/
Meta Spirit LM——混合文本和语音的开源多模态语言模型

Meta Spirit LM 是 Meta AI 发布的开源多模态语言模型,能够在语音和文本之间无缝转换,有 Base 版本和 Expressive 版本。

仓库地址:https://github.com/facebookresearch/spiritlm
论文地址:https://arxiv.org/abs/2402.05755
DEMO 演示:https://speechbot.github.io/spiritlm/

核心功能:
1. 基本语音转换:Base 版本可以处理语音的基本转换,适合一般的语音识别和生成任务。
2. 情感捕捉与生成:Expressive 版本能够捕捉语音中的情感,生成带有这种情感的语音,使机器说话更加自然。
3. 自动语音识别(ASR):将语音输入转换为文本输出。
4. 文本转语音(TTS):将文本输入转换为语音输出。
5. 语音与文本的混合生成:根据输入的模式自由生成文本或语音,并能够在生成过程中切换模态。
6. 情感理解与表现力生成:SPIRIT-LM-EXPRESSIVE 版本不仅能够理解情感,还能够通过不同的音调和风格生成具有表现力的语音,如生成带有“愤怒”“悲伤”“兴奋”等情感色彩的内容。 GitHub - facebookresearch/spiritlm: Inference code for the paper
Batch Tool:免费在线 AI 图片处理神器,批量去水印/去背景/WebGPU加速/免费无限次数

🌟 工具名称:Batch Tool
🌐 使用环境:无需梯子🪜,无需登录
🔗 工具地址:https://images.batchtool.com/zh
🌈 官方推特:https://x.com/gucho2001827756

Batch Tool 是一款完全免费、浏览器本地运行、性能优秀的在线 AI 图片处理工具,支持 CPU 和 WebGPU 处理,提供批量去除背景和移除物体功能。

Batch Tool 的特点包括:
1.简单易用:免登录、操作简单,即开即用。
2.高性能:支持 WebGPU 加速,速度超快。
3.高效批处理:支持一键处理多个文件。
4.支持多语言:支持中文、英语、日语等 6 种语言。
5.隐私优先:使用本地 AI 模型,无需上传到服务器。 Batch Tools
GitHub - OpenSource-O1/Open-O1:开源项目实现 O1 级别的 AI 模型

一个尝试复刻GPT-O1的开源项目

🧐 Open-O1 项目旨在通过开源方式提供强大的大语言模型,以匹敌 OpenAI 的 O1 模型,侧重于复杂推理和广泛任务的处理能力。

➡️ 链接:https://github.com/OpenSource-O1/Open-O1

重点

🔍 高级推理与问题解决:Open-O1 模型基于 O1 风格的数据进行训练,展现出强大的逻辑推理和复杂问题解决能力,支持多种应用场景。

💻 开源替代方案:该项目使用 Hugging Face 提供的 LLaMA 和 Qwen 模型,构建开源替代方案,降低企业和个人获取先进 AI 能力的成本。

🛠 多模型与部署支持:提供 OpenO1-Qwen-7B 和 OpenO1-LLama-8B 等多个模型版本,并支持快速部署,用户可以根据需求选择合适的模型进行推理和开发。

🌐 强大的社群支持:项目设有社区沟通渠道(如 Discord 和 Slack),并计划持续发布更新,包括奖励模型和数据、RLHF 支持等,进一步推动社区协作和开放 AI 技术的发展。 GitHub - Open-Source-O1/Open-O1
eSearch:一款集截屏、OCR、搜索、翻译、贴图、屏幕翻译、以图搜图、滚动截屏、录屏等多种功能于一身的工具

eSearch 支持在进行 OCR 操作后,可调用翻译功能,并且实现了跨平台支持,包括 Linux、indows 和 Mac。

官方网站:https://esearch-app.netlify.app/
仓库地址:https://github.com/xushengfeng/eSearch
下载地址:https://esearch-app.netlify.app/#download
Whisper-WebUI——基于 Whisper 的浏览器界面工具

Whisper-WebUI 是一个基于 Gradio 的浏览器界面,可作为简易字幕生成器。它支持多种 Whisper 实现方式,能从不同来源生成字幕,具有语音转文本翻译、文本转文本翻译等功能,还可进行音频预处理和后处理。可以通过 Pinokio、Docker 或本地运行。

仓库地址:https://github.com/jhj0517/Whisper-WebUI

核心功能:
1. 多种 Whisper 实现选择:可在 openai/whisper、SYSTRAN/faster-whisper(默认)、Vaibhavs10/insanely-fast-whisper 中选择。
2. 多源字幕生成:从文件、Youtube、麦克风等生成字幕。
3. 支持多种字幕格式:SRT、WebVTT、txt。
4. 语音转文本翻译:从其他语言翻译为英语。
5. 文本转文本翻译:使用 Facebook NLLB 模型或 DeepL API 翻译字幕文件。
6. 音频预处理:使用 Silero VAD 预处理音频输入,使用 UVR 分离 BGM。
7. 音频后处理:使用 pyannote 模型进行说话人区分。
8. 可通过 Pinokio、Docker 或本地运行。
9. 根据需求调整 VRAM 使用。
10. 支持多种 Whisper 模型。 GitHub - jhj0517/Whisper-WebUI: A Web UI for easy subtitle using whisper model.
Morphify
标语:免费无限制文件转换器
介绍:释放你的创意,尽在Morphify——终极在线工具,让你轻松无限制地进行多媒体转换。轻松转换图片、音频和视频,不受任何限制。马上开始转换,让你的内容提升到一个全新的层次吧!
产品网站: https://morphify-kappa.vercel.app/
Free AI Headshot Generator | Supawork AI
标语:100% 免费的AI专业头像生成器
介绍:使用Supawork免费的AI头像生成器,轻松创建专业照片。提供300多种风格,已生成超过2100万张头像,获得超过7000名客户的推荐。适用于简历、作品集、博客等多种场合。
产品网站: https://supawork.ai/zh/ai-professional-headshot-generator
cloud-document-converter -- 飞书云文档转换为 Markdown ​
一个 Chrome 插件,可将 Lark 云文档转换为 Markdown。它支持下载 Lark Doc 为 Markdown 和复制 Lark 文档为 Markdown,但生成的图片 URL 只有两小时可访问性。该插件在块、内联等方面对多种格式有不同程度的支持,如标题、代码块、引用、列表、表格、图像等,同时也有一些不支持的格式
https://chrome.google.com/webstore/detail/ehkomhhcinhikfddnmklbloahaakploh
开源地址:https://github.com/lujunji4113/cloud-document-converter
Back to Top