GitHub - OpenSource-O1/Open-O1:开源项目实现 O1 级别的 AI 模型
一个尝试复刻GPT-O1的开源项目
🧐 Open-O1 项目旨在通过开源方式提供强大的大语言模型,以匹敌 OpenAI 的 O1 模型,侧重于复杂推理和广泛任务的处理能力。
➡️ 链接:https://github.com/OpenSource-O1/Open-O1
✨重点
●🔍 高级推理与问题解决:Open-O1 模型基于 O1 风格的数据进行训练,展现出强大的逻辑推理和复杂问题解决能力,支持多种应用场景。
●💻 开源替代方案:该项目使用 Hugging Face 提供的 LLaMA 和 Qwen 模型,构建开源替代方案,降低企业和个人获取先进 AI 能力的成本。
●🛠 多模型与部署支持:提供 OpenO1-Qwen-7B 和 OpenO1-LLama-8B 等多个模型版本,并支持快速部署,用户可以根据需求选择合适的模型进行推理和开发。
●🌐 强大的社群支持:项目设有社区沟通渠道(如 Discord 和 Slack),并计划持续发布更新,包括奖励模型和数据、RLHF 支持等,进一步推动社区协作和开放 AI 技术的发展。
一个尝试复刻GPT-O1的开源项目
🧐 Open-O1 项目旨在通过开源方式提供强大的大语言模型,以匹敌 OpenAI 的 O1 模型,侧重于复杂推理和广泛任务的处理能力。
➡️ 链接:https://github.com/OpenSource-O1/Open-O1
✨重点
●🔍 高级推理与问题解决:Open-O1 模型基于 O1 风格的数据进行训练,展现出强大的逻辑推理和复杂问题解决能力,支持多种应用场景。
●💻 开源替代方案:该项目使用 Hugging Face 提供的 LLaMA 和 Qwen 模型,构建开源替代方案,降低企业和个人获取先进 AI 能力的成本。
●🛠 多模型与部署支持:提供 OpenO1-Qwen-7B 和 OpenO1-LLama-8B 等多个模型版本,并支持快速部署,用户可以根据需求选择合适的模型进行推理和开发。
●🌐 强大的社群支持:项目设有社区沟通渠道(如 Discord 和 Slack),并计划持续发布更新,包括奖励模型和数据、RLHF 支持等,进一步推动社区协作和开放 AI 技术的发展。
eSearch:一款集截屏、OCR、搜索、翻译、贴图、屏幕翻译、以图搜图、滚动截屏、录屏等多种功能于一身的工具
eSearch 支持在进行 OCR 操作后,可调用翻译功能,并且实现了跨平台支持,包括 Linux、indows 和 Mac。
官方网站:https://esearch-app.netlify.app/
仓库地址:https://github.com/xushengfeng/eSearch
下载地址:https://esearch-app.netlify.app/#download
eSearch 支持在进行 OCR 操作后,可调用翻译功能,并且实现了跨平台支持,包括 Linux、indows 和 Mac。
官方网站:https://esearch-app.netlify.app/
仓库地址:https://github.com/xushengfeng/eSearch
下载地址:https://esearch-app.netlify.app/#download
Whisper-WebUI——基于 Whisper 的浏览器界面工具
Whisper-WebUI 是一个基于 Gradio 的浏览器界面,可作为简易字幕生成器。它支持多种 Whisper 实现方式,能从不同来源生成字幕,具有语音转文本翻译、文本转文本翻译等功能,还可进行音频预处理和后处理。可以通过 Pinokio、Docker 或本地运行。
仓库地址:https://github.com/jhj0517/Whisper-WebUI
核心功能:
1. 多种 Whisper 实现选择:可在 openai/whisper、SYSTRAN/faster-whisper(默认)、Vaibhavs10/insanely-fast-whisper 中选择。
2. 多源字幕生成:从文件、Youtube、麦克风等生成字幕。
3. 支持多种字幕格式:SRT、WebVTT、txt。
4. 语音转文本翻译:从其他语言翻译为英语。
5. 文本转文本翻译:使用 Facebook NLLB 模型或 DeepL API 翻译字幕文件。
6. 音频预处理:使用 Silero VAD 预处理音频输入,使用 UVR 分离 BGM。
7. 音频后处理:使用 pyannote 模型进行说话人区分。
8. 可通过 Pinokio、Docker 或本地运行。
9. 根据需求调整 VRAM 使用。
10. 支持多种 Whisper 模型。
Whisper-WebUI 是一个基于 Gradio 的浏览器界面,可作为简易字幕生成器。它支持多种 Whisper 实现方式,能从不同来源生成字幕,具有语音转文本翻译、文本转文本翻译等功能,还可进行音频预处理和后处理。可以通过 Pinokio、Docker 或本地运行。
仓库地址:https://github.com/jhj0517/Whisper-WebUI
核心功能:
1. 多种 Whisper 实现选择:可在 openai/whisper、SYSTRAN/faster-whisper(默认)、Vaibhavs10/insanely-fast-whisper 中选择。
2. 多源字幕生成:从文件、Youtube、麦克风等生成字幕。
3. 支持多种字幕格式:SRT、WebVTT、txt。
4. 语音转文本翻译:从其他语言翻译为英语。
5. 文本转文本翻译:使用 Facebook NLLB 模型或 DeepL API 翻译字幕文件。
6. 音频预处理:使用 Silero VAD 预处理音频输入,使用 UVR 分离 BGM。
7. 音频后处理:使用 pyannote 模型进行说话人区分。
8. 可通过 Pinokio、Docker 或本地运行。
9. 根据需求调整 VRAM 使用。
10. 支持多种 Whisper 模型。
Morphify
标语:免费无限制文件转换器
介绍:释放你的创意,尽在Morphify——终极在线工具,让你轻松无限制地进行多媒体转换。轻松转换图片、音频和视频,不受任何限制。马上开始转换,让你的内容提升到一个全新的层次吧!
产品网站: https://morphify-kappa.vercel.app/
标语:免费无限制文件转换器
介绍:释放你的创意,尽在Morphify——终极在线工具,让你轻松无限制地进行多媒体转换。轻松转换图片、音频和视频,不受任何限制。马上开始转换,让你的内容提升到一个全新的层次吧!
产品网站: https://morphify-kappa.vercel.app/
Free AI Headshot Generator | Supawork AI
标语:100% 免费的AI专业头像生成器
介绍:使用Supawork免费的AI头像生成器,轻松创建专业照片。提供300多种风格,已生成超过2100万张头像,获得超过7000名客户的推荐。适用于简历、作品集、博客等多种场合。
产品网站: https://supawork.ai/zh/ai-professional-headshot-generator
标语:100% 免费的AI专业头像生成器
介绍:使用Supawork免费的AI头像生成器,轻松创建专业照片。提供300多种风格,已生成超过2100万张头像,获得超过7000名客户的推荐。适用于简历、作品集、博客等多种场合。
产品网站: https://supawork.ai/zh/ai-professional-headshot-generator
yutto,一个可爱且任性的 B 站下载器(CLI)
https://github.com/yutto-dev/yutto
https://github.com/yutto-dev/yutto
Chat100.ai
立即免费在线体验ChatGPT 4o和Claude 3.5 Sonnet
通过GPT4o和Claude 3.5 Sonnet免费体验实时、精准的AI对话。无需登录或任何费用,享受高级ChatGPT功能,体验最优ChatGPT替代方案。
https://chat100.ai/zh-CN
立即免费在线体验ChatGPT 4o和Claude 3.5 Sonnet
通过GPT4o和Claude 3.5 Sonnet免费体验实时、精准的AI对话。无需登录或任何费用,享受高级ChatGPT功能,体验最优ChatGPT替代方案。
https://chat100.ai/zh-CN
surya -- OCR 工具包
一个强大的文档 OCR 工具包,支持 90 多种语言,具有多种功能,包括文本检测、布局分析、读取顺序检测和表识别等
https://github.com/VikParuchuri/surya
一个强大的文档 OCR 工具包,支持 90 多种语言,具有多种功能,包括文本检测、布局分析、读取顺序检测和表识别等
https://github.com/VikParuchuri/surya
cloud-document-converter -- 飞书云文档转换为 Markdown
一个 Chrome 插件,可将 Lark 云文档转换为 Markdown。它支持下载 Lark Doc 为 Markdown 和复制 Lark 文档为 Markdown,但生成的图片 URL 只有两小时可访问性。该插件在块、内联等方面对多种格式有不同程度的支持,如标题、代码块、引用、列表、表格、图像等,同时也有一些不支持的格式
https://chrome.google.com/webstore/detail/ehkomhhcinhikfddnmklbloahaakploh
开源地址:https://github.com/lujunji4113/cloud-document-converter
一个 Chrome 插件,可将 Lark 云文档转换为 Markdown。它支持下载 Lark Doc 为 Markdown 和复制 Lark 文档为 Markdown,但生成的图片 URL 只有两小时可访问性。该插件在块、内联等方面对多种格式有不同程度的支持,如标题、代码块、引用、列表、表格、图像等,同时也有一些不支持的格式
https://chrome.google.com/webstore/detail/ehkomhhcinhikfddnmklbloahaakploh
开源地址:https://github.com/lujunji4113/cloud-document-converter
zeli
精选了Hacker News 和 HuggingFace 的Daily Paper,实时解析每个帖子的原文、重写标题、引用一句原文,并生成摘要,然后翻译成你的浏览器语言(是的,不仅支持中文),方便你快速挑选感兴趣的文章深入阅读
https://zeli.app/zh
精选了Hacker News 和 HuggingFace 的Daily Paper,实时解析每个帖子的原文、重写标题、引用一句原文,并生成摘要,然后翻译成你的浏览器语言(是的,不仅支持中文),方便你快速挑选感兴趣的文章深入阅读
https://zeli.app/zh
Silo - 纯前端多模型对话、文生图
一个主要基于 SiliconCloud API 的应用。它支持多个大模型同时对话和文生图,响应极快,具有众多特点,如提供浏览器插件和 Web 端访问方式、配置简单、支持余额自动刷新、可接入更多模型、支持调整模型顺序、有夜间模式和禅模式、多语言支持、手机端支持、纯前端实现以及可调整模型参数和优化输入体验等
https://silo.kwok.ink/
一个主要基于 SiliconCloud API 的应用。它支持多个大模型同时对话和文生图,响应极快,具有众多特点,如提供浏览器插件和 Web 端访问方式、配置简单、支持余额自动刷新、可接入更多模型、支持调整模型顺序、有夜间模式和禅模式、多语言支持、手机端支持、纯前端实现以及可调整模型参数和优化输入体验等
https://silo.kwok.ink/
lenML/ChatTTS-Forge
一款强大的对话式文本转语音模型。它有中英混读和多说话人的能力
https://huggingface.co/spaces/lenML/ChatTTS-Forge
一款强大的对话式文本转语音模型。它有中英混读和多说话人的能力
https://huggingface.co/spaces/lenML/ChatTTS-Forge