每日精粹

17:41 · 2024年10月20日 · 周日

gkd
基于无障碍，高级选择器，订阅规则的自定义屏幕点击 Android 应用 |一个 Android 应用程序，具有基于辅助功能、高级选择器和订阅规则的自定义屏幕点击
https://github.com/gkd-kit/gkd

GitHub - gkd-kit/gkd: 基于无障碍，高级选择器，订阅规则的自定义屏幕点击安卓应用 | An Android APP with custom screen tapping based on Accessibility, Advanced…

基于无障碍，高级选择器，订阅规则的自定义屏幕点击安卓应用 | An Android APP with custom screen tapping based on Accessibility, Advanced Selectors, and Subscription Rules - gkd-kit/gkd

17:40 · 2024年10月20日 · 周日

Upscayl
一款免费开源的 AI 图像放大软件。它使用高级 AI 算法放大和增强低分辨率图像且不损失质量，就像魔法一样。支持 Linux、macOS 和 Windows 系统
https://upscayl.org/

Upscayl

Upscayl - AI Image Upscaler

The #1 Free and Open Source AI Image Upscaler for Linux, MacOS and Windows. Upscayl uses the power of AI to upscale your images with the best quality possible.

17:39 · 2024年10月20日 · 周日

LiteLLM
将 LLM 的格式都转换为 OpenAI 的接口规范
https://github.com/BerriAI/litellm

GitHub

GitHub - BerriAI/litellm: Python SDK, Proxy Server (AI Gateway) to call 100+ LLM APIs in OpenAI (or native) format, with cost tracking…

Python SDK, Proxy Server (AI Gateway) to call 100+ LLM APIs in OpenAI (or native) format, with cost tracking, guardrails, loadbalancing and logging. [Bedrock, Azure, OpenAI, VertexAI, Cohere, Anthr...

17:38 · 2024年10月20日 · 周日

mutable.ai
一个可以帮助你理解某个仓库是做什么或者仓库内文件的 AI ，对于程序员来说比较使用，可以学习 GitHub 项目
https://mutable.ai/

17:24 · 2024年10月20日 · 周日

NotesHub
一个 Markdown 笔记软件，具有插入图表、曲谱、公式等多种功能，有 Web/桌面/手机客户端，支持 Git 仓库同步。
https://about.noteshub.app/

about.noteshub.app

NotesHub - Take Notes, Sync and Collaborate

Fully cross-platform, vendor-agnostic, Markdown-based note-taking app

17:21 · 2024年10月20日 · 周日

MDX Notes - 跨平台笔记软件，公众号排版编辑器
MDX Notes 是一个跨平台笔记软件，也是一个微信公众号排版编辑器，使用MDX，可自定义组件、样式、生成二维码、代码 diff 高亮，可导出 markdown 和 PDF
https://mdxnotes.com/

16:09 · 2024年10月20日 · 周日

🆔 网站名称：PICKFREE

⭐️ 网站功能：设计资源导航

📁 网站简介：一个汇总各种免费资源的导航网站，提供丰富的免版权素材和在线工具。

涵盖了免版权图片、字体、音频、视频等设计素材的下载，还提供在线生成背景、纹理、图标等功能。

🔗 网站链接：https://www.pickfree.cn/

www.pickfree.cn

PICKFREE - 免费资源导航|免版权图片|免费商用字体|免费音频、视频等设计素材下载

13:14 · 2024年10月20日 · 周日

Meta Spirit LM——混合文本和语音的开源多模态语言模型

Meta Spirit LM 是 Meta AI 发布的开源多模态语言模型，能够在语音和文本之间无缝转换，有 Base 版本和 Expressive 版本。

仓库地址：https://github.com/facebookresearch/spiritlm
论文地址：https://arxiv.org/abs/2402.05755
DEMO 演示：https://speechbot.github.io/spiritlm/

核心功能：
1. 基本语音转换：Base 版本可以处理语音的基本转换，适合一般的语音识别和生成任务。
2. 情感捕捉与生成：Expressive 版本能够捕捉语音中的情感，生成带有这种情感的语音，使机器说话更加自然。
3. 自动语音识别（ASR）：将语音输入转换为文本输出。
4. 文本转语音（TTS）：将文本输入转换为语音输出。
5. 语音与文本的混合生成：根据输入的模式自由生成文本或语音，并能够在生成过程中切换模态。
6. 情感理解与表现力生成：SPIRIT-LM-EXPRESSIVE 版本不仅能够理解情感，还能够通过不同的音调和风格生成具有表现力的语音，如生成带有“愤怒”“悲伤”“兴奋”等情感色彩的内容。

GitHub

GitHub - facebookresearch/spiritlm: Inference code for the paper "Spirit-LM Interleaved Spoken and Written Language Model".

Inference code for the paper "Spirit-LM Interleaved Spoken and Written Language Model". - facebookresearch/spiritlm

22:21 · 2024年10月19日 · 周六

Batch Tool：免费在线 AI 图片处理神器，批量去水印/去背景/WebGPU加速/免费无限次数

🌟 工具名称：Batch Tool
🌐 使用环境：无需梯子🪜，无需登录
🔗 工具地址：https://images.batchtool.com/zh
🌈 官方推特：https://x.com/gucho2001827756

Batch Tool 是一款完全免费、浏览器本地运行、性能优秀的在线 AI 图片处理工具，支持 CPU 和 WebGPU 处理，提供批量去除背景和移除物体功能。

Batch Tool 的特点包括：
1.简单易用：免登录、操作简单，即开即用。
2.高性能：支持 WebGPU 加速，速度超快。
3.高效批处理：支持一键处理多个文件。
4.支持多语言：支持中文、英语、日语等 6 种语言。
5.隐私优先：使用本地 AI 模型，无需上传到服务器。

Batch Tools

21:53 · 2024年10月19日 · 周六

GitHub - OpenSource-O1/Open-O1：开源项目实现 O1 级别的 AI 模型

一个尝试复刻GPT-O1的开源项目

🧐 Open-O1 项目旨在通过开源方式提供强大的大语言模型，以匹敌 OpenAI 的 O1 模型，侧重于复杂推理和广泛任务的处理能力。

➡️ 链接：https://github.com/OpenSource-O1/Open-O1

✨重点

●🔍 高级推理与问题解决：Open-O1 模型基于 O1 风格的数据进行训练，展现出强大的逻辑推理和复杂问题解决能力，支持多种应用场景。

●💻 开源替代方案：该项目使用 Hugging Face 提供的 LLaMA 和 Qwen 模型，构建开源替代方案，降低企业和个人获取先进 AI 能力的成本。

●🛠 多模型与部署支持：提供 OpenO1-Qwen-7B 和 OpenO1-LLama-8B 等多个模型版本，并支持快速部署，用户可以根据需求选择合适的模型进行推理和开发。

●🌐 强大的社群支持：项目设有社区沟通渠道（如 Discord 和 Slack），并计划持续发布更新，包括奖励模型和数据、RLHF 支持等，进一步推动社区协作和开放 AI 技术的发展。

GitHub

GitHub - Open-Source-O1/Open-O1

Contribute to Open-Source-O1/Open-O1 development by creating an account on GitHub.

21:30 · 2024年10月19日 · 周六

eSearch：一款集截屏、OCR、搜索、翻译、贴图、屏幕翻译、以图搜图、滚动截屏、录屏等多种功能于一身的工具

eSearch 支持在进行 OCR 操作后，可调用翻译功能，并且实现了跨平台支持，包括 Linux、indows 和 Mac。

官方网站：https://esearch-app.netlify.app/
仓库地址：https://github.com/xushengfeng/eSearch
下载地址：https://esearch-app.netlify.app/#download

esearch-app.netlify.app

eSearch - 识屏 · 搜索

eSearch 截图 OCR 以图搜图搜索翻译贴图

21:11 · 2024年10月19日 · 周六

小报童专栏导航
xiaobot101.com 超过400+ 个小报童专栏，帮助你找到想要的小报童专栏
https://www.xiaobot101.com/

Xiaobot101

发现 2024 年最佳和最新小报童专栏xiaobot101.com

在 xiaobot101.com 探索 2024 年最新、最热门和最佳的小报童专栏。所有有用的小报童专栏都在这里。

19:20 · 2024年10月19日 · 周六

Whisper-WebUI——基于 Whisper 的浏览器界面工具

Whisper-WebUI 是一个基于 Gradio 的浏览器界面，可作为简易字幕生成器。它支持多种 Whisper 实现方式，能从不同来源生成字幕，具有语音转文本翻译、文本转文本翻译等功能，还可进行音频预处理和后处理。可以通过 Pinokio、Docker 或本地运行。

仓库地址：https://github.com/jhj0517/Whisper-WebUI

核心功能：
1. 多种 Whisper 实现选择：可在 openai/whisper、SYSTRAN/faster-whisper（默认）、Vaibhavs10/insanely-fast-whisper 中选择。
2. 多源字幕生成：从文件、Youtube、麦克风等生成字幕。
3. 支持多种字幕格式：SRT、WebVTT、txt。
4. 语音转文本翻译：从其他语言翻译为英语。
5. 文本转文本翻译：使用 Facebook NLLB 模型或 DeepL API 翻译字幕文件。
6. 音频预处理：使用 Silero VAD 预处理音频输入，使用 UVR 分离 BGM。
7. 音频后处理：使用 pyannote 模型进行说话人区分。
8. 可通过 Pinokio、Docker 或本地运行。
9. 根据需求调整 VRAM 使用。
10. 支持多种 Whisper 模型。

GitHub

GitHub - jhj0517/Whisper-WebUI: A Web UI for easy subtitle using whisper model.

A Web UI for easy subtitle using whisper model. Contribute to jhj0517/Whisper-WebUI development by creating an account on GitHub.

17:46 · 2024年10月19日 · 周六

Morphify
标语：免费无限制文件转换器
介绍：释放你的创意，尽在Morphify——终极在线工具，让你轻松无限制地进行多媒体转换。轻松转换图片、音频和视频，不受任何限制。马上开始转换，让你的内容提升到一个全新的层次吧！
产品网站: https://morphify-kappa.vercel.app/

morphify-kappa.vercel.app

Morphify - Free Unlimited File Converter

Unleash your creativity with Morphify – the ultimate online tool for
unlimited and free multimedia conversion. Transform images, audio, and
videos effortlessly, without restrictions. Start converting now and
elevate your content like never before!

17:44 · 2024年10月19日 · 周六

Free AI Headshot Generator | Supawork AI
标语：100% 免费的AI专业头像生成器
介绍：使用Supawork免费的AI头像生成器，轻松创建专业照片。提供300多种风格，已生成超过2100万张头像，获得超过7000名客户的推荐。适用于简历、作品集、博客等多种场合。
产品网站: https://supawork.ai/zh/ai-professional-headshot-generator

supawork.ai

100%免费的AI专业头像生成器(无需注册)

name=description, content=使用Supawork免费的AI头像生成器创建专业照片。拥有300多种风格,已生成2100万张头像,7000多名客户推荐。可用于简历、作品集、博客等。

16:09 · 2024年10月19日 · 周六

yutto，一个可爱且任性的 B 站下载器（CLI）
https://github.com/yutto-dev/yutto

GitHub

GitHub - yutto-dev/yutto: :ice_cube: 一个可爱且任性的 B 站视频下载器

:ice_cube: 一个可爱且任性的 B 站视频下载器. Contribute to yutto-dev/yutto development by creating an account on GitHub.

16:07 · 2024年10月19日 · 周六

Chat100.ai
立即免费在线体验ChatGPT 4o和Claude 3.5 Sonnet
通过GPT4o和Claude 3.5 Sonnet免费体验实时、精准的AI对话。无需登录或任何费用，享受高级ChatGPT功能，体验最优ChatGPT替代方案。
https://chat100.ai/zh-CN

chat100.ai

Chat100.ai：免费使用ChatGPT 4o和Claude 3.5 Sonnet

免费使用Chat100.ai平台上的GPT4o和Claude 3.5 Sonnet，作为ChatGPT的免费替代平台，无需登录即可轻松开启AI聊天，体验由OpenAI ChatGPT技术支持的智能对话。

16:03 · 2024年10月19日 · 周六

surya -- OCR 工具包
一个强大的文档 OCR 工具包，支持 90 多种语言，具有多种功能，包括文本检测、布局分析、读取顺序检测和表识别等
https://github.com/VikParuchuri/surya

GitHub

GitHub - datalab-to/surya: OCR, layout analysis, reading order, table recognition in 90+ languages

OCR, layout analysis, reading order, table recognition in 90+ languages - datalab-to/surya

16:02 · 2024年10月19日 · 周六

cloud-document-converter -- 飞书云文档转换为 Markdown
一个 Chrome 插件，可将 Lark 云文档转换为 Markdown。它支持下载 Lark Doc 为 Markdown 和复制 Lark 文档为 Markdown，但生成的图片 URL 只有两小时可访问性。该插件在块、内联等方面对多种格式有不同程度的支持，如标题、代码块、引用、列表、表格、图像等，同时也有一些不支持的格式
https://chrome.google.com/webstore/detail/ehkomhhcinhikfddnmklbloahaakploh
开源地址：https://github.com/lujunji4113/cloud-document-converter

Google

Cloud Document Converter - Chrome Web Store

Convert lark cloud documents to markdown

16:01 · 2024年10月19日 · 周六

ZByAI
一个 AI 搜索工具，你可以搜索中文内容，它会搜索英文资源然后返回中文内容给你
https://zbyai.com/

ZByAI - AI-Enhanced Search

ZbyAI enhances your search with AI for deeper insights and more relevant results. Experience unparalleled accuracy and discover the web's wisdom.