每日精粹

08:37 · 2024年8月25日 · 周日

👉 名称：SearXNG
🤖 类型：🎯项目
👏 介绍：SearXNG 是一个免费的互联网元搜索引擎，它通过整合不同的搜索服务和数据库来提供搜索结果，同时保障用户隐私不被追踪和分析。

15:20 · 2024年8月24日 · 周六

Hue
标语：您亲切的人工智能助手
介绍：Hue 是你的人工智能助手，深入融入你的数字生活，为你提供及时的见解、提醒和日常事务的支持。它直观易用，富有人情味，总是抢先一步，GIF 表达也非常出色。
产品网站: https://hue.am/

Hue - your personable assistant

Hue is an AI personable assistant, like your BFF but better organised.

15:18 · 2024年8月24日 · 周六

Generate QR Codes
标语：隐私友好的免费二维码生成器
介绍：创建一个二维码，可以链接到任何网站URL、Instagram账号、名片、PayPal、Google Maps位置等，方便用户通过手机快速访问网页。
产品网站: https://generateqr.codes/en

generateqr.codes

Generate URL QR Code

Create a QR code for any website URL, enabling quick and easy access to web pages via mobile devices.

14:59 · 2024年8月24日 · 周六

Zed AI
标语：使用大型语言模型编程
介绍：Zed AI 将大语言模型直接融入你的编辑器，采用了一种可扩展、以文本为中心的方法。同时，我们也在少数 Zed 用户中试点使用 Anthropic 的新功能——Claude 3.5 Sonnet 的快速编辑模式。
产品网站: https://zed.dev/ai

Zed

Zed AI

Zed adds a uniquely powerful interface for agentic engineering.

15:14 · 2024年8月23日 · 周五

Google 给 Gemini 的 AI studio 增加了一个提示词库。

可以帮助你学习一些常见需求的 Gemini 提示词写法。

也可以直接测试模型对这些常见需求的相应情况。

JSON 格式输出、数学公式、表格生成、文章改写等常见 AI 功能的提示词都在里面。

这里尝试：https://aistudio.google.com/app/gallery

12:36 · 2024年8月23日 · 周五

Screenify
标语：100% 免费的屏幕录制，没有限制，也没有费用。
介绍：Screenify提供高质量的屏幕录制服务，完全免费。轻松捕捉、分享，享受流畅的性能——一切都是免费的。
产品网站: https://www.imobie.com/screenify/

Imobie

Screenify - Free Screen Recorder for Windows & Mac

Download Screenify to record screen, audio, and webcam for free. No watermark and no time limit. Available for Windows and Mac computers.

12:36 · 2024年8月23日 · 周五

Image Generator powered by Flux
标语：将你的想法转化为令人惊叹的视觉效果。
介绍：Flux图像生成器是黑森林实验室推出的一款模型，可以将文本转换为图像。它提供了三个版本：Flux Schnell、Flux Dev和Flux Pro。这款工具是由人工智能专家开发的，无需注册，您可以立即开始创作。
产品网站: https://fluximagegenerator.net/zh

Flux Image Generator

Flux Image Generator is Black Forest Labs' model that turns text into images.it offers three versions: Flux Schnell, Flux Dev, and Flux Pro Developed by AI experts. No sign-up needed – start creating instantly.

12:35 · 2024年8月23日 · 周五

Notion AI Prompt Hub
标语：整理和运行你的提示，同时访问内置提示。
介绍：Notion AI 提示中心是你个性化的 Notion AI 指挥中心。在这里，你可以整理和运行自己的提示，还能使用内置工具，比如翻译器、邮件撰写器等等——一应俱全。帮助你简化工作流程，轻松提升工作效率。
产品网站: https://threeups.notion.site/Notion-AI-Prompt-Hub-39a33f80837c41ffac6f4ab9d7a00b7d

General on Notion

Notion AI Prompt Hub | Notion

What is this?

12:33 · 2024年8月23日 · 周五

EasyDictation.app
标语：通过听写，让英语学习变得简单又有趣
介绍：- 通过听写，把学习英语的效果提高十倍！

不用反复倒带，可以从任何YouTube视频中学习！
基于句子的控制方式。
使用AI驱动的语音识别，练习“影子跟读”技巧（说话）。
产品网站: https://easydictation.app/

easydictation.app

Master English Listening with AI-Powered Dictation Practice | Easy Dictation

Turn any YouTube video into an interactive English lesson with AI transcription, instant feedback, and pronunciation practice.

12:31 · 2024年8月23日 · 周五

Glasp: Curated Content to Crafted Posts
标语：整理内容，从重点和笔记中创建博客文章。
介绍：Glasp的新“发布”功能让你可以轻松地将精心整理的重点内容转化为完整的文章和博客帖子。无论是从研究到创作，还是将收集到的见解转变为精美的内容，这一切都可以在Glasp中顺畅实现。
产品网站: https://glasp.co/features/posts

Glasp

Glasp Posts: Curate to Create Blog Posts from Highlights & Notes

Glasp Posts is a new way to publish posts from your highlights and notes. Create beautiful blog posts, newsletters, and social media content from your highlights and notes.

12:27 · 2024年8月23日 · 周五

ThinkPost
标语：互动式分屏笔记和头脑风暴工具
介绍：这是一款互动式分屏块状笔记、图表和头脑风暴工具。它包含文本编辑器、绘图编辑器、代码编辑器和数学编辑器。你可以在各个面板之间自由移动创意模块，或者在同一个面板内移动！
产品网站: https://thinkpost.io/

thinkpost.io

Interactive split-screen diagramming, note-taking, and brainstorming tool

10:26 · 2024年8月23日 · 周五

OCR+LLM等于纸质文件自动扫描得到markdown！

GitHub - Dicklesworthstone/llm_aided_ocr: 使用大型语言模型（LLM）增强扫描PDF的Tesseract OCR输出
🧐这个项目结合了光学字符识别（OCR）和大型语言模型（LLM），通过LLM的纠错功能，大大提升了OCR文本的准确性和可读性，适用于处理扫描的PDF文件。

✨重点
●🔍 项目使用Tesseract进行OCR处理，并通过LLM对输出的文本进行错误修正，确保文本的准确性和格式一致性。
●🛠 支持本地和云端的LLM（如OpenAI和Anthropic），并提供异步处理以提高性能。
●📄 最终输出包括LLM修正后的Markdown格式文本，并提供详细的日志记录和质量评估功能，方便跟踪和调试。

➡️链接：https://github.com/Dicklesworthstone/llm_aided_ocr

GitHub

GitHub - Dicklesworthstone/llm_aided_ocr: Enhance Tesseract OCR output for scanned PDFs by applying Large Language Model (LLM)…

Enhance Tesseract OCR output for scanned PDFs by applying Large Language Model (LLM) corrections. - Dicklesworthstone/llm_aided_ocr

10:24 · 2024年8月23日 · 周五

不要再只卷文字输入啦，阿里开源了直接支持语音输入提问的千问多模态大语言模型~！🥹
Qwen2-Audio：开启语音对话！ | Qwen
🧐Qwen2-Audio 是 Qwen-Audio 的升级版本，支持语音聊天和音频分析功能，能够处理超过8种语言的输入，并且可以直接通过语音指令与用户互动。
➡️链接：http://qwenlm.github.io/zh/blog/qwen2-audio/
✨重点
●🎙 Qwen2-Audio 支持无需自动语音识别（ASR）模块的语音指令输入，实现直接的语音聊天。
●🌍 该模型支持多种语言和方言，如中文、英语、粤语、法语等，扩大了语言处理的适用范围。
●🔍 除了语音交互，Qwen2-Audio 还可以进行音频分析，能够识别语音、声音和音乐中的信息，应用广泛。

Qwen

Qwen2-Audio：开启语音对话！

DEMO PAPER GITHUB HUGGING FACE MODELSCOPE DISCORD
在一个通用的AI系统中，核心模型应该能够理解不同模态的信息。当前的大语言模型现在已经能够理解语言并进行推理，并且已经扩展到了更多的模态，包括视觉和音频。此前我们陆续发布了多个 Qwen 语言模型系列以及 Qwen-VL 和 Qwen-Audio 等多模态模型。今天，我们正式发布 Qwen2-Audio。这是 Qwen-Audio 的下一代版本，它能够接受音频和文本输入，并生成文本输出。Qwen2-Audio…

19:21 · 2024年8月22日 · 周四

VideoLingo-全自动视频搬运工具
VideoLingo是一款自动化的下载、翻译、配乐的视频工具
主要：
- 🍖 全自动视频搬运工，生成 Netflix 品质的字幕！
- 🎤 克隆自己的声音进行配音!
- ✨ 在 streamlit 中点击-完成！
Github:https://github.com/Huanshere/VideoLingo
特点
- 使用 NLP 和 LLM 进行字幕分割
- 智能术语知识库，实现上下文感知翻译
- 三步翻译过程：直接翻译 – 反思 – 改进
- 精确的单词级字幕对齐
- 极低成本：仅需 0.1 元即可创作 5 分钟的跨语言字幕
- GPT-SoVits 高质量的个性化配音
- 开发者友好：逐步结构化文件，便于自定义

GitHub

GitHub - Huanshere/VideoLingo: Netflix-level subtitle cutting, translation, alignment, and even dubbing - one-click fully automated…

Netflix-level subtitle cutting, translation, alignment, and even dubbing - one-click fully automated AI video subtitle team | Netflix级字幕切割、翻译、对齐、甚至加上配音，一键全自动视频搬运AI字幕组 - Huanshere/VideoLingo

19:13 · 2024年8月22日 · 周四

v0 发布一个基于聊天的网页开发助手可生成用户界面、自动编写运行代码

v0 发布一个基于聊天的网页开发助手，你可以通过聊天的方式与v0互动，让它帮助调试代码、回答开发问题、生成代码等，专门用于前端开发领域，可以为你提供关于这些技术的深入指导和帮助。无论是编写代码、优化性能、部署应用，还是解决技术难题，v0都能为你提供专业的支持和建议。

它拥有丰富的TypeScript、React、Next.js、Vercel等前端技术的知识。你可以把v0视为你个人的web开发助手，能够帮助你处理与web开发相关的各种问题，提供建议、解决方案和技术支持。

v0可以根据你的需求执行以下几种任务：

1. 生成用户界面（UI）：如果你请求v0生成某种类型的UI（如表单、按钮、布局等），它可以为你编写相应的代码，并生成UI的代码片段。
2. 运行代码：v0可以帮助你执行或运行代码段，提供实时反馈，帮助你调试或验证代码的功能。
3. 回答编程相关问题：你可以向v0提出关于web开发、前端技术（如TypeScript、React、Next.js等）的任何问题，v0会一步步为你解答，帮助你解决技术问题。

每当你访问v0时，默认会进入聊天界面，这样你可以通过聊天的方式与v0互动，进行代码生成、问题解答或其他开发相关的操作。

如果你选择将v0.dev/chat设置为默认界面，之后每次使用v0时都会首先进入聊天模式。当然，如果你不想使用聊天界面，可以随时点击你的头像，然后关闭这个设置，恢复到你喜欢的其他界面。

在线体验：https://v0.dev/chat

v0.app

v0 by Vercel - Build Agents, Apps, and Websites with AI

Your collaborative AI assistant to design, iterate, and scale full-stack applications for the web.

19:06 · 2024年8月22日 · 周四

1️⃣视频换脸工具 roop
https://github.com/s0md3v/roop
提供一张图片就行了，不需要数据集，也不需要训练

2️⃣翻译+配音工具 pyvideotrans
https://github.com/jianchang512/pyvideotrans
支持切换不同的语音识别、文字翻译、文字合成语音工具

3️⃣唇形同步工具 wa2lip
https://github.com/Rudrabha/Wav2Lip
唇形同步之后，嘴巴会变得有些奇怪，可以用另外一个开源工具
GFPGAN 进行面部修复
https://github.com/TencentARC/GFPGAN
类似老照片修复技术

4️⃣一键解说并剪辑视频
https://github.com/linyqh/NarratoAI
影视解说工具，基于LLM实现文案撰写、自动化视频剪辑、配音和字幕生成的一站式流程，助力高效内容创作

GitHub

GitHub - s0md3v/roop: one-click face swap

one-click face swap. Contribute to s0md3v/roop development by creating an account on GitHub.

18:57 · 2024年8月22日 · 周四

🎧 聆听最美妙的声音：AI 配音神器 Eleven Labs Reader，现已支持中文

作为音频生成领域的超级团队 Eleven Labs 不久前推出了这款Reader 应用：

- 你将使用世界级的AI语音，收听文章、PDF、ePub或任何文本。
- 无论在通勤、运动或其他任何场景下，上传内容，为文本内容配音，即可随时随地收听。
- 完全免费，支持iOS 和Android

🔗 下载地址：https://elevenlabs.io/text-reader

ElevenLabs