每日精粹

16:34 · 2024年9月26日 · 周四

Save Tweets Forever
标语：随时保存和查看帖子，即使它们已从X平台删除。
介绍：将任何X（前身为Twitter）上的帖子锁定并永久拥有它。保存推文及其当前互动和图片。即使这些内容从X上被删除，你也可以随时查看。
产品网站: https://savetweetsforever.com/

Savetweetsforever

Saved Forever

Make any X post undeletable

20:52 · 2024年9月23日 · 周一

EvoReaderEpub 阅读器
阅读 epub 文档，极易安装，可配合浏览器扩展，比如「沉浸式翻译」轻松阅读英文书籍

开源地址：https://github.com/EvoReader/EvoReader

GitHub

GitHub - EvoReader/EvoReader: another epub reader

another epub reader. Contribute to EvoReader/EvoReader development by creating an account on GitHub.

20:49 · 2024年9月23日 · 周一

Whisper WebUI - 基于 Whisper 的音频转录与翻译工具
一个基于 OpenAI Whisper API 的 Web 应用，提供高效的音频转录和翻译服务。它支持多种音频格式（如 FLAC 、M4A 、MP3 、MP4 、WAV ），并允许自定义音频语言和提示词

开源地址：https://github.com/Education-Victory/whisper-webui

GitHub

GitHub - Education-Victory/whisper-webui: WebUI for Whisper API

WebUI for Whisper API. Contribute to Education-Victory/whisper-webui development by creating an account on GitHub.

19:34 · 2024年9月23日 · 周一

🆔 网站名称：Public Work

⭐️ 网站功能：图片搜索引擎

📁 网站简介：一个无版权的图片搜索引擎。可以探索来自大都会艺术博物馆和纽约公共图书馆等来源的超过10万张免版权图片。

🔗 网站链接：https://public.work/

www.cosmos.so

Public Work by Cosmos

Public Work is a visual search engine for public domain content. Explore 100,000+ copyright-free images from The MET, New York Public Library, and other sources

15:48 · 2024年9月23日 · 周一

推荐一个开源的视频理解模型，带对话提问功能，而且在demo里边试了下速度还不错，20S的视频两三秒就能解读完毕。

CogVLM2-Video

🧐CogVLM2-Video 是一个时序感知的视频理解模型，能够在处理视频问答和描述任务时，准确地理解和定位视频中的时间信息，提供了更好的时序定位和开放领域问答能力。

➡️链接：https://cogvlm2-video.github.io/

✨重点 ● 🎥 模型特点：CogVLM2-Video 能够在视频理解、视频描述和时序定位任务中表现出色。模型引入了时间戳信息，使其能够在视频问答和生成任务中感知视频的时间轴。

● 📊 数据集构建：通过自动化的数据生成流程，模型从现有的视频片段中提取帧级别信息，并生成 30,000 条时序定位问答数据。这种方法克服了传统手动标注的局限性，为大规模训练提供了高质量的数据支持。

● 🧠 模型架构：CogVLM2-Video 在传统的视频理解模型基础上，改进了时间感知能力。它将多帧视频图像和时间戳作为编码器输入，与文本输入进行联合理解，克服了现有模型在处理时间信息时的局限性。

● 🌐 应用场景：该模型在开放领域问答、视频描述、时序定位等任务中均取得了出色的表现，能够用于视频生成、视频摘要等后续任务。

● 📈 评估结果：在多个公开的视频理解基准测试中取得了最佳表现，并在 VideoChatGPT-Bench 和 MVBench 数据集上表现优异。

● 🛠 在线资源：提供了 Hugging Face、ModelScope 等平台的模型资源和在线演示，方便用户直接体验模型能力。相关代码和模型也已开放，便于进一步研究和应用。

15:48 · 2024年9月23日 · 周一

我深入拆解了 Claude 曝光的内置提示词，不愧是官方最佳实践

🧐文章详细解析了Anthropic公司为Claude 3.5模型设计的内置提示词，展示了如何通过身份设定、交互策略、任务执行方法等多维度的提示词设计，帮助Claude在不同场景中提供高效且准确的回应。作者认为这套提示词设计非常实用，值得Prompt工程师借鉴，并提供了多种实用资源供读者进一步学习。

➡️链接：https://mp.weixin.qq.com/s/0R4zgH3Gc5TAfAPY1oJU4A

✨重点

●💡 全面提示词设计：Claude的内置提示词涵盖了身份设定、交互策略、任务执行和特殊情况处理等多个方面，为AI的行为和回应提供了清晰的指导。

●🔧 实用性强：这些提示词设计不仅提升了Claude的智能交互能力，还为Prompt工程师提供了一个完善的设计参考，帮助他们更好地创建高质量的提示词。

●📚 学习资源：文章附带了丰富的学习资源链接，包括Anthropic和OpenAI的提示工程指南和提示词生成器，帮助读者深入学习提示工程。

Weixin Official Accounts Platform

我深入拆解了 Claude 曝光的内置提示词，不愧是官方最佳实践

Claude 曝光内置提示词，官方最佳实践，手把手教你写提示词

15:45 · 2024年9月23日 · 周一

这个让纸片人动起来的模型好可爱~！

DrawingSpinUp: 3D Animation from Single Character Drawings

🧐DrawingSpinUp是一种新颖的系统，旨在从单个角色绘图中生成逼真的3D动画。该系统通过移除并恢复轮廓线和骨架基础的变形算法，解决了2D动画缺乏3D效果的问题，使角色绘图能够自由旋转、跳跃，甚至执行复杂的舞蹈动作。

➡️链接：https://lordliang.github.io/DrawingSpinUp/

✨重点 ●🎨 创新技术：DrawingSpinUp利用轮廓线移除和恢复策略，以及骨架基础的变形算法，成功解决了手绘角色薄弱结构的3D重建难题。

●📊 性能对比：该系统在与现有2D和3D动画方法的对比中表现优异，生成的3D动画质量明显更高，特别是在旋转和细节处理方面。

●⚠️ 局限性：当输入绘图的轮廓线过厚时，系统可能会产生伪影。此外，不适当的边缘提取可能导致不理想的渲染结果。

15:45 · 2024年9月23日 · 周一

分享一个自动将长视频挑选精彩部分切片为短视频的工具~

GitHub - SamurAIGPT/AI-Youtube-Shorts-Generator: A python tool that uses GPT-4, FFmpeg, and OpenCV to automatically analyze videos, extract the most interesting sections, and crop them for an improved viewing experience.

🧐AI Youtube Shorts Generator是一个Python工具，使用GPT-4、FFmpeg和OpenCV自动分析视频，提取最有趣的片段，并将其裁剪为适合短视频的平台格式，如YouTube Shorts。该工具目前处于v0.1版本，可能存在一些问题。

➡️链接：https://github.com/SamurAIGPT/AI-Youtube-Shorts-Generator

✨重点 ●📹 功能特色：工具可以从YouTube URL下载视频，使用Whisper转录视频内容，通过GPT-4提取视频中的亮点部分，并进行垂直裁剪以适应短视频格式。

●💻 安装与使用：支持Python 3.7及以上版本，用户需要设置环境变量并运行主脚本输入YouTube URL来生成短视频。

●🛠 技术整合：该工具集成了多种技术，包括GPT-4进行内容分析，FFmpeg进行视频处理，以及OpenCV进行图像裁剪。

GitHub

GitHub - SamurAIGPT/AI-Youtube-Shorts-Generator: Open-source alternative to Opus Clip, Vidyo.ai, Klap & SubMagic. Turn long-form…

Open-source alternative to Opus Clip, Vidyo.ai, Klap & SubMagic. Turn long-form YouTube videos into viral 9:16 shorts using LLM highlight detection, Whisper transcription, and auto vertical...

15:44 · 2024年9月23日 · 周一

gpt-o1开源平替🥹

GitHub - bklieger-groq/g1: g1: Using Llama-3.1 70b on Groq to create o1-like reasoning chains

🧐g1项目利用Llama-3.1 70b模型在Groq上构建类似o1模型的推理链，通过高级提示策略增强LLM的推理能力，特别适用于解决传统模型难以处理的逻辑问题，并以JSON格式输出详细的推理步骤。

➡️链接：https://github.com/bklieger-groq/g1

✨重点 ●🧠 推理链生成：g1通过详细的提示策略引导LLM进行多步骤的推理，从而提高模型在处理复杂逻辑问题时的准确性，特别是在重新审视和验证初始答案时表现出色。

●🔧 使用指南：提供了安装和运行的详细步骤，包括如何设置虚拟环境、安装依赖项以及使用Streamlit运行应用程序，方便开发者快速上手。

●📊 提示策略：g1通过提示LLM采用至少三种方法推导答案，并鼓励模型在推理过程中探索替代答案，从而增强模型的推理能力和最终结果的准确性。

●📝 实验性质：g1目前处于实验阶段，尽管它在解决简单逻辑问题时表现优异，但其准确性尚未经过正式评估，旨在激发开源社区开发类似o1推理的策略。

GitHub

GitHub - bklieger-groq/g1: g1: Using Llama-3.1 70b on Groq to create o1-like reasoning chains

g1: Using Llama-3.1 70b on Groq to create o1-like reasoning chains - bklieger-groq/g1

15:33 · 2024年9月23日 · 周一

🧐GOT-OCR2.0 是一个开源项目，旨在通过统一的端到端模型实现OCR-2.0，提供了用于文本和格式化文本OCR的多种工具和脚本，并支持多页和多裁剪的OCR处理，适用于广泛的应用场景。

➡️链接：https://github.com/Ucas-HaoranWei/GOT-OCR2.0

✨重点 ●📚 通用OCR理论：GOT-OCR2.0基于最新的OCR-2.0模型，旨在通过一个统一的端到端模型来处理多种OCR任务，包括文本识别、格式化文本识别和细粒度OCR。

●🛠 功能与演示：项目提供了详细的安装和使用指南，包括如何在多种环境下运行模型，如Huggingface和Google Drive上的模型权重，以及提供了各种OCR处理的示例代码。

●📊 训练与评估：该项目支持后期训练和评估，包括使用不同的数据集和基准测试进行模型的性能评估，特别适合科研和开发人员使用。

●🔗 社区贡献：项目鼓励社区参与开发，并已发布多个由社区贡献的工具和示例，包括Colab演示和CPU版本的GOT-OCR。

GitHub

GitHub - Ucas-HaoranWei/GOT-OCR2.0: Official code implementation of General OCR Theory: Towards OCR-2.0 via a Unified End-to-end…

Official code implementation of General OCR Theory: Towards OCR-2.0 via a Unified End-to-end Model - Ucas-HaoranWei/GOT-OCR2.0

15:21 · 2024年9月23日 · 周一

https://tinymind.me
这是一个不需要服务器的博客和公开想法记录网站，你只需要拥有Github账户，点击授权，就可以可以直接在网页用Markdown编辑博客和短想法，每次更改都会给你的Github提交一次commit。
开源代码：https://github.com/mazzzystar/tinymind

TinyMind

TinyMind - Write blog & thoughts with GitHub.

Write and sync blog posts & thoughts in Markdown with data stored in GitHub. Chrome extension available to capture thoughts from anywhere.

11:05 · 2024年9月23日 · 周一

Recap
标语：记住更多，保留重要的东西。
介绍：Recap 是一个非常简单的工具，可以帮助你记住你关心的信息。它利用人工智能处理你的输入，并根据间隔重复的原则，向你发送个性化的邮件提醒，从而最大程度地提高你对信息的长期记忆。
产品网站: https://www.getrecap.xyz/

Recap

Recap helps you remember more and retain what matters. Focused on simplicity and ease-of-use.

11:02 · 2024年9月23日 · 周一

UI Replicator
标语：一键克隆任何网站
介绍：只需访问你想要克隆的网站，点击浏览器扩展程序，下载就会开始。 (你将获得一个包含所有HTML和CSS的index.html文件)
产品网站: https://uireplicator.com/

10:55 · 2024年9月23日 · 周一

Fish Audio

- 简单，录音十秒就能克隆自己的声音，还支持上传录音文件克隆朋友的声音
- 易用，打开网页就可以直接合成声音，不用下载APP，不用打开小程序，非常方便
- 免费，其他平台克隆一个声音收100，非常离谱，Fish Audio 克隆声音不要钱，生成500字以内也不要钱，一般内容几百字对个人来说完全够用（更多字数订阅10美金/月也不贵说实话）

Fish 不仅能克隆自己的声音，还提供了一个声音共享社区，里面有各种用户上传的上万种有趣声音可以体验，坤坤，赛马娘，孙笑川，高启强...打开你的想象空间...

另外附上这条推的音频版，全部使用 Fish Audio 克隆和生成，使用剪映美化声音、增加背景音防止被其他人克隆，可以试听一下。

Fish Audio 的网址，记得收藏，以后你一定会用到
https://fish.audio/

Fish Audio

TTS and voice cloning with unmatched emotion control.

21:39 · 2024年9月19日 · 周四

Clipboard History
标语：安全地访问、追踪和管理你的剪贴板历史记录。
介绍：剪贴板历史记录功能让你更方便地管理剪贴板。当这个功能开启时，所有你复制到剪贴板的内容都会被备份并保存在本地，方便你以后快速访问。再也不用担心丢失剪贴板中重要内容了！
产品网站: https://chromewebstore.google.com/detail/clipboard-history/hiigklkdkldgfdfjbidahiaiemjlakci

Google

clipboard History - Chrome Web Store

Easily manage clipboard history. Copy, paste, and access recent items. Never lose important text.Boost productivity for multitaskers

21:34 · 2024年9月19日 · 周四

Void 一个开源的 Cursor

支持跟Cursor一样的功能比如Tab补全代码，Ctrl + K编辑选中内容。

支持用 AI 搜索代码库，支持编辑和查看底层提示。

可以使用任何本地的 LLM 驱动，也可以使用Claude、GPT 或 Gemini 的 API，不会留存你的数据。

项目地址：https://voideditor.com/

Voideditor

Void is an open source AI IDE with full privacy.

12:37 · 2024年9月16日 · 周一

🆔 网站名称：懒人图云

⭐️ 网站功能：照片拼图生成器

📁 网站简介：一个专注于照片拼图、图标云和马赛克拼接的在线工具。集成了多款生成器，满足用户在企业照片墙、图标组合、照片马赛克等创意设计中的需求。

🔗 网站链接：https://www.lanrentuyun.com/

Lanrentuyun

懒人图云_照片组合拼图神器_让图标云_照片马赛克更简单

懒人图云是首家专注于照片组合拼图制作在线工具，集成三款照片拼图生成器，一款工具搞定所有照片拼接创意可视化需求；懒人图云致力于让照片拼图、照片墙、图标云生成、照片马赛克拼接制作更简单。

12:30 · 2024年9月16日 · 周一

Mindz – Mind Mapping 标语：将想法结构化为列表，并将其可视化为思维导图。
介绍：Mindz是一款思维导图工具，可以帮助你轻松整理思路、收集创意和规划项目，使用简单明了的列表。你可以轻松将这些嵌套列表转化为美观的思维导图，进行展示或分享给他人。
产品网站: https://www.mindz.de/

www.mindz.de

Mindz - Mobile Mindmapping

Now even with mobile devices you can create and edit complex mind maps quickly, clearly and intuitively.

18:44 · 2024年9月15日 · 周日

侠客日记
侠客日记（SwashbucklerDiary）是一个开源、跨平台的本地日记应用程序，利用 MAUI Blazor 技术开发，支持 Android、Windows、macOS 和 Web 平台

应用程序具备极简风格的用户界面设计、Markdown 即时渲染、多尺寸响应式布局、本地数据存储、隐私模式保护日记安全、支持多媒体内容（图片、音频、视频）、数学公式、脑图、图表、流程图、甘特图、时序图、五线谱等丰富编辑功能

侠客日记支持多种语言和深色模式，提供标签分类展示、天气、心情、位置记录，以及导出多种格式文件和文字、图片分享功能。此外，应用还支持 webdav 备份和同一局域网下的同步传输，并提供完美的沉浸式状态栏导航栏体验
https://github.com/Yu-Core/SwashbucklerDiary

GitHub

GitHub - Yu-Core/SwashbucklerDiary: 侠客日记是一个开源、跨平台的本地日记app，使用Blazor开发，支持Android，Windows，macOS，Web，Linux。"SwashbucklerDiary" is an…

侠客日记是一个开源、跨平台的本地日记app，使用Blazor开发，支持Android，Windows，macOS，Web，Linux。"SwashbucklerDiary" is an open source cross-platform local diary app using Blazor , support Android，Windows，macO...

18:44 · 2024年9月15日 · 周日

Claude Dev
一个开源的 VSCode 扩展，它利用 Claude 3.5 Sonnet 的代理编码能力，能够处理复杂的软件开发任务。该插件集成了多种工具，允许用户创建和编辑文件、探索项目结构、执行终端命令
https://github.com/saoudrizwan/claude-dev

GitHub

GitHub - cline/cline: Autonomous coding agent right in your IDE, capable of creating/editing files, executing commands, using the…

Autonomous coding agent right in your IDE, capable of creating/editing files, executing commands, using the browser, and more with your permission every step of the way. - cline/cline