Save Tweets Forever
标语:随时保存和查看帖子,即使它们已从X平台删除。
介绍:将任何X(前身为Twitter)上的帖子锁定并永久拥有它。保存推文及其当前互动和图片。即使这些内容从X上被删除,你也可以随时查看。
产品网站: https://savetweetsforever.com/ Saved Forever
Whisper WebUI - 基于 Whisper 的音频转录与翻译工具​
一个基于 OpenAI Whisper API 的 Web 应用,提供高效的音频转录和翻译服务。它支持多种音频格式(如 FLAC 、M4A 、MP3 、MP4 、WAV ),并允许自定义音频语言和提示词

开源地址:https://github.com/Education-Victory/whisper-webui GitHub - Education-Victory/whisper-webui: WebUI for Whisper API
🆔 网站名称:Public Work

⭐️ 网站功能:图片搜索引擎

📁 网站简介:一个无版权的图片搜索引擎。可以探索来自大都会艺术博物馆和纽约公共图书馆等来源的超过10万张免版权图片。

🔗 网站链接:https://public.work/ Public Work by Cosmos
推荐一个开源的视频理解模型,带对话提问功能,而且在demo里边试了下速度还不错,20S的视频两三秒就能解读完毕。

CogVLM2-Video

🧐CogVLM2-Video 是一个时序感知的视频理解模型,能够在处理视频问答和描述任务时,准确地理解和定位视频中的时间信息,提供了更好的时序定位和开放领域问答能力。

➡️链接:https://cogvlm2-video.github.io/

重点 ● 🎥 模型特点:CogVLM2-Video 能够在视频理解、视频描述和时序定位任务中表现出色。模型引入了时间戳信息,使其能够在视频问答和生成任务中感知视频的时间轴。

📊 数据集构建:通过自动化的数据生成流程,模型从现有的视频片段中提取帧级别信息,并生成 30,000 条时序定位问答数据。这种方法克服了传统手动标注的局限性,为大规模训练提供了高质量的数据支持。

🧠 模型架构:CogVLM2-Video 在传统的视频理解模型基础上,改进了时间感知能力。它将多帧视频图像和时间戳作为编码器输入,与文本输入进行联合理解,克服了现有模型在处理时间信息时的局限性。

🌐 应用场景:该模型在开放领域问答、视频描述、时序定位等任务中均取得了出色的表现,能够用于视频生成、视频摘要等后续任务。

📈 评估结果:在多个公开的视频理解基准测试中取得了最佳表现,并在 VideoChatGPT-Bench 和 MVBench 数据集上表现优异。

🛠 在线资源:提供了 Hugging Face、ModelScope 等平台的模型资源和 在线演示,方便用户直接体验模型能力。相关代码和模型也已开放,便于进一步研究和应用。
我深入拆解了 Claude 曝光的内置提示词,不愧是官方最佳实践

🧐文章详细解析了Anthropic公司为Claude 3.5模型设计的内置提示词,展示了如何通过身份设定、交互策略、任务执行方法等多维度的提示词设计,帮助Claude在不同场景中提供高效且准确的回应。作者认为这套提示词设计非常实用,值得Prompt工程师借鉴,并提供了多种实用资源供读者进一步学习。

➡️链接:https://mp.weixin.qq.com/s/0R4zgH3Gc5TAfAPY1oJU4A

重点

💡 全面提示词设计:Claude的内置提示词涵盖了身份设定、交互策略、任务执行和特殊情况处理等多个方面,为AI的行为和回应提供了清晰的指导。

🔧 实用性强:这些提示词设计不仅提升了Claude的智能交互能力,还为Prompt工程师提供了一个完善的设计参考,帮助他们更好地创建高质量的提示词。

📚 学习资源:文章附带了丰富的学习资源链接,包括Anthropic和OpenAI的提示工程指南和提示词生成器,帮助读者深入学习提示工程。
这个让纸片人动起来的模型好可爱~!

DrawingSpinUp: 3D Animation from Single Character Drawings

🧐DrawingSpinUp是一种新颖的系统,旨在从单个角色绘图中生成逼真的3D动画。该系统通过移除并恢复轮廓线和骨架基础的变形算法,解决了2D动画缺乏3D效果的问题,使角色绘图能够自由旋转、跳跃,甚至执行复杂的舞蹈动作。

➡️链接:https://lordliang.github.io/DrawingSpinUp/

重点 ●🎨 创新技术:DrawingSpinUp利用轮廓线移除和恢复策略,以及骨架基础的变形算法,成功解决了手绘角色薄弱结构的3D重建难题。

📊 性能对比:该系统在与现有2D和3D动画方法的对比中表现优异,生成的3D动画质量明显更高,特别是在旋转和细节处理方面。

⚠️ 局限性:当输入绘图的轮廓线过厚时,系统可能会产生伪影。此外,不适当的边缘提取可能导致不理想的渲染结果。
分享一个自动将长视频挑选精彩部分切片为短视频的工具~

GitHub - SamurAIGPT/AI-Youtube-Shorts-Generator: A python tool that uses GPT-4, FFmpeg, and OpenCV to automatically analyze videos, extract the most interesting sections, and crop them for an improved viewing experience.

🧐AI Youtube Shorts Generator是一个Python工具,使用GPT-4、FFmpeg和OpenCV自动分析视频,提取最有趣的片段,并将其裁剪为适合短视频的平台格式,如YouTube Shorts。该工具目前处于v0.1版本,可能存在一些问题。

➡️链接:https://github.com/SamurAIGPT/AI-Youtube-Shorts-Generator

重点 ●📹 功能特色:工具可以从YouTube URL下载视频,使用Whisper转录视频内容,通过GPT-4提取视频中的亮点部分,并进行垂直裁剪以适应短视频格式。

💻 安装与使用:支持Python 3.7及以上版本,用户需要设置环境变量并运行主脚本输入YouTube URL来生成短视频。

🛠 技术整合:该工具集成了多种技术,包括GPT-4进行内容分析,FFmpeg进行视频处理,以及OpenCV进行图像裁剪。 GitHub - SamurAIGPT/AI-Youtube-Shorts-Generator: A python tool that uses GPT-4, FFmpeg, and OpenCV to automatically analyze videos…
gpt-o1开源平替🥹

GitHub - bklieger-groq/g1: g1: Using Llama-3.1 70b on Groq to create o1-like reasoning chains

🧐g1项目利用Llama-3.1 70b模型在Groq上构建类似o1模型的推理链,通过高级提示策略增强LLM的推理能力,特别适用于解决传统模型难以处理的逻辑问题,并以JSON格式输出详细的推理步骤。

➡️链接:https://github.com/bklieger-groq/g1

重点 ●🧠 推理链生成:g1通过详细的提示策略引导LLM进行多步骤的推理,从而提高模型在处理复杂逻辑问题时的准确性,特别是在重新审视和验证初始答案时表现出色。

🔧 使用指南:提供了安装和运行的详细步骤,包括如何设置虚拟环境、安装依赖项以及使用Streamlit运行应用程序,方便开发者快速上手。

📊 提示策略:g1通过提示LLM采用至少三种方法推导答案,并鼓励模型在推理过程中探索替代答案,从而增强模型的推理能力和最终结果的准确性。

📝 实验性质:g1目前处于实验阶段,尽管它在解决简单逻辑问题时表现优异,但其准确性尚未经过正式评估,旨在激发开源社区开发类似o1推理的策略。 GitHub - bklieger-groq/g1: g1: Using Llama-3.1 70b on Groq to create o1-like reasoning chains
🧐GOT-OCR2.0 是一个开源项目,旨在通过统一的端到端模型实现OCR-2.0,提供了用于文本和格式化文本OCR的多种工具和脚本,并支持多页和多裁剪的OCR处理,适用于广泛的应用场景。

➡️链接:https://github.com/Ucas-HaoranWei/GOT-OCR2.0

重点 ●📚 通用OCR理论:GOT-OCR2.0基于最新的OCR-2.0模型,旨在通过一个统一的端到端模型来处理多种OCR任务,包括文本识别、格式化文本识别和细粒度OCR。

🛠 功能与演示:项目提供了详细的安装和使用指南,包括如何在多种环境下运行模型,如Huggingface和Google Drive上的模型权重,以及提供了各种OCR处理的示例代码。

📊 训练与评估:该项目支持后期训练和评估,包括使用不同的数据集和基准测试进行模型的性能评估,特别适合科研和开发人员使用。

🔗 社区贡献:项目鼓励社区参与开发,并已发布多个由社区贡献的工具和示例,包括Colab演示和CPU版本的GOT-OCR。 GitHub - Ucas-HaoranWei/GOT-OCR2.0: Official code implementation of General OCR Theory:  Towards OCR-2.0 via a Unified End-to-end…
https://tinymind.me
这是一个不需要服务器的博客和公开想法记录网站,你只需要拥有Github账户,点击授权,就可以可以直接在网页用Markdown编辑博客和短想法,每次更改都会给你的Github提交一次commit。
开源代码:https://github.com/mazzzystar/tinymind TinyMind - Write blog & thoughts with GitHub.
Recap
标语:记住更多,保留重要的东西。
介绍:Recap 是一个非常简单的工具,可以帮助你记住你关心的信息。它利用人工智能处理你的输入,并根据间隔重复的原则,向你发送个性化的邮件提醒,从而最大程度地提高你对信息的长期记忆。
产品网站: https://www.getrecap.xyz/ Recap
UI Replicator
标语:一键克隆任何网站
介绍:只需访问你想要克隆的网站,点击浏览器扩展程序,下载就会开始。 (你将获得一个包含所有HTML和CSS的index.html文件)
产品网站: https://uireplicator.com/
Fish Audio

- 简单,录音十秒就能克隆自己的声音,还支持上传录音文件克隆朋友的声音
- 易用,打开网页就可以直接合成声音,不用下载APP,不用打开小程序,非常方便
- 免费,其他平台克隆一个声音收100,非常离谱,Fish Audio 克隆声音不要钱,生成500字以内也不要钱,一般内容几百字对个人来说完全够用(更多字数订阅10美金/月也不贵说实话)

Fish 不仅能克隆自己的声音,还提供了一个声音共享社区,里面有各种用户上传的上万种有趣声音可以体验,坤坤,赛马娘,孙笑川,高启强...打开你的想象空间...

另外附上这条推的音频版,全部使用 Fish Audio 克隆和生成,使用剪映美化声音、增加背景音防止被其他人克隆,可以试听一下。

Fish Audio 的网址,记得收藏,以后你一定会用到
https://fish.audio/ Fish Audio
Clipboard History
标语:安全地访问、追踪和管理你的剪贴板历史记录。
介绍:剪贴板历史记录功能让你更方便地管理剪贴板。当这个功能开启时,所有你复制到剪贴板的内容都会被备份并保存在本地,方便你以后快速访问。再也不用担心丢失剪贴板中重要内容了!
产品网站: https://chromewebstore.google.com/detail/clipboard-history/hiigklkdkldgfdfjbidahiaiemjlakci
Void 一个开源的 Cursor

支持跟Cursor一样的功能比如Tab补全代码,Ctrl + K编辑选中内容。

支持用 AI 搜索代码库,支持编辑和查看底层提示。

可以使用任何本地的 LLM 驱动,也可以使用Claude、GPT 或 Gemini 的 API,不会留存你的数据。

项目地址:https://voideditor.com/ Voideditor
🆔 网站名称:懒人图云

⭐️ 网站功能:照片拼图生成器

📁 网站简介:一个专注于照片拼图、图标云和马赛克拼接的在线工具。集成了多款生成器,满足用户在企业照片墙、图标组合、照片马赛克等创意设计中的需求。

🔗 网站链接:https://www.lanrentuyun.com/
Mindz – Mind Mapping 标语:将想法结构化为列表,并将其可视化为思维导图。
介绍:Mindz是一款思维导图工具,可以帮助你轻松整理思路、收集创意和规划项目,使用简单明了的列表。你可以轻松将这些嵌套列表转化为美观的思维导图,进行展示或分享给他人。
产品网站: https://www.mindz.de/
侠客日记​
侠客日记(SwashbucklerDiary)是一个开源、跨平台的本地日记应用程序,利用 MAUI Blazor 技术开发,支持 Android、Windows、macOS 和 Web 平台

应用程序具备极简风格的用户界面设计、Markdown 即时渲染、多尺寸响应式布局、本地数据存储、隐私模式保护日记安全、支持多媒体内容(图片、音频、视频)、数学公式、脑图、图表、流程图、甘特图、时序图、五线谱等丰富编辑功能

侠客日记支持多种语言和深色模式,提供标签分类展示、天气、心情、位置记录,以及导出多种格式文件和文字、图片分享功能。此外,应用还支持 webdav 备份和同一局域网下的同步传输,并提供完美的沉浸式状态栏导航栏体验
https://github.com/Yu-Core/SwashbucklerDiary GitHub - Yu-Core/SwashbucklerDiary: 侠客日记是一个开源、跨平台的本地日记app,使用Blazor开发,支持Android,Windows,macOS,Web,Linux。
Back to Top