OmniAl:下一代文档OCR ​
用于文档 OCR(光学字符识别)以便 AI 摄取的简单方法。它可以处理多种文件类型,将文件转换为一系列图像后传递给 GPT 以获取 Markdown 格式的输出。Zerox 同时提供了 Node 和 Python 版本的包

开源地址:https://github.com/getomni-ai/zerox
Floweb:强大的超轻量浮动浏览器 ​
可以将网页转换为 WebApp,方便用户像使用本地应用程序一样启动和运行网页,可一键访问常用网站或服务。它具有窗口置顶功能,确保重要网页始终在最前面;提供窗口透明度调整,增加视觉灵活性并保持对周围环境的感知。Floweb 有丰富的用户代理选项,能模拟不同设备和浏览器的浏览体验。还支持自动刷新功能,确保用户始终查看最新内容。
https://www.floweb.cn/
GetEles
标语:你的网站前端助手,帮助你揭示网页设计的奥秘。
介绍:“GetEles.” 这个工具的灵感来源于JavaScript中的getElementBy函数。你可以用它来获取网页信息、元素细节,甚至测量元素之间的距离。未来的更新中,我们还会支持Tailwind类转换功能。
产品网站: https://www.geteles.com/
NotebookLlama: PDF转播客快速入门指南

🧐NotebookLlama提供了一系列指南与工具链,用于将PDF内容转化为播客,借助Meta的Llama模型和文本到语音(TTS)模型完成自动生成。

➡️链接:https://github.com/meta-llama/llama-recipes/tree/main/recipes/quickstart/NotebookLlama

重点
📄 多步骤转换流程:分四个步骤:PDF预处理、转写播客内容、加入戏剧化效果、转成语音播客。

🎙 模型和工具:使用Llama-3.1及Llama-3.2系列模型处理文本,并采用parler-tts和bark等TTS模型生成对话式播客。

🧑‍🔬 提示词实验:建议用户调整提示词来提升内容效果,尤其是在转写和戏剧化步骤中,以优化文本质量。

💻 系统要求:需要支持多个大模型运行的GPU配置,或使用Hugging Face的API服务。

🔄 未来优化建议:探索更好的语音模型、支持网站和音频输入,以及不同LLM的辩论式播客生成,期待社区贡献改进。 llama-cookbook/recipes/quickstart/NotebookLlama at main · meta-llama/llama-cookbook
Then and Now 📸⌛️ - v1.0 | Flux LoRA

🧐Then and Now 📸⌛️是一款用于生成历史与现代场景重叠效果的LoRA模型,可将历史照片和现代场景融合在一个画面中,实现不同时间点的对比展示。

➡️链接:https://civitai.com/models/896697

重点
🕰 历史与现代对比效果:通过将历史照片与相同地点的现代图像叠加,展示地点在不同时期的对比,增强视觉冲击力。

📜 详细的提示词结构:用户可指定前景和背景的类型(如黑白或现代彩色照片),并描述关键细节,以确保前景和背景的元素对齐。

🎨 创意拓展:支持复古照片的细节增强,如增加褶皱或卷角效果,使得“过去”照片更具真实感。

🔍 提示与技巧:通过细致描述前景和背景元素的布局,可以获得更精准的历史与现代交错效果,适合探索各类创意场景。
👉 名称:1Remote
🤖 类型:🤖软件
👏 介绍:1Remote 是一款现代化的个人远程会话管理员和启动器,使用它你可以管理从一个入口管理多种远程会话
- 开源且免费
- 支持 RDP, SSH, VNC, Telnet, (S)FTP, RemoteApp 等多种协议
- 多屏幕、高分辨率的 RDP 支持
- 一键打开你的远程连接 (Alt + M)
- 单个服务器配置中允许存储多个地址和账号
- 基于选项卡的远程桌面界面、多语言、可自定义颜色主题
- 易于部署,仅需解压就能运行
👉 名称:proxypin
🤖 类型:🤖软件
👏 介绍:基于 Flutter 开发的跨平台抓包软件,界面美观,交互简单:
👉 名称:Cloud Document Converter
🤖 类型:🤖软件
👏 介绍:一个 Chrome 扩展, 支持下载、复制飞书云文档为 Markdown
👉 名称:AsrTools
🤖 类型:🤖软件
👏 介绍:智能语音转字幕文本工具,对比 Github 目前多数的音频转换文字项目(通过调用 Wishper 等模型),本项目最大区别和优势就是无需 GPU 和繁琐的本地配置
- 🚀 无需复杂配置:无需 GPU 和繁琐的本地配置,小白也能轻松使用。
- 🖥️ 高颜值界面:基于 PyQt5 和 qfluentwidgets,界面美观且用户友好。
- 效率超人:多线程并发 + 批量处理,文字转换快如闪电。
- 📄 多格式支持:支持生成 .srt 和 .txt 字幕文件,满足不同需求。
👉 名称:rssbot
🤖 类型:🎯项目
👏 介绍:用于消息通知的轻量级 Telegram RSS 机器人。
👉 名称:dpanel
🤖 类型:🎯项目
👏 介绍:Docker 可视化面板系统,提供完善的 Docker 管理功能:
👉 名称:komodo
🤖 类型:🎯项目
👏 介绍:一个用于在多个服务器上构建和部署软件的工具,非常强大,有好看的 UI 以及 Docker 管理、资源同步等:
PinFold
标语:使用文件夹和固定功能的Chrome扩展程序整理ChatGPT
介绍:PinFold帮助您通过文件夹和固定功能来整理ChatGPT的对话。轻松管理您的ChatGPT历史记录,提高您的工作效率。所有这些都只需一个Chrome扩展程序。
产品网站: https://www.pinfold.me/
🆔 网站名称:Perchance AI

⭐️ 网站功能:AI 图标生成

📁 网站简介:一款免费的可以生成图标的工具。只需输入相关的提示词,系统便会利用人工智能技术生成多种风格和类型的图标,适用于应用程序、网站、社交媒体等多种场景。

不需要注册,使用简单且无需水印,以根据自己的喜好和需求,选择不同的图标样式。

🔗 网站链接:https://perchance.org/ai-icon-generator
Clevrr Computer
标语:使用计算机,但结合了OpenAI和Gemini模型。
介绍:这是一个开源项目,旨在利用人工智能代理执行基本任务。目前支持Langchain、Azure OpenAI模型和Gemini模型。欢迎大家贡献和支持,以提升其功能。
产品网站: https://github.com/Clevrr-AI/Clevrr-Computer GitHub - Clevrr-AI/Clevrr-Computer: An open-source implementation of Anthropic's Computer Use to perform basic tasks using AI Agents.
Condensa
标语:在不影响质量和资源的情况下压缩视频。
介绍:我们的平台可以压缩视频,提升使用效率,同时在质量上不会有太大妥协。您可以享受更快速、更优化的内容,同时保留视频的核心精髓。
产品网站: https://condensa.vercel.app/video
MyLensAI
标语:一键获取网页和YouTube的重点内容
介绍:MyLensAI Chrome扩展程序可以将任何网页或YouTube视频转化为快速的视觉摘要。只需点击一下,就能以思维导图、时间线、表格等形式获取要点。节省时间,加快学习,专注于最重要的内容。
产品网站: https://chromewebstore.google.com/detail/mylensai-key-points-of-an/phglephbecffklifllmgaojdlohjdlkg
Manicode
标语:比Cursor更好的代码生成,直接来自你的命令行界面。
介绍:使用自然语言编辑代码库。Manicode 会自动提取所需的文件作为上下文,并将修改写入你的代码库,这样你就可以专注于更高层次的编码。通过 NPM 安装 Manicode,使用起来非常简单,少于一分钟就能搞定!
产品网站: https://manicode.ai/
Back to Top