Glasp: Curated Content to Crafted Posts
标语:整理内容,从重点和笔记中创建博客文章。
介绍:Glasp的新“发布”功能让你可以轻松地将精心整理的重点内容转化为完整的文章和博客帖子。无论是从研究到创作,还是将收集到的见解转变为精美的内容,这一切都可以在Glasp中顺畅实现。
产品网站: https://glasp.co/features/posts Glasp Posts: Curate to Create Blog Posts from Highlights & Notes
ThinkPost
标语:互动式分屏笔记和头脑风暴工具
介绍:这是一款互动式分屏块状笔记、图表和头脑风暴工具。它包含文本编辑器、绘图编辑器、代码编辑器和数学编辑器。你可以在各个面板之间自由移动创意模块,或者在同一个面板内移动!
产品网站: https://thinkpost.io/
OCR+LLM等于纸质文件自动扫描得到markdown!

GitHub - Dicklesworthstone/llm_aided_ocr: 使用大型语言模型(LLM)增强扫描PDF的Tesseract OCR输出
🧐这个项目结合了光学字符识别(OCR)和大型语言模型(LLM),通过LLM的纠错功能,大大提升了OCR文本的准确性和可读性,适用于处理扫描的PDF文件。

重点
🔍 项目使用Tesseract进行OCR处理,并通过LLM对输出的文本进行错误修正,确保文本的准确性和格式一致性。
🛠 支持本地和云端的LLM(如OpenAI和Anthropic),并提供异步处理以提高性能。
📄 最终输出包括LLM修正后的Markdown格式文本,并提供详细的日志记录和质量评估功能,方便跟踪和调试。

➡️链接:https://github.com/Dicklesworthstone/llm_aided_ocr GitHub - Dicklesworthstone/llm_aided_ocr: Enhance Tesseract OCR output for scanned PDFs by applying Large Language Model (LLM)…
不要再只卷文字输入啦,阿里开源了直接支持语音输入提问的千问多模态大语言模型~!🥹
Qwen2-Audio:开启语音对话! | Qwen
🧐Qwen2-Audio 是 Qwen-Audio 的升级版本,支持语音聊天和音频分析功能,能够处理超过8种语言的输入,并且可以直接通过语音指令与用户互动。
➡️链接:http://qwenlm.github.io/zh/blog/qwen2-audio/
重点
🎙 Qwen2-Audio 支持无需自动语音识别(ASR)模块的语音指令输入,实现直接的语音聊天。
🌍 该模型支持多种语言和方言,如中文、英语、粤语、法语等,扩大了语言处理的适用范围。
🔍 除了语音交互,Qwen2-Audio 还可以进行音频分析,能够识别语音、声音和音乐中的信息,应用广泛。
VideoLingo-全自动视频搬运工具
VideoLingo是一款自动化的下载、翻译、配乐的视频工具
主要:
- 🍖 全自动视频搬运工,生成 Netflix 品质的字幕!
- 🎤 克隆自己的声音进行配音!
- 在 streamlit 中点击-完成!
Github:https://github.com/Huanshere/VideoLingo
特点
- 使用 NLP 和 LLM 进行字幕分割
- 智能术语知识库,实现上下文感知翻译
- 三步翻译过程:直接翻译 – 反思 – 改进
- 精确的单词级字幕对齐
- 极低成本:仅需 0.1 元即可创作 5 分钟的跨语言字幕
- GPT-SoVits 高质量的个性化配音
- 开发者友好:逐步结构化文件,便于自定义 GitHub - Huanshere/VideoLingo: Netflix-level subtitle cutting, translation, alignment, and even dubbing - one-click fully automated…
v0 发布一个基于聊天的网页开发助手 可生成用户界面、自动编写运行代码

v0 发布一个基于聊天的网页开发助手,你可以通过聊天的方式与v0互动,让它帮助调试代码、回答开发问题、生成代码等,专门用于前端开发领域,可以为你提供关于这些技术的深入指导和帮助。无论是编写代码、优化性能、部署应用,还是解决技术难题,v0都能为你提供专业的支持和建议。

它拥有丰富的TypeScript、React、Next.js、Vercel等前端技术的知识。你可以把v0视为你个人的web开发助手,能够帮助你处理与web开发相关的各种问题,提供建议、解决方案和技术支持。

v0可以根据你的需求执行以下几种任务:

1. 生成用户界面(UI):如果你请求v0生成某种类型的UI(如表单、按钮、布局等),它可以为你编写相应的代码,并生成UI的代码片段。
2. 运行代码:v0可以帮助你执行或运行代码段,提供实时反馈,帮助你调试或验证代码的功能。
3. 回答编程相关问题:你可以向v0提出关于web开发、前端技术(如TypeScript、React、Next.js等)的任何问题,v0会一步步为你解答,帮助你解决技术问题。

每当你访问v0时,默认会进入聊天界面,这样你可以通过聊天的方式与v0互动,进行代码生成、问题解答或其他开发相关的操作。

如果你选择将v0.dev/chat设置为默认界面,之后每次使用v0时都会首先进入聊天模式。当然,如果你不想使用聊天界面,可以随时点击你的头像,然后关闭这个设置,恢复到你喜欢的其他界面。

在线体验:https://v0.dev/chat v0 by Vercel
1️⃣视频换脸工具 roop
https://github.com/s0md3v/roop
提供一张图片就行了,不需要数据集,也不需要训练

2️⃣翻译+配音工具 pyvideotrans
https://github.com/jianchang512/pyvideotrans
支持切换不同的语音识别、文字翻译、文字合成语音工具

3️⃣唇形同步工具 wa2lip
https://github.com/Rudrabha/Wav2Lip
唇形同步之后,嘴巴会变得有些奇怪,可以用另外一个开源工具
GFPGAN 进行面部修复
https://github.com/TencentARC/GFPGAN
类似老照片修复技术

4️⃣一键解说并剪辑视频
https://github.com/linyqh/NarratoAI
影视解说工具,基于LLM实现文案撰写、自动化视频剪辑、配音和字幕生成的一站式流程,助力高效内容创作 GitHub - s0md3v/roop: one-click face swap
🎧 聆听最美妙的声音:AI 配音神器 Eleven Labs Reader,现已支持中文

作为音频生成领域的超级团队 Eleven Labs 不久前推出了这款Reader 应用:

- 你将使用世界级的AI语音,收听文章、PDF、ePub或任何文本。
- 无论在通勤、运动或其他任何场景下,上传内容,为文本内容配音,即可随时随地收听。
- 完全免费,支持iOS 和Android

🔗 下载地址:https://elevenlabs.io/text-reader Text Reader App - AI Voice Reader for Books, PDFs & Articles
YouDub-webui!- 一款视频中文化工具
提供一整套视频中文化工具包,包括视频下载、语音识别、字幕翻译、AI声音克隆、视频处理、自动上传等一系列流程!
https://github.com/liuzhao1225/YouDub-webui GitHub - liuzhao1225/YouDub-webui
FeedCraft 是一个简单、强大的RSS 源处理工具,他可以作为一个中间件处理你的RSS源. 你可以用它来翻译、提取正文、模拟浏览器来渲染那些动态生成的网页并提取全文、AI生成文章摘要等
https://github.com/Colin-XKL/FeedCraft GitHub - Colin-XKL/FeedCraft: craft your feed at ease! 轻量级rss中间件, 提取全文, 翻译、摘要一站式服务
wechat-article-exporter
微信公众号文章导出工具

## Features

- [x] 搜索公众号
- [x] 搜索公众号内文章
- [x] 导出文章 html (打包了图片和样式文件,能够保证100%还原文章样式)
- [x] 批量导出公众号文章 html
- [x] 缓存文章列表数据,减少接口请求次数 (关键字搜索的文章不会进入缓存)
- [x] 缓存样式文件,加快文章下载速度
- [x] 过滤已删除文章
- [ ] 公众号加入收藏列表
- [ ] 支持图片分享消息

https://github.com/jooooock/wechat-article-exporter GitHub - wechat-article/wechat-article-exporter: 一个在线的微信公众号文章批量下载工具,支持下载阅读量与评论数据,支持私有化部署,通过浏览器进行使用,无需进行安装
章鱼速贴
一款终极剪贴板管理器,支持在多个平台上同步和管理剪贴内容,注重本地优先,保护隐私和数据安全。
在各个平台上同步和管理您的剪贴,支持macOS/iOS/Android/Windows。
地址: https://octoclip.app/zh/
TTSMaker是一款免费的在线文字转语音工具,支持多种语言和语音风格,适用于视频配音、有声读物等多种场景。通过简单的操作,你可以轻松生成逼真的语音,用于各种场景,如朗读、教育、娱乐等。产品功能:文本转换为语音;支持多种语言和语音风格;高级设置包括调节语速、音量、音高等;插入停顿和背景音乐。

📦 平台:网页浏览器访问。
💰 价格方案:订阅制。
 使用评价:转换后的声音自然,语音风格多样,适用于多种场景。操作简单,用户体验良好。

https://ttsmaker.cn
Kardfy卡片图片生成器是一款强大的在线图文排版制作工具,可帮助用户快速制作精美的卡片式图片。无需任何设计经验,即可轻松创建个性化的卡片图像。通过Kardfy卡片图片生成器,用户可以制作生日祝福卡、节日贺卡、活动海报等各种类型的图片,让你的信息更具视觉吸引力。

📦 平台:网页浏览器访问。
💰 价格方案:免费。
 使用评价:界面友好,设计简单。模板多样,满足不同需求。

https://www.kardfy.com
Bigjpg 是一款利用 AI 技术进行图片放大的工具,能够在放大图像的同时保持高质量和清晰度,适用于需要高分辨率图像的各种场景。产品功能:一键放大图像;保持图像清晰度;支持批量处理;支持 JPG、PNG、GIF、BMP 格式。

📦 平台:网页浏览器访问。
💰 价格方案:免费。
 使用评价:该工具能够在放大图片时保持高质量,极大提高了工作效率,适合需要大幅图像的用户。

https://bigjpg.ai BigJpg AI
Wiseal/聪豹是一款专业的历史时间线收集整理工具,用户可以在这里收集和整理历史人物生平和重要事件,打造精准详尽的时间线,帮助用户更加深入地了解历史。从聪豹开始,你可以轻松地探索和学习历史背景和脉络。产品亮点:免费、免注册、免登录、免安装,打开即用!

📦 平台:支持网页浏览器访问。
💰 价格方案:免费。
 使用评价:专业的历史时间线收集整理工具,支持轻松地探索和学习历史背景和脉络。

https://www.wiseal.cn
Flux AI Image Generator
标语:将创意转化为惊艳的视觉效果
介绍:Flux AI图像生成器:免费的文本转图像AI工具!它可以根据你的提示创造出令人惊叹的视觉作品,从逼真的图像到抽象艺术,满足各种需求。没有费用,没有限制——尽情发挥你的创造力吧!使用我们的直观强大工具,将想法转化为艺术作品。
产品网站: https://fluxaiimagegenerator.com/ Flux AI Image Generator
Sparkle
标语:使用人工智能自动整理文件
介绍:Sparkle使用人工智能打造独特的文件夹系统,能够将每一个新文件(以及你以前的所有文件)整理到正确的位置。它会管理你的下载文件夹、桌面和文档文件夹,并为这些文件夹添加图片,这样你就能更轻松地找到内容。
产品网站: https://makeitsparkle.co/ Sparkle - Organize Your Files Automatically With AI
Back to Top