Hue
标语:您亲切的人工智能助手
介绍:Hue 是你的人工智能助手,深入融入你的数字生活,为你提供及时的见解、提醒和日常事务的支持。它直观易用,富有人情味,总是抢先一步,GIF 表达也非常出色。
产品网站: https://hue.am/
标语:您亲切的人工智能助手
介绍:Hue 是你的人工智能助手,深入融入你的数字生活,为你提供及时的见解、提醒和日常事务的支持。它直观易用,富有人情味,总是抢先一步,GIF 表达也非常出色。
产品网站: https://hue.am/
Generate QR Codes
标语:隐私友好的免费二维码生成器
介绍:创建一个二维码,可以链接到任何网站URL、Instagram账号、名片、PayPal、Google Maps位置等,方便用户通过手机快速访问网页。
产品网站: https://generateqr.codes/en
标语:隐私友好的免费二维码生成器
介绍:创建一个二维码,可以链接到任何网站URL、Instagram账号、名片、PayPal、Google Maps位置等,方便用户通过手机快速访问网页。
产品网站: https://generateqr.codes/en
Zed AI
标语:使用大型语言模型编程
介绍:Zed AI 将大语言模型直接融入你的编辑器,采用了一种可扩展、以文本为中心的方法。同时,我们也在少数 Zed 用户中试点使用 Anthropic 的新功能——Claude 3.5 Sonnet 的快速编辑模式。
产品网站: https://zed.dev/ai
标语:使用大型语言模型编程
介绍:Zed AI 将大语言模型直接融入你的编辑器,采用了一种可扩展、以文本为中心的方法。同时,我们也在少数 Zed 用户中试点使用 Anthropic 的新功能——Claude 3.5 Sonnet 的快速编辑模式。
产品网站: https://zed.dev/ai
Google 给 Gemini 的 AI studio 增加了一个提示词库。
可以帮助你学习一些常见需求的 Gemini 提示词写法。
也可以直接测试模型对这些常见需求的相应情况。
JSON 格式输出、数学公式、表格生成、文章改写等常见 AI 功能的提示词都在里面。
这里尝试:https://aistudio.google.com/app/gallery
可以帮助你学习一些常见需求的 Gemini 提示词写法。
也可以直接测试模型对这些常见需求的相应情况。
JSON 格式输出、数学公式、表格生成、文章改写等常见 AI 功能的提示词都在里面。
这里尝试:https://aistudio.google.com/app/gallery
Screenify
标语:100% 免费的屏幕录制,没有限制,也没有费用。
介绍:Screenify提供高质量的屏幕录制服务,完全免费。轻松捕捉、分享,享受流畅的性能——一切都是免费的。
产品网站: https://www.imobie.com/screenify/
标语:100% 免费的屏幕录制,没有限制,也没有费用。
介绍:Screenify提供高质量的屏幕录制服务,完全免费。轻松捕捉、分享,享受流畅的性能——一切都是免费的。
产品网站: https://www.imobie.com/screenify/
Image Generator powered by Flux
标语:将你的想法转化为令人惊叹的视觉效果。
介绍:Flux图像生成器是黑森林实验室推出的一款模型,可以将文本转换为图像。它提供了三个版本:Flux Schnell、Flux Dev和Flux Pro。这款工具是由人工智能专家开发的,无需注册,您可以立即开始创作。
产品网站: https://fluximagegenerator.net/zh
标语:将你的想法转化为令人惊叹的视觉效果。
介绍:Flux图像生成器是黑森林实验室推出的一款模型,可以将文本转换为图像。它提供了三个版本:Flux Schnell、Flux Dev和Flux Pro。这款工具是由人工智能专家开发的,无需注册,您可以立即开始创作。
产品网站: https://fluximagegenerator.net/zh
Notion AI Prompt Hub
标语:整理和运行你的提示,同时访问内置提示。
介绍:Notion AI 提示中心是你个性化的 Notion AI 指挥中心。在这里,你可以整理和运行自己的提示,还能使用内置工具,比如翻译器、邮件撰写器等等——一应俱全。帮助你简化工作流程,轻松提升工作效率。
产品网站: https://threeups.notion.site/Notion-AI-Prompt-Hub-39a33f80837c41ffac6f4ab9d7a00b7d
标语:整理和运行你的提示,同时访问内置提示。
介绍:Notion AI 提示中心是你个性化的 Notion AI 指挥中心。在这里,你可以整理和运行自己的提示,还能使用内置工具,比如翻译器、邮件撰写器等等——一应俱全。帮助你简化工作流程,轻松提升工作效率。
产品网站: https://threeups.notion.site/Notion-AI-Prompt-Hub-39a33f80837c41ffac6f4ab9d7a00b7d
EasyDictation.app
标语:通过听写,让英语学习变得简单又有趣
介绍:- 通过听写,把学习英语的效果提高十倍!
不用反复倒带,可以从任何YouTube视频中学习!
基于句子的控制方式。
使用AI驱动的语音识别,练习“影子跟读”技巧(说话)。
产品网站: https://easydictation.app/
标语:通过听写,让英语学习变得简单又有趣
介绍:- 通过听写,把学习英语的效果提高十倍!
不用反复倒带,可以从任何YouTube视频中学习!
基于句子的控制方式。
使用AI驱动的语音识别,练习“影子跟读”技巧(说话)。
产品网站: https://easydictation.app/
Glasp: Curated Content to Crafted Posts
标语:整理内容,从重点和笔记中创建博客文章。
介绍:Glasp的新“发布”功能让你可以轻松地将精心整理的重点内容转化为完整的文章和博客帖子。无论是从研究到创作,还是将收集到的见解转变为精美的内容,这一切都可以在Glasp中顺畅实现。
产品网站: https://glasp.co/features/posts
标语:整理内容,从重点和笔记中创建博客文章。
介绍:Glasp的新“发布”功能让你可以轻松地将精心整理的重点内容转化为完整的文章和博客帖子。无论是从研究到创作,还是将收集到的见解转变为精美的内容,这一切都可以在Glasp中顺畅实现。
产品网站: https://glasp.co/features/posts
ThinkPost
标语:互动式分屏笔记和头脑风暴工具
介绍:这是一款互动式分屏块状笔记、图表和头脑风暴工具。它包含文本编辑器、绘图编辑器、代码编辑器和数学编辑器。你可以在各个面板之间自由移动创意模块,或者在同一个面板内移动!
产品网站: https://thinkpost.io/
标语:互动式分屏笔记和头脑风暴工具
介绍:这是一款互动式分屏块状笔记、图表和头脑风暴工具。它包含文本编辑器、绘图编辑器、代码编辑器和数学编辑器。你可以在各个面板之间自由移动创意模块,或者在同一个面板内移动!
产品网站: https://thinkpost.io/
OCR+LLM等于纸质文件自动扫描得到markdown!
GitHub - Dicklesworthstone/llm_aided_ocr: 使用大型语言模型(LLM)增强扫描PDF的Tesseract OCR输出
🧐这个项目结合了光学字符识别(OCR)和大型语言模型(LLM),通过LLM的纠错功能,大大提升了OCR文本的准确性和可读性,适用于处理扫描的PDF文件。
✨重点
●🔍 项目使用Tesseract进行OCR处理,并通过LLM对输出的文本进行错误修正,确保文本的准确性和格式一致性。
●🛠 支持本地和云端的LLM(如OpenAI和Anthropic),并提供异步处理以提高性能。
●📄 最终输出包括LLM修正后的Markdown格式文本,并提供详细的日志记录和质量评估功能,方便跟踪和调试。
➡️链接:https://github.com/Dicklesworthstone/llm_aided_ocr
GitHub - Dicklesworthstone/llm_aided_ocr: 使用大型语言模型(LLM)增强扫描PDF的Tesseract OCR输出
🧐这个项目结合了光学字符识别(OCR)和大型语言模型(LLM),通过LLM的纠错功能,大大提升了OCR文本的准确性和可读性,适用于处理扫描的PDF文件。
✨重点
●🔍 项目使用Tesseract进行OCR处理,并通过LLM对输出的文本进行错误修正,确保文本的准确性和格式一致性。
●🛠 支持本地和云端的LLM(如OpenAI和Anthropic),并提供异步处理以提高性能。
●📄 最终输出包括LLM修正后的Markdown格式文本,并提供详细的日志记录和质量评估功能,方便跟踪和调试。
➡️链接:https://github.com/Dicklesworthstone/llm_aided_ocr
不要再只卷文字输入啦,阿里开源了直接支持语音输入提问的千问多模态大语言模型~!🥹
Qwen2-Audio:开启语音对话! | Qwen
🧐Qwen2-Audio 是 Qwen-Audio 的升级版本,支持语音聊天和音频分析功能,能够处理超过8种语言的输入,并且可以直接通过语音指令与用户互动。
➡️链接:http://qwenlm.github.io/zh/blog/qwen2-audio/
✨重点
●🎙 Qwen2-Audio 支持无需自动语音识别(ASR)模块的语音指令输入,实现直接的语音聊天。
●🌍 该模型支持多种语言和方言,如中文、英语、粤语、法语等,扩大了语言处理的适用范围。
●🔍 除了语音交互,Qwen2-Audio 还可以进行音频分析,能够识别语音、声音和音乐中的信息,应用广泛。
Qwen2-Audio:开启语音对话! | Qwen
🧐Qwen2-Audio 是 Qwen-Audio 的升级版本,支持语音聊天和音频分析功能,能够处理超过8种语言的输入,并且可以直接通过语音指令与用户互动。
➡️链接:http://qwenlm.github.io/zh/blog/qwen2-audio/
✨重点
●🎙 Qwen2-Audio 支持无需自动语音识别(ASR)模块的语音指令输入,实现直接的语音聊天。
●🌍 该模型支持多种语言和方言,如中文、英语、粤语、法语等,扩大了语言处理的适用范围。
●🔍 除了语音交互,Qwen2-Audio 还可以进行音频分析,能够识别语音、声音和音乐中的信息,应用广泛。
VideoLingo-全自动视频搬运工具
VideoLingo是一款自动化的下载、翻译、配乐的视频工具
主要:
- 🍖 全自动视频搬运工,生成 Netflix 品质的字幕!
- 🎤 克隆自己的声音进行配音!
- ✨ 在 streamlit 中点击-完成!
Github:https://github.com/Huanshere/VideoLingo
特点
- 使用 NLP 和 LLM 进行字幕分割
- 智能术语知识库,实现上下文感知翻译
- 三步翻译过程:直接翻译 – 反思 – 改进
- 精确的单词级字幕对齐
- 极低成本:仅需 0.1 元即可创作 5 分钟的跨语言字幕
- GPT-SoVits 高质量的个性化配音
- 开发者友好:逐步结构化文件,便于自定义
VideoLingo是一款自动化的下载、翻译、配乐的视频工具
主要:
- 🍖 全自动视频搬运工,生成 Netflix 品质的字幕!
- 🎤 克隆自己的声音进行配音!
- ✨ 在 streamlit 中点击-完成!
Github:https://github.com/Huanshere/VideoLingo
特点
- 使用 NLP 和 LLM 进行字幕分割
- 智能术语知识库,实现上下文感知翻译
- 三步翻译过程:直接翻译 – 反思 – 改进
- 精确的单词级字幕对齐
- 极低成本:仅需 0.1 元即可创作 5 分钟的跨语言字幕
- GPT-SoVits 高质量的个性化配音
- 开发者友好:逐步结构化文件,便于自定义
v0 发布一个基于聊天的网页开发助手 可生成用户界面、自动编写运行代码
v0 发布一个基于聊天的网页开发助手,你可以通过聊天的方式与v0互动,让它帮助调试代码、回答开发问题、生成代码等,专门用于前端开发领域,可以为你提供关于这些技术的深入指导和帮助。无论是编写代码、优化性能、部署应用,还是解决技术难题,v0都能为你提供专业的支持和建议。
它拥有丰富的TypeScript、React、Next.js、Vercel等前端技术的知识。你可以把v0视为你个人的web开发助手,能够帮助你处理与web开发相关的各种问题,提供建议、解决方案和技术支持。
v0可以根据你的需求执行以下几种任务:
1. 生成用户界面(UI):如果你请求v0生成某种类型的UI(如表单、按钮、布局等),它可以为你编写相应的代码,并生成UI的代码片段。
2. 运行代码:v0可以帮助你执行或运行代码段,提供实时反馈,帮助你调试或验证代码的功能。
3. 回答编程相关问题:你可以向v0提出关于web开发、前端技术(如TypeScript、React、Next.js等)的任何问题,v0会一步步为你解答,帮助你解决技术问题。
每当你访问v0时,默认会进入聊天界面,这样你可以通过聊天的方式与v0互动,进行代码生成、问题解答或其他开发相关的操作。
如果你选择将v0.dev/chat设置为默认界面,之后每次使用v0时都会首先进入聊天模式。当然,如果你不想使用聊天界面,可以随时点击你的头像,然后关闭这个设置,恢复到你喜欢的其他界面。
在线体验:https://v0.dev/chat
v0 发布一个基于聊天的网页开发助手,你可以通过聊天的方式与v0互动,让它帮助调试代码、回答开发问题、生成代码等,专门用于前端开发领域,可以为你提供关于这些技术的深入指导和帮助。无论是编写代码、优化性能、部署应用,还是解决技术难题,v0都能为你提供专业的支持和建议。
它拥有丰富的TypeScript、React、Next.js、Vercel等前端技术的知识。你可以把v0视为你个人的web开发助手,能够帮助你处理与web开发相关的各种问题,提供建议、解决方案和技术支持。
v0可以根据你的需求执行以下几种任务:
1. 生成用户界面(UI):如果你请求v0生成某种类型的UI(如表单、按钮、布局等),它可以为你编写相应的代码,并生成UI的代码片段。
2. 运行代码:v0可以帮助你执行或运行代码段,提供实时反馈,帮助你调试或验证代码的功能。
3. 回答编程相关问题:你可以向v0提出关于web开发、前端技术(如TypeScript、React、Next.js等)的任何问题,v0会一步步为你解答,帮助你解决技术问题。
每当你访问v0时,默认会进入聊天界面,这样你可以通过聊天的方式与v0互动,进行代码生成、问题解答或其他开发相关的操作。
如果你选择将v0.dev/chat设置为默认界面,之后每次使用v0时都会首先进入聊天模式。当然,如果你不想使用聊天界面,可以随时点击你的头像,然后关闭这个设置,恢复到你喜欢的其他界面。
在线体验:https://v0.dev/chat
1️⃣视频换脸工具 roop
https://github.com/s0md3v/roop
提供一张图片就行了,不需要数据集,也不需要训练
2️⃣翻译+配音工具 pyvideotrans
https://github.com/jianchang512/pyvideotrans
支持切换不同的语音识别、文字翻译、文字合成语音工具
3️⃣唇形同步工具 wa2lip
https://github.com/Rudrabha/Wav2Lip
唇形同步之后,嘴巴会变得有些奇怪,可以用另外一个开源工具
GFPGAN 进行面部修复
https://github.com/TencentARC/GFPGAN
类似老照片修复技术
4️⃣一键解说并剪辑视频
https://github.com/linyqh/NarratoAI
影视解说工具,基于LLM实现文案撰写、自动化视频剪辑、配音和字幕生成的一站式流程,助力高效内容创作
https://github.com/s0md3v/roop
提供一张图片就行了,不需要数据集,也不需要训练
2️⃣翻译+配音工具 pyvideotrans
https://github.com/jianchang512/pyvideotrans
支持切换不同的语音识别、文字翻译、文字合成语音工具
3️⃣唇形同步工具 wa2lip
https://github.com/Rudrabha/Wav2Lip
唇形同步之后,嘴巴会变得有些奇怪,可以用另外一个开源工具
GFPGAN 进行面部修复
https://github.com/TencentARC/GFPGAN
类似老照片修复技术
4️⃣一键解说并剪辑视频
https://github.com/linyqh/NarratoAI
影视解说工具,基于LLM实现文案撰写、自动化视频剪辑、配音和字幕生成的一站式流程,助力高效内容创作
🎧 聆听最美妙的声音:AI 配音神器 Eleven Labs Reader,现已支持中文
作为音频生成领域的超级团队 Eleven Labs 不久前推出了这款Reader 应用:
- 你将使用世界级的AI语音,收听文章、PDF、ePub或任何文本。
- 无论在通勤、运动或其他任何场景下,上传内容,为文本内容配音,即可随时随地收听。
- 完全免费,支持iOS 和Android
🔗 下载地址:https://elevenlabs.io/text-reader
作为音频生成领域的超级团队 Eleven Labs 不久前推出了这款Reader 应用:
- 你将使用世界级的AI语音,收听文章、PDF、ePub或任何文本。
- 无论在通勤、运动或其他任何场景下,上传内容,为文本内容配音,即可随时随地收听。
- 完全免费,支持iOS 和Android
🔗 下载地址:https://elevenlabs.io/text-reader
YouDub-webui!- 一款视频中文化工具
提供一整套视频中文化工具包,包括视频下载、语音识别、字幕翻译、AI声音克隆、视频处理、自动上传等一系列流程!
https://github.com/liuzhao1225/YouDub-webui
提供一整套视频中文化工具包,包括视频下载、语音识别、字幕翻译、AI声音克隆、视频处理、自动上传等一系列流程!
https://github.com/liuzhao1225/YouDub-webui
FeedCraft 是一个简单、强大的RSS 源处理工具,他可以作为一个中间件处理你的RSS源. 你可以用它来翻译、提取正文、模拟浏览器来渲染那些动态生成的网页并提取全文、AI生成文章摘要等
https://github.com/Colin-XKL/FeedCraft
https://github.com/Colin-XKL/FeedCraft