每日精粹

09:54 · 2024年4月11日 · 周四

Parler-TTS ：一个完全开源的的高质量TTS模型

Parler-TTS 是一个由 Hugging Face 开发的轻量级文本转语音（TTS）模型，能够以给定说话者的风格（性别、音调、说话风格等）生成高质量、自然 sounding 的语音。它是基于 Dan Lyth 和 Simon King 发表的论文《Natural language guidance of high-fidelity text-to-speech with synthetic annotations》的工作复现，两位作者分别来自 Stability AI 和爱丁堡大学。

与其他TTS模型不同，Parler-TTS 完全开源发布，包括数据集、预处理、训练代码和权重。

● 高质量、自然 sounding 的语音输出：Parler-TTS 能够生成高质量且听起来非常自然的语音。它可以根据给定说话者的风格（如性别、音调、说话风格等）进行定制，以产生与特定人声非常相似的输出。
● 灵活的使用和部署：提供了易于使用的安装和部署方法，只需一行代码即可安装。此外，它还提供了交互式演示和详细的训练指南，使用户能够快速上手并自定义模型。
● Datasets数据集Parler-TTS 提供了开源的注释语音数据集，范围从1,000小时到即将到达的50,000小时。这为训练和改进TTS模型提供了丰富的资源。

GitHub：https://github.com/huggingface/parler-tts

模型下载：https://huggingface.co/parler-tts

在线体验：https://huggingface.co/spaces/parler-tts/parler_tts_mini

GitHub

GitHub - huggingface/parler-tts: Inference and training library for high-quality TTS models.

Inference and training library for high-quality TTS models. - huggingface/parler-tts

23:47 · 2024年4月10日 · 周三

video-subtitle-remover 一款基于AI技术，将视频中的硬字幕去除的软件。

https://github.com/YaoFANGUK/video-subtitle-remover

- 无损分辨率将视频中的硬字幕去除，生成去除字幕后的文件
- 通过超强AI算法模型，对去除字幕文本的区域进行填充（非相邻像素填充与马赛克去除）
- 支持自定义字幕位置，仅去除定义位置中的字幕（传入位置）
- 支持全视频自动去除所有文本（不传入位置）
- 支持多选图片批量去除水印文本

GitHub

GitHub - YaoFANGUK/video-subtitle-remover: 基于AI的图片/视频硬字幕去除、文本水印去除，无损分辨率生成去字幕、去水印后的图片/视频文件。无需申请第三方API，本地实现。AI-based tool for removing…

基于AI的图片/视频硬字幕去除、文本水印去除，无损分辨率生成去字幕、去水印后的图片/视频文件。无需申请第三方API，本地实现。AI-based tool for removing hard-coded subtitles and text-like watermarks from videos or Pictures. - YaoFANGUK/video-subtitle-remover

23:47 · 2024年4月10日 · 周三

Harper-AI视频生成器
介绍
Harper是近期推出的一项AI生成视频服务，支持文本生成视频、图片制作动画、重绘视频等
官网：https://haiper.ai
使用比较简单，页面中可以找到输入框及功能说明，可以在左列中查看生成历史记录。
不同的模式可以带来不同的视频创造效果
使用前建议先查看首页中的视频提示词

haiper.ai

Haiper - AI Video Generator

AI powered video creation platform

23:36 · 2024年4月10日 · 周三

🎵 Text 2 music 重量级新玩家 Udio 隆重登场～

Udio 是一款用于音乐创作和共享的应用程序，通过直观、强大的文本提示功能，你可以用自己喜欢的风格创作出令人惊叹的音乐。由前 Google DeepMind 的顶尖 AI 研究人员和工程师创立。

用任何风格的富有表现力的人声让你的歌词栩栩如生。从高亢的福音到沙哑的布鲁斯，从梦幻的流行乐到柔滑的说唱，Udio 应有尽有。

探索非凡的流派和风格范围。有劲爆的 EDM、摇摆的钢琴爵士乐、温和的新灵魂乐和极端金属乐。Udio 的目标是成为音乐人和非音乐人的革命性工具，V1 模型功能强大，但并不完美。

目前 Udio 是一个免费的测试版产品，每个人每月可以生成多达1200 首歌曲。

🔗不妨试试看：https://www.udio.com

Udio

Udio | AI Music Generator - Official Website

Discover, create, and share music with the world. Use the latest technology to create AI music in seconds.

15:29 · 2024年4月9日 · 周二

🆔 项目名称：MoneyPrinterTurbo

⭐️ 项目功能：AI 视频

📁 项目简介：一款可以一键生成AI短视频的开源项目。只需提供一个视频主题或关键词，就可以全自动地生成视频文案、视频素材、视频字幕、视频背景音乐，并最终合成一个高清的短视频。

支持多种高清视频尺寸、批量视频生成、视频片段时长设置、中英文视频文案、多种语音合成、字幕生成、背景音乐，且视频素材高清无版权。

还支持OpenAI、moonshot、Azure、gpt4free、one-api、通义千问、Google Gemini、Ollama等多种模型接入。

https://github.com/harry0703/MoneyPrinterTurbo

GitHub

GitHub - harry0703/MoneyPrinterTurbo: 利用AI大模型，一键生成高清短视频 Generate short videos with one click using AI LLM.

利用AI大模型，一键生成高清短视频 Generate short videos with one click using AI LLM. - harry0703/MoneyPrinterTurbo

23:12 · 2024年4月3日 · 周三

🔥整理了一下我公开发表过的prompt：

🍠1. 小红书爬虫数据分析（用浏览器插件爬取小红书笔记数据，生成excel表格以后丢给大模型分析，作为文科生，不懂数据清洗和什么向量数据之类的，这是我能想到的数据分析的方法🤣）
🔗链接：https://web.okjike.com/originalPost/66062d91de5f2873487edd65

🍠2. 小红书笔记创作（这个是我尝试让小红书创作文案的第一个尝试，不过效果一般，不能期待大模型有太个性化的输出，文案还要自己写）
🔗链接：https://web.okjike.com/originalPost/65bb686337f7165b21a6d4dc

📚3. 渐进式阅读助手（这条上了即刻小镇日报，是我没想到的，本来我是用在Obsidian里面做笔记用的。格式相对比较乱😭，需要自己再根据自己需求调整）
🔗链接：https://web.okjike.com/originalPost/65d819fa38849f879fe722cf

📒4. 文章总结（简单易用，适合用来总结含有案例，数据的文章）
🔗链接：https://web.okjike.com/originalPost/658cd1f23af12f55ba7d8973

🏷5. 公众号文章阅读（我主要用来萃取公众号文章的重点内容，包含元数据，自动生成相应标签，识别关键术语，便于做笔记）
🔗链接：https://web.okjike.com/originalPost/65b2097f3b9c66cae4c786cc

👨‍🏫6. 法考助手（做了一个专门解答法考教材里的问题的prompt，辅助法考学习，用在Gemini 1.5 pro里面）
🔗链接：https://web.okjike.com/originalPost/660bb46537f7165b2198d170

🤖7. 文章萃取筛选机器人（我在coze上自己搓了一个bot，使用频率最高，我放在dicord里面用，我的需求是把躺在稍后读列表里面的文章链接丢给他，萃取关键信息+有价值的见解，然后我再决定是否继续阅读，累计有300人使用）
🔗链接：https://www.coze.com/store/bot/7334310207146721285?panel=1&bid=MDQEEEiFix85U2v0MQbWUFWqukEEHvQDnQaBvM9xqLWc2YsBTAbPTUuXKayACGHlTeeqmwQA&share=1&from=others

🏠8. COSTAR框架提示词生成助手（用来生成提示词）
🔗链接：https://web.okjike.com/originalPost/65bc6687a922aa28d0c28961

即刻

即刻 - 记录我遇见你

15:51 · 2024年3月23日 · 周六

玩赚 AI 实验室

https://yunyinghui.feishu.cn/wiki/WhelwZnxQi55mpkOzatc3Xran5b?view=vewvQPh3Aa

yunyinghui.feishu.cn

Docs

13:22 · 2024年3月22日 · 周五

gpt-prompt-engineer

帮助你生成、优化和测试 Prompt，支持GPT和Claude，并且可以优化 Claude 3 Haiku 的提示词，帮助达到很好的效果。值得一提的是， Claude 3 Haiku 价格比 GPT-3.5 还便宜，但是性能不错，并且支持视觉模型。

https://github.com/mshumer/gpt-prompt-engineer

GitHub

GitHub - mshumer/gpt-prompt-engineer

Contribute to mshumer/gpt-prompt-engineer development by creating an account on GitHub.

13:14 · 2024年3月22日 · 周五

VideoSora

将文本和语音转成超级漂亮的视频

https://videosora.app/zh-cn/

videosora.app

GreatFireVPN - Bypass Censorship in China, Russia, Iran

Trusted VPN for bypassing internet censorship. 10+ years fighting the Great Firewall of China. 30-day free trial.

13:11 · 2024年3月22日 · 周五

emgithub

打开 GitHub 仓库某个文件的页面，将地址栏的 github.com 改成 emgithub.com，就可以获得当前文件的嵌入代码，像嵌入 GitHub Gist 代码一样嵌入到页面中。

https://github.com/yusanshi/emgithub

GitHub

GitHub - yusanshi/emgithub: Embed a file from GitHub repository just like GitHub Gist.

Embed a file from GitHub repository just like GitHub Gist. - yusanshi/emgithub

13:09 · 2024年3月22日 · 周五

Frogmouth

命令行的 Markdown 阅读器

https://github.com/Textualize/frogmouth

GitHub

GitHub - Textualize/frogmouth: A Markdown browser for your terminal

A Markdown browser for your terminal. Contribute to Textualize/frogmouth development by creating an account on GitHub.

13:06 · 2024年3月22日 · 周五

Easy Highlight - 自动高亮网页中的特定关键词

在任意网页上自动检测并高亮您的自定义列表中的多个单词和词组

Easy Highlight是一款自动化的Chrome扩展程序，能够在任何网页上轻松地对关键词进行高亮显示！使用我们的扩展程序，您可以轻松地高亮您感兴趣的关键词，非常适合各种用户，包括人力资源专业人员、学者、学生以及任何想要改善在线阅读体验的人士。您也可以高亮自己公司的名称和业务名，以便随时注意到相关的信息。

✔️功能：
1.轻松自动高亮：只需输入您想要高亮的任何关键词，我们的系统就会在您浏览网页时自动高亮它们。

2.可读性优先：我们的扩展程序的主要功能是为每个关键词自动生成背景颜色，遵循Web内容可访问性指南（版本1.0），以确保最大程度的可读性。再也不用担心由于颜色对比度问题而难以阅读的文字了。

3.区分大小写：我们提供了区分大小写的选项，这意味着扩展程序将正确匹配关键词，无论它们的大小写如何。因此，您可以放心，即使关键词与您输入的大小写不同，它们也会被高亮显示。

4.用户友好的设计：使用Easy Highlight非常容易！它被设计为超级用户友好和直观的。您不必担心复杂的设置或陡峭的学习曲线。

5.一键禁用：只需单击一下，您就可以轻松关闭高亮显示功能，无需担心它会影响您的浏览体验。

6.高亮单个单词或短语：Easy Highlight支持单个单词和短语的高亮。

😊如何使用：
1.输入您想要高亮的关键词或短语，然后按回车键。
2.要删除关键词，只需在扩展程序界面上单击它即可。

https://chromewebstore.google.com/detail/jdobpplllaoakelgogmmjnnpnaahnhjn?hl=zh-CN

Google

Easy Highlight - Automatic Keyword Highlight

Automatically detect and highlight multiple words and phrases from your customized list on any webpage

13:02 · 2024年3月22日 · 周五

pagenote一页一记

在任意网页内，摘录重点、划线批注。打造个人笔记系统。

1、文本高亮
高亮网页里的关键内容。支持多种颜色，可锚点定位。
2、网页笔记
一页一记：把笔记留在网页里，不用单独在记事本存储。下次打开笔记自动出现。
3、智能书签
根据标记智能创建、删除书签。还可为网页添加标签，方便管理、查找。
4、网页快照
对网页进行快照保存。刻下当前访问内容，网页内容变了也能查看历史记录。
5、导入导出
支持备份、还原，还可导出多种格式：JSON、Markdown
让好友一眼就知道你的分享重点。可区分仅分享标记或分享整个网页。
7、个人主页
拥有自己的私人网页管理主页。管理你自己的知识星球。
8、不要求登录，用户自己掌握数据，可离线运行

https://chromewebstore.google.com/detail/hpekbddiphlmlfjebppjhemobaopekmp

Google

pagenote一页一记

在任意网页内，摘录重点、划线批注。打造个人笔记系统。

00:00 · 2024年3月15日 · 周五

nginx-proxy-manager

该项目是一个预构建的 Docker 镜像，可以让您轻松地将您在家中或其他地方运行的网站转发出去，包括免费 SSL，而无需对 Nginx 或 Letsencrypt 有太多了解。

https://github.com/NginxProxyManager/nginx-proxy-manager

GitHub

GitHub - NginxProxyManager/nginx-proxy-manager: Docker container for managing Nginx proxy hosts with a simple, powerful interface

Docker container for managing Nginx proxy hosts with a simple, powerful interface - NginxProxyManager/nginx-proxy-manager

23:58 · 2024年3月14日 · 周四

chatnio: 开源的一站式AI前端解决方案

这是一个开源的前端项目。AI 一站式解决方案，一站式 Chat + 中转 API 站点，支持 OpenAI，Midjourney，Claude，讯飞星火，Stable Diffusion，DALL·E，ChatGLM，通义千问，腾讯混元，360 智脑，百川 AI，火山方舟，新必应，Gemini，Moonshot 等模型，支持对话分享，自定义预设，云端同步，模型市场，支持弹性计费和订阅计划模式，支持图片解析，支持联网搜索，支持模型缓存，丰富美观的后台管理与仪表盘数据统计。

https://github.com/Deeptrain-Community/chatnio/blob/main/README_zh-CN.md

GitHub

chatnio/README_zh-CN.md at main · Deeptrain-Community/chatnio

🚀 Next Generation AI One-Stop Internationalization Solution. 🚀 下一代 AI 一站式 B/C 端解决方案，支持 OpenAI，Midjourney，Claude，讯飞星火，Stable Diffusion，DALL·E，ChatGLM，通义千问，腾讯混元，360 智脑，百川 AI，火山方舟，新必应，Gemini，Moonshot ...

22:47 · 2024年3月13日 · 周三

VideoTrans视频翻译和配音
一键字幕识别+翻译+配音=带新语言字幕和配音的视频

【翻译视频并配音】根据需要设置各个选项，自由配置组合，实现翻译和配音、自动加减速、合并等
【识别字幕不翻译】选择视频文件，选择视频源语言，则从视频【语音中识别出文字】并自动导出字幕文件到目标文件夹
【提取字幕并翻译】选择视频文件，选择视频源语言，设置想翻译到的目标语言，则从【视频语音中识别出文字】并翻译为目标语言，然后导出双语字幕文件到目标文件夹
【字幕和视频合并】选择视频，然后将已有的字幕文件拖拽到右侧字幕区，将源语言和目标语言都设为字幕所用语言、然后选择配音类型和角色，开始执行
【为字幕创建配音】将本地的字幕文件拖拽到右侧字幕编辑器，然后选择目标语言、配音类型和角色，将生成配音后的音频文件到目标文件夹
【音视频识别文字】将视频或音频拖拽到识别窗口，将识别出文字并导出为srt字幕格式
【将文字合成语音】将一段文字或者字幕，使用指定的配音角色生成配音
【从视频分离音频】将视频文件分离为音频文件和无声视频
【音视频字幕合并】音频文件、视频文件、字幕文件合并为一个视频文件
【音视频格式转换】各种格式之间的相互转换
【文字字幕翻译】将文字或srt字幕文件翻译为其他语言
【人声背景乐分离】将视频中的人声和背景音乐分别分离出来，生成2个音频文件
【下载油管视频】可从youtube上下载视频

https://github.com/jianchang512/pyvideotrans

GitHub

GitHub - jianchang512/pyvideotrans: Translate the video from one language to another and embed dubbing & subtitles.

Translate the video from one language to another and embed dubbing & subtitles. - jianchang512/pyvideotrans

22:42 · 2024年3月13日 · 周三

Open Assistant API 是一个开源自托管的 AI 智能助手 API，兼容 OpenAI 官方接口，可以直接使用 OpenAI 官方的 Client 构建 LLM 应用。

支持 One API 可以用其接入更多商业和私有模型。

https://github.com/Tuanzi1015/open-assistant-api/blob/main/README_CN.md

GitHub

open-assistant-api/README_CN.md at main · Tuanzi1015/open-assistant-api

The Open Assistant API is a ready-to-use, open-source, self-hosted agent/gpts orchestration creation framework, supporting customized extensions for LLM, RAG, function call, and tools capabilities....

16:50 · 2024年3月13日 · 周三

Puter 概览 🌟

Puter 是一个**开源桌面环境**，它在浏览器中运行，提供了一系列丰富的功能。这个环境以其**速度快**和**高度可扩展**性著称，旨在为用户提供一个隐私保护的个人云服务。Puter 允许用户将文件、应用和游戏存储在一个安全的位置，随时随地都能访问。

**主要用途**：
1. **云存储服务**：作为 Dropbox、Google Drive、OneDrive 的高级替代品，Puter 提供了一个用户友好的界面和增强的功能。
2. **远程桌面环境**：适用于服务器和工作站，便于远程访问和管理。
3. **Web 开发平台**：可以用于构建和托管网站、Web 应用和游戏。
4. **学习社区**：Puter 还是一个开放的项目和社区，适合那些有兴趣学习 Web 开发、云计算和分布式系统等领域的人。

**资源链接**：
- GitHub 项目页：[HeyPuter/puter](https://github.com/HeyPuter/puter)
- 官方网站：[Puter.com](https://puter.com/)
- 开发文档：[Puter.js 文档](https://docs.puter.com/)

Puter 不仅仅是一个技术产品，它还致力于建立一个友好的开源社区，鼓励用户和开发者学习和分享新知。

GitHub

GitHub - HeyPuter/puter: 🌐 The Internet Computer! Free, Open-Source, and Self-Hostable.

🌐 The Internet Computer! Free, Open-Source, and Self-Hostable. - HeyPuter/puter

16:33 · 2024年3月13日 · 周三

快手也发布了一个通过拖动锚点控制视频物体和镜头运动的项目DragAnything。

与现有的运动控制技术相比，DragAnything 有几个显着的优势：

首先，基于轨迹的操作方式对用户更友好，尤其是在获取其他辅助信号（如遮罩、深度图等）较为繁琐时。用户只需在互动中绘制一条线（即轨迹）即可。

其次，我们的实体识别技术能够处理任何对象，这意味着它可以控制包括背景在内的各种实体的运动。

最后，这种实体识别技术还可以同时对多个对象实现不同的运动控制。

大量实验表明，我们的技术在 FVD、FID 和用户体验研究方面均达到了行业领先水平，特别是在对象运动控制方面，我们的方法比之前的技术（例如 DragNUWA）在人类评估中提高了 26%。

项目地址：https://weijiawu.github.io/draganything_page/

weijiawu.github.io

DragAnything

Project page for DragAnything.

16:04 · 2024年3月13日 · 周三

本文介绍了如何使用LLM IDE（Dify）快速搭建模型应用，并使用超长上下文的200K模型完成电子书翻译。作者通过准备工具、获取电子书、启动Dify IDE和配置零一万物模型等步骤，详细阐述了整个翻译过程。最后，作者提到配置模型翻译应用并开始进行翻译工作。整篇文章旨在为读者提供一个高效、便捷的电子书翻译方案。

https://soulteary.com/2024/03/13/use-yi-34b-chat-200k-model-and-dify-to-quickly-build-model-application.html

Soulteary

使用零一万物 200K 模型和 Dify 快速搭建模型应用

本篇文章，我们聊聊如何使用 LLM IDE (Dify) 快速搭建一个模型应用，以及使用超长上下文的 200K 模型，完成懒人式的电子书翻译。