EmotiVoice 是一款功能强大的现代开源文本转语音引擎

2023年11月23日下午3:48 • 工具软件

EmotiVoice 是一款功能强大的现代开源文本转语音引擎。EmotiVoice 提供中英文两种语言，超过 2000 种不同的声音。最突出的功能是情感合成，允许您创建具有多种情感的语音，包括快乐、兴奋、悲伤、愤怒等。

提供易于使用的网络界面。还有一个用于批量生成结果的脚本接口。

快速开始

EmotiVoice Docker 镜像

尝试 EmotiVoice 最简单的方法是运行 docker 镜像。您需要一台配备 NVidia GPU 的机器。如果您尚未这样做，请按照 Linux 或 Windows WSL2 的说明设置 NVidia 容器工具包。然后可以运行 EmotiVoice，

docker run -dp 127.0.0.1:8501:8501 syq163/emoti-voice:latest

现在打开浏览器并导航至 http://localhost:8501 即可开始使用 EmotiVoice 强大的 TTS 功能。

完整安装

conda create -n EmotiVoice python=3.8 -yconda activate EmotiVoicepip install torch torchaudiopip install numpy numba scipy transformers==4.26.1 soundfile yacs g2p_en jieba pypinyin

准备模型文件

git lfs installgit lfs clone https://huggingface.co/WangZeJun/simbert-base-chinese WangZeJun/simbert-base-chinese

或者，您可以运行：

mkdir -p WangZeJun/simbert-base-chinesewget https://huggingface.co/WangZeJun/simbert-base-chinese/resolve/main/config.json -P WangZeJun/simbert-base-chinesewget https://huggingface.co/WangZeJun/simbert-base-chinese/resolve/main/pytorch_model.bin -P WangZeJun/simbert-base-chinesewget https://huggingface.co/WangZeJun/simbert-base-chinese/resolve/main/vocab.txt -P WangZeJun/simbert-base-chinese

推理

您必须下载预训练的模型，然后运行：

mkdir -p outputs/style_encoder/ckptmkdir -p outputs/prompt_tts_open_source_joint/ckpt

并将 g_* 、 do_* 放在 outputs/prompt_tts_open_source_joint/ckpt 下，并将 checkpoint_* 放在 outputs/style_encoder/ckpt 中。
推理文本格式为 <speaker>|<style_prompt/emotion_prompt/content>|<phoneme>|<content> 。

推理文本示例：Maria_Kasper|Happy|<sos/eos> [IH0] [M] [AA1] [T] engsp4 [V] [OY1] [S] engsp4 [AH0] engsp1 [M] [AH1] [L] [T] [IY0] engsp4 [V] [OY1] [S] engsp1 [AE1] [N] [D] engsp1 [P] [R] [AA1] [M] [P] [T] engsp4 [K] [AH0] [N] [T] [R] [OW1] [L] [D] engsp1 [T] [IY1] engsp4 [T] [IY1] engsp4 [EH1] [S] engsp1 [EH1] [N] [JH] [AH0] [N] . <sos/eos>|Emoti-Voice – a Multi-Voice and Prompt-Controlled T-T-S Engine 。

您可以通过 python frontend_en.py data/my_text.txt > data/my_text_for_tts.txt 获取音素。
然后运行：

TEXT=data/inference/textpython inference_am_vocoder_joint.py \--logdir prompt_tts_open_source_joint \--config_folder config/joint \--checkpoint g_00140000 \--test_file $TEXT

合成语音位于 outputs/prompt_tts_open_source_joint/test_audio 下。

或者，如果您只想使用交互式 TTS 演示页面，请运行：

pip install streamlitstreamlit run demo_page.py

项目链接

https://github.com/netease-youdao/EmotiVoice

原创文章，作者：校长，如若转载，请注明出处：https://www.yundongfang.com/Yun267404.html

prompt 文本运行

打赏

微信扫一扫不于多少！

支付宝扫一扫礼轻情意重

HeyGen实现流程中的语音克隆 XTTS v2

上一篇 2023年11月23日

Taxy 使用 GPT-4 来控制您的浏览器并代表您执行重复操作

下一篇 2023年11月23日

工具软件

WhatsApp将获得基于文本的状态更新的新界面以及转发和快退视频的能力

WhatsApp 通过定期更新不断改进。最近的报道表明，WhatsApp正在开发一个新的状态更新界面，为基于文本的更新提供自己的空间。此外，WhatsApp 还改进了平台上的视频播…

2024年4月6日
Excel不断更改数字：如何修复

Excel 具有此功能，它可以自动将单元格中的数字转换为特定日期。但是，如果 Excel 开始将数字更改为日期格式，这个有用的功能很快就会成为您头疼的原因！此问题可能会影响整个行或…

2024年3月31日 • 苹果Apple
工具软件

Open-Sora 开源替代 OpenAI 的 Sora 文本转视频 AI

Open-Sora 开源替代 OpenAI 的 Sora 文本转视频 AI 继今年早些时候推出 Sora 之后，OpenAI 强大的文本到视频 AI 模型以 Open-Sora 的…

2024年3月26日
Microsoft.NET Error HRESULT error 0xc8000222：如何修复

Microsoft .NET Framework 被许多 Windows 应用程序使用。但是，在计算机上安装 .NET Framework 时，可能会遇到以下消息“安装未成功。HR…

2024年3月25日 • 微软Microsoft
什么是inetcpl.cpl以及如何修复其错误

netcpl.cpl 或 Internet 属性是一个内置实用程序，允许用户配置与 Internet 相关的设置，包括安全、隐私、证书、VPN 和加载项。它存储在以下位置：C:\W…

2024年3月18日 • 工具软件
工具软件

为 Claude 3、ChatGPT 和 Gemini 发布的终极 AI 提示库

为 Claude 3、ChatGPT 和 Gemini 发布的终极 AI 提示库提示是人工智能（AI）的命脉，可让您从大型语言模型中获得最佳结果。如果您正在寻找在尖端技术和 …

2024年3月15日
苹果Apple

在 iPhone 上从 PDF 获取文本的 3 种方法

Apple 的实况文本功能可以识别“照片”或“相机”应用程序中的文本、手写笔记和数字，并允许您将这些信息粘贴到任何其他应用程序上。但是，当您处理 PDF 并想从中提取文本时，您会怎…

2024年2月22日
如何使用截图工具从图像中编辑和提取文本 Windows 11

与许多其他应用程序一样，Microsoft正在更新和简化Windows的本机屏幕截图应用程序Snipping Tool，并提供一些新功能。“文本操作”是一项基于 OCR 的新功能，…

2024年2月2日 • Win 11
在 iPhone 上为文本添加下划线的 11 种方法

在计算机上进行文本编辑非常简单。您可以使用 Command（在 CTRL 上）+ U 键盘快捷键为部分文本添加下划线。不过，在你的手机上，情况有点不同。由于您在手机上处理很多应用程…

2024年1月19日 • 苹果Apple
工具软件

Google Gemini Pro 与 OpenAI ChatGPT-4 AI 模型比较

自去年年底推出并随后在 Google Bard 中推出以来，谷歌最新的 AI 模型 Gemini Pro 是 OpenAI 的 ChatGPT 的主要竞争对手，提供非常相似的多模态…

2024年1月2日
工具软件

如何将笔记本电脑设置为家庭服务器

如果您正在考虑将笔记本电脑用作家庭服务器的可能性，您会很高兴知道 Wolfgang 创建了一个很棒的教程和概述，介绍了您如何使用 Ninker N16 Pro 笔记本电脑创建家庭服…

2023年12月29日
TextDiffuser-2：为文本渲染释放语言模型的力量

TextDiffuser-2：为文本渲染释放语言模型的力量可以稳定在扩散模型中生成指定位置和风格的英文文本，它是借助的微调后的大语言模型来规划文本布局，以及编码文本的位置。

工具软件 2023年12月26日
工具软件

无法检测的 AI 评论：功能强大、易于使用的反 AI 检测器

多亏了人工智能工具，写作从未如此简单。无论您是想批量创建短篇文章还是长篇文章，您都可以在几秒钟内生成最令人惊叹的文本。但是，您的一些读者使用 AI 检测器，甚至可以接收到最轻微的…

2023年12月19日
工具软件

充分利用 Google Bard 的 12 个技巧

您可以使用这些技巧来充分利用 Google Bard。Bard 是 Google AI 的大型语言模型，是一款功能强大的工具，可用于多种用途。它可以生成文本、翻译语言、编写不同类型…

2023年12月19日
工具软件

如何设置 Google Gemini Pro API 密钥和 AI 模型 – 初学者指南

正如本月早些时候宣布的那样，谷歌提供了新的Gemini Pro人工智能开发人员，企业和个人使用。如果您有兴趣创建 AI 驱动的应用程序、自动化和服务，您会很高兴知道 Gemini …

2023年12月16日
Fish Speech：全新的文本转语音(TTS)解决方案

项目简介 Fish Speech：全新的文本转语音(TTS)解决方案，具有高度自定义和灵活性，支持Linux和Windows系统，需要2GB的GPU内存进行推理，使用Flash-A…

工具软件 2023年12月16日
工具软件

Google Groups 正在放弃对 Usenet 的支持，这是一件好事

谷歌宣布本周，它计划切断与Google Groups中Usenet的联系。自 2024 年 2 月 22 日起，Google 网上论坛用户无法再向 Usenet 群组发布内容、订阅…

2023年12月16日
谷歌Google

Google Imagen 2 文本到图像 AI 艺术生成器现已在 Vertex AI 上推出

Google Cloud 最近升级了其图像生成功能，推出了 Imagen 2，这是一种文本到图像的技术，现在可供 Vertex AI 客户使用。该技术的新版本提供了改进的图像质量，…

2023年12月15日
苹果Apple

iOS 17.2：如何禁用 iPhone 内联预测文本

Apple 在 iOS 17 中为 iPhone 添加了内联预测文本，但没有包括独立于键盘上方的预测建议将其关闭的方法。在最新的 iOS 17.2 更新中，情况发生了变化。苹果已…

2023年12月14日
工具软件

Google Imagen 2 文本到图像 AI 艺术生成器现已在 Vertex AI 上推出

Google Cloud 最近升级了其图像生成功能，推出了 Imagen 2，这是一种文本到图像的技术，现在可供 Vertex AI 客户使用。该技术的新版本提供了改进的图像质量，…

2023年12月14日
微软Microsoft

Windows 11 的记事本在状态栏上获得字符数

Windows 11 的记事本得到了一些改进。这包括状态栏上的字符数，以及从资源管理器访问它的快速方法。 Windows中的纯文本编辑器已经存在了近40年，但Microsoft直到…

2023年12月10日
绕过 AI 内容检测器的 10 种最佳无法检测的 AI 写作工具

生成式人工智能是内容和文案写作领域的下一件大事，但这并不意味着每个人都乐于收到明显由人工智能撰写的文章。一些学校和企业主甚至使用人工智能检测器——寻找人工智能写作特征的工具——并会…

2023年12月8日 • 工具软件
工具软件

BypassAI：对顶级旁路 AI 检测工具的客观回顾

人工智能驱动的内容生成世界在不断发展。主流的起点可能是 ChatGPT，但从那时起我们已经取得了长足的进步。我们现在拥有众多的 AI 写作工具、AI 内容检查器，以及最近的 AI …

2023年12月8日
BypassGPT 评论：领先的无法检测的 AI 写作工具

ChatGPT 和 Bard 等 AI 写作工具彻底改变了内容创作。他们有效地制作各种内容，从博客文章到学术论文。但有一个问题。人工智能作家倾向于重复使用相同类型的单词、短语和结…

2023年12月8日 • 工具软件
12个方便的iPhone提示和技巧

具有指向和说话功能的增强型放大镜应用程序：对于使用最新 iPhone Pro 机型（12 及更高版本）和 iPad Pro 2020 的用户，放大镜应用程序已获得重大升级。得益于激…

苹果Apple 2023年12月4日