Real-Time Voice Cloning - 5 秒克隆语音,实时生成任意语音


MIT
跨平台
Python

软件简介

Real-Time Voice Cloning 是“Transfer Learning from Speaker Verification to
Multispeaker Text-To-Speech
Synthesis
(SV2TTS)”论文的实现,这是一个三阶深度学习框架,允许从几秒钟的音频中创建一个数字化的语音,并使用它来调节训练的“文本转语音”模型,以推广到新的声音。

此项目中带有一个实时工作的声码器。