Real-Time Voice Cloning-5 秒克隆语音，实时生成任意语音

Real-Time Voice Cloning - 5 秒克隆语音，实时生成任意语音

机器学习/深度学习 TTS/语音合成和处理

授权协议: MIT

操作系统: 跨平台

开发语言: Python

软件简介

Real-Time Voice Cloning 是“Transfer Learning from Speaker Verification to
Multispeaker Text-To-Speech
Synthesis（SV2TTS）”论文的实现，这是一个三阶深度学习框架，允许从几秒钟的音频中创建一个数字化的语音，并使用它来调节训练的“文本转语音”模型，以推广到新的声音。

此项目中带有一个实时工作的声码器。

软件首页