HuBERT: Self-Supervised Speech Representation Learning
IEEE/ACM TASLP - 2021
HuBERT fornece contexto de representação de fala para pipelines de conversão de voz no estilo RVC.
Usuários fazendo experimentos com cores de voz, demonstrações de capas ou testes de voz de personagens
Vocais convertidos, referências vocais originais e áudio para download para demonstrações e testes de audição
Entrada
Vocais limpos, material de cover ou hastes vocais separadas por meio de uma cadeia de conversão RVC v2
Formatos de áudio
Saída
Vocais convertidos, referências vocais originais e áudio para download para demonstrações e testes de audição
Melhor para
Usuários fazendo experimentos com cores de voz, demonstrações de capas ou testes de voz de personagens
O pipeline de cobertura AI combina separação, conversão de voz RVC e mixagem. As entradas principais são um arquivo vocal e um modelo de voz alvo.
RVC v2 converte o timbre vocal de entrada no modelo de voz do personagem selecionado.
O RMVPE fornece extração de afinação para a cadeia de conversão de canto RVC.
O pipeline de cobertura de IA separa vocais/acompanhamento antes da conversão e mixagem.
IEEE/ACM TASLP - 2021
HuBERT fornece contexto de representação de fala para pipelines de conversão de voz no estilo RVC.
Interspeech - 2023
RMVPE é um estimador de pitch robusto usado em pipelines de conversão de voz cantada.
Official repository - current
As referências RVC explicam a conversão de voz baseada em recuperação e por que as escolhas de modelo, índice e F0 afetam a saída.