Vocais cover de AI · TelkNet

Voz e vocaisCarga de trabalho GPU

Vocais cover de AI

Usuários fazendo experimentos com cores de voz, demonstrações de capas ou testes de voz de personagens

Vocais convertidos, referências vocais originais e áudio para download para demonstrações e testes de audição

Créditos/uso 5Entrada de arquivo de áudioMáx. 100 MBSegundos estimados de 180-900

Entrada

Vocais limpos, material de cover ou hastes vocais separadas por meio de uma cadeia de conversão RVC v2

Formatos de áudio

mp3wavflacoggm4aaac

Saída

Vocais convertidos, referências vocais originais e áudio para download para demonstrações e testes de audição

Melhor para

Usuários fazendo experimentos com cores de voz, demonstrações de capas ou testes de voz de personagens

Modelos, parâmetros e fontes

O pipeline de cobertura AI combina separação, conversão de voz RVC e mixagem. As entradas principais são um arquivo vocal e um modelo de voz alvo.

RVC v2

RVC v2 converte o timbre vocal de entrada no modelo de voz do personagem selecionado.

RVC Project TelkNet AI-RVC adapter HuBERT

Pipeline: os vocais de origem são separados, convertidos com RVC e depois mixados com acompanhamento.
Padrões: a rota normal segue a configuração de cobertura AI-RVC incluída.
Modelo de voz: o ponto de verificação do personagem selecionado e o timbre de controle do índice.

RMVPE / hybrid F0

O RMVPE fornece extração de afinação para a cadeia de conversão de canto RVC.

RVC Project RMVPE

Pitch: estima o contorno F0 usado pelo RVC para preservar a melodia e a entonação.
Modo híbrido: pode ser combinado com outros métodos F0 quando uma fonte é difícil.
Contexto de referência: referenciado através da literatura de estimativa de pitch e comparações F0.

RoFormer / Karaoke / Demucs separation

O pipeline de cobertura de IA separa vocais/acompanhamento antes da conversão e mixagem.

python-audio-separator facebookresearch/demucs MVSep algorithms Mel-Band RoFormer BS-RoFormer HT Demucs

Primário: a separação no estilo RoFormer prepara vocais limpos para conversão.
Harmonia: a separação do Karaoke mantém os backing vocals disponíveis para mixagem.
Fallback: rotas no estilo Demucs/UVR fornecem contexto quando o material de origem é difícil.

Comparação de modelos

Modelo

Função

Por que é usado

Impacto na produção

ModeloRVC v2

RVC Project TelkNet AI-RVC adapter HuBERT

FunçãoNúcleo de conversão de voz

Por que é usadoAplica o timbre do caracter selecionado após a separação e extração de afinação.

Impacto na produçãoVocal convertido e mixagem final da capa

ModeloRMVPE / hybrid F0

RVC Project RMVPE

FunçãoExtrator F0 primário

Por que é usadoEscolhido para rastreamento de tom amigável para canto na cadeia de covers AI-RVC padrão.

Impacto na produçãoContorno de passo para conversão RVC

ModeloRoFormer vocal_rvc ensemble

python-audio-separator MVSep algorithms Mel-Band RoFormer BS-RoFormer

FunçãoLimpeza vocal antes da conversão

Por que é usadoMelhora a entrada fornecida ao RVC e preserva saídas com reconhecimento de harmonia para mixagem.

Impacto na produçãoVocais limpos, backing vocals e hastes de acompanhamento

ModeloDemucs / UVR5 fallback

facebookresearch/demucs HT Demucs python-audio-separator

FunçãoRota de segurança alternativa

Por que é usadoMantém a conversão utilizável quando um modelo ou extrator é inadequado para a fonte.

Impacto na produçãoPasso alternativo ou caminhos de separação quando a rota preferida não está disponível

Notas de papel e benchmark

HuBERT: Self-Supervised Speech Representation Learning

IEEE/ACM TASLP - 2021

HuBERT fornece contexto de representação de fala para pipelines de conversão de voz no estilo RVC.

arXiv:2106.07447

RMVPE: A Robust Model for Vocal Pitch Estimation in Polyphonic Music

Interspeech - 2023

RMVPE é um estimador de pitch robusto usado em pipelines de conversão de voz cantada.

ISCA PDF

RVC Project

Official repository - current

As referências RVC explicam a conversão de voz baseada em recuperação e por que as escolhas de modelo, índice e F0 afetam a saída.

RVC WebUI

Oficial / repositórios

RVC Project TelkNet AI-RVC adapter python-audio-separator facebookresearch/demucs MVSep algorithms

Artigos/notas técnicas

HuBERT RMVPE Mel-Band RoFormer BS-RoFormer HT Demucs

Guia de parâmetros

Modelo de voz: seleciona os pesos dos caracteres de destino e o índice de recuperação.
Mudança de tom: ajusta a fonte em semitons para corresponder à faixa alvo.
Proporção do índice: controla o quanto o índice de recuperação afeta a cor da voz.
Método F0: seleciona RMVPE, CREPE, Harvest ou outro caminho de extração de pitch.
Separador: usa RoFormer, UVR5 ou Demucs antes da conversão.
Pipeline de conversão: o padrão é a cadeia de cobertura AI-RVC incluída; a rota oficial 1:1 ainda pode ser selecionada manualmente.
Controles de mixagem: ajuste vocais, acompanhamento, reverberação e mistura vocal original.

Casos de uso

Crie demonstrações de capas e testes de voz de personagens
Valide uma direção de voz antes de uma produção mais profunda
Alimente vocais separados em um fluxo de trabalho de canto posterior

Fluxo de trabalho

1Prefira enviar material vocal já separado
2Envie a tarefa de conversão com a direção de voz alvo
3Ouça o resultado antes de decidir sobre mais mistura ou polimento

Lista de verificação pré-voo

Quanto mais limpo for o vocal, mais estável será o resultado da conversão
Separar os vocais primeiro geralmente é melhor do que alimentar o áudio mixado diretamente no RVC
O resultado é adequado para demonstrações e validação de direção – a pós-produção ainda é recomendada antes do lançamento público

É necessário fazer login para usar esta ferramenta

Faça login ou crie uma conta para fazer upload de arquivos, enviar tarefas e revisar resultados em seu espaço de trabalho.

As informações da ferramenta de navegação são sempre gratuitas - não é necessária uma conta.