HuBERT: Self-Supervised Speech Representation Learning
IEEE/ACM TASLP - 2021
HuBERT proporciona representaciones de voz autosupervisadas utilizadas por canales de conversión de voz estilo RVC.
Usuarios que realizan experimentos de color de voz, demostraciones de portadas o pruebas de voz de personajes.
Voces convertidas, referencias vocales originales y audio descargable para demostraciones y pruebas de escucha.
Entrada
Voces limpias, material de covers o líneas vocales separadas a través de una cadena de conversión RVC v2
Formatos de audio
Salida
Voces convertidas, referencias vocales originales y audio descargable para demostraciones y pruebas de escucha.
Lo mejor para
Usuarios que realizan experimentos de color de voz, demostraciones de portadas o pruebas de voz de personajes.
El proceso de cobertura de IA combina separación, conversión de voz RVC y mezcla. Las entradas principales son un archivo vocal y un modelo de voz objetivo.
RVC v2 convierte el timbre vocal de entrada en el modelo de voz del personaje seleccionado.
RMVPE es el robusto estimador de tono vocal utilizado por la ruta RVC y la opción híbrida F0.
El proceso de cobertura de IA separa las voces y el acompañamiento antes de la conversión y la mezcla.
IEEE/ACM TASLP - 2021
HuBERT proporciona representaciones de voz autosupervisadas utilizadas por canales de conversión de voz estilo RVC.
Interspeech - 2023
RMVPE es un robusto estimador de tono vocal de Interspeech 2023 diseñado para música polifónica y utilizado para extracción F0 de primera calidad.
Official repository - current
El proyecto RVC es la fuente técnica oficial para el flujo de trabajo de conversión de voz basado en recuperación VITS/HuBERT.