HuBERT: Self-Supervised Speech Representation Learning
IEEE/ACM TASLP - 2021
HuBERT bietet selbstüberwachte Sprachdarstellungen, die von Sprachkonvertierungspipelines im RVC-Stil verwendet werden.
Benutzer, die Stimmfarbenexperimente, Cover-Demos oder Stimmversuche mit Charakteren durchführen
Konvertierter Gesang, Original-Gesangsreferenzen und herunterladbares Audio für Demos und Hörtests
Eingabe
Sauberer Gesang, Covermaterial oder getrennte Gesangsstämme über eine RVC v2-Konvertierungskette
Audioformate
Ausgabe
Konvertierter Gesang, Original-Gesangsreferenzen und herunterladbares Audio für Demos und Hörtests
Am besten für
Benutzer, die Stimmfarbenexperimente, Cover-Demos oder Stimmversuche mit Charakteren durchführen
Die AI-Cover-Pipeline kombiniert Trennung, RVC-Sprachkonvertierung und Mixdown. Die Kerneingaben sind eine Stimmdatei und ein Zielstimmmodell.
RVC v2 wandelt das eingegebene Stimm-Timbre in das ausgewählte Charakter-Stimmenmodell um.
RMVPE ist der robuste Stimmtonhöhenschätzer, der vom RVC-Pfad und der Hybrid-F0-Option verwendet wird.
Die AI-Cover-Pipeline trennt Gesang/Begleitung vor der Konvertierung und dem Mixdown.
IEEE/ACM TASLP - 2021
HuBERT bietet selbstüberwachte Sprachdarstellungen, die von Sprachkonvertierungspipelines im RVC-Stil verwendet werden.
Interspeech - 2023
RMVPE ist ein robuster Stimmtonhöhenschätzer von Interspeech 2023, der für polyphone Musik entwickelt wurde und für die qualitätsorientierte F0-Extraktion verwendet wird.
Official repository - current
Das RVC-Projekt ist die offizielle technische Quelle für den abrufbasierten Sprachkonvertierungsworkflow von VITS/HuBERT.