HuBERT: Self-Supervised Speech Representation Learning
IEEE/ACM TASLP - 2021
HuBERT は RVC 系 voice conversion pipeline で使う自己教師あり音声表現を提供します。
声質変換、カバー demo、キャラクター声実験を行うユーザー
変換後ボーカル、元ボーカル参照、ダウンロード可能な音声を demo や試聴に使用可能
入力
クリーンなボーカル、カバー素材、分離済みボーカル stem。RVC v2 声質変換チェーンを使用
音声フォーマット
出力
変換後ボーカル、元ボーカル参照、ダウンロード可能な音声を demo や試聴に使用可能
最適
声質変換、カバー demo、キャラクター声実験を行うユーザー
AI カバー パイプラインは、分離、RVC 音声変換、ミックスダウンを組み合わせます。コア入力は、ボーカル ファイルとターゲット ボイス モデルです。
RVC v2 は、入力されたボーカルの音色を選択されたキャラクター ボイス モデルに変換します。
RMVPE は RVC ルートと hybrid F0 オプションで使う頑健なボーカルピッチ推定器です。
AI カバー パイプラインは、変換とミックスダウンの前にボーカル/伴奏を分離します。
IEEE/ACM TASLP - 2021
HuBERT は RVC 系 voice conversion pipeline で使う自己教師あり音声表現を提供します。
Interspeech - 2023
RMVPE はポリフォニック音楽向けの Interspeech 2023 頑健ボーカルピッチ推定器です。
Official repository - current
RVC project は VITS/HuBERT 検索型 voice conversion ワークフローの公式技術ソースです。