Mel-Band RoFormer for Music Source Separation
arXiv / ISMIR late-breaking demo - 2023
Mel-RoFormer は、ヒューリスティックな非オーバーラップ バンドをオーバーラップするメルバンド サブバンドに置き換え、MUSDB18HQ のボーカル、ドラム、その他のステムについて BS-RoFormer よりも優れた分離を報告します。
練習、吹き替え、リミックス前によりクリーンなボーカルを得たいユーザー
練習、サンプリング、転写、カバー制作に使えるボーカル/伴奏 stem
入力
フル曲、カバー素材、伴奏付きボーカル。RoFormer stem 分離を先に実行します
音声フォーマット
出力
練習、サンプリング、転写、カバー制作に使えるボーカル/伴奏 stem
最適
練習、吹き替え、リミックス前によりクリーンなボーカルを得たいユーザー
ボーカルと伴奏の分離は固定 RoFormer セパレーター チェーンになりました。 YourMT3 を呼び出すことなく、ハーモニー付きのボーカル、ハーモニーなしの伴奏、オリジナルのボーカル、ハーモニー付きの伴奏を作成します。
主要なボーカル/インストゥルメンタルパス。 TelkNet は、転写モデルではなく、ボーカル/RVC スタイルの分離用に最適化されたオーディオ分離器 RoFormer アンサンブルを使用します。
セカンドパスのリードボーカルとバックボーカルの分離。抽出されたボーカルステム上でのみ実行されるため、バッキングボーカルをハーモニーを意識した伴奏として保存できます。
UVR/MVSep スタイルのセパレータ チェックポイントのランタイム ラッパー。このツールで使用されるモデルの読み込み、WAV ステムのエクスポート、FFmpeg ベースのオーディオ形式の処理を提供します。
arXiv / ISMIR late-breaking demo - 2023
Mel-RoFormer は、ヒューリスティックな非オーバーラップ バンドをオーバーラップするメルバンド サブバンドに置き換え、MUSDB18HQ のボーカル、ドラム、その他のステムについて BS-RoFormer よりも優れた分離を報告します。
SDX23 music separation track - 2023
BS-RoFormer は、帯域分割スペクトログラム機能と RoPE トランスフォーマーを使用します。 SDX23 システムは音楽ソース分離トラックで 1 位にランクされ、小型バージョンでは MUDB18HQ で平均 9.80 dB の SDR が報告されました。
TISMIR - 2024
SDX23 音楽デミックスの論文には、堅牢な MSS ベンチマーク、リスニング テストが記録されており、最良のシステムは MDXDB21 で以前の課題よりも 1.6 dB SDR 以上改善されていることが記録されています。