4ステム音源分離ホワイトペーパー: Huge-SCNet が MSS 目標に合う理由
TelkNet の現在の 4ステムツールは Huge-SCNet-4stems V1.2 を使い、フルミックスを vocals、drums、bass、other に分離します。この記事では MSS アーキテクチャの流れ、Mel-Band RoFormer の強みと限界、SCNet のサブバンドモデリング、公開 4ステムスコアから選択理由を説明します。
TelkNet の現在の 4ステムツールは Huge-SCNet-4stems V1.2 を使い、フルミックスを vocals、drums、bass、other に分離します。この記事では MSS アーキテクチャの流れ、Mel-Band RoFormer の強みと限界、SCNet のサブバンドモデリング、公開 4ステムスコアから選択理由を説明します。
TelkNet の現在の 4ステムツールは Huge-SCNet-4stems V1.2 を使い、フルミックスを vocals、drums、bass、other に分離します。この記事では MSS アーキテクチャの流れ、Mel-Band RoFormer の強みと限界、SCNet のサブバンドモデリング
Core entities
Cited sources
MODEL / TelkNet
TelkNet の現在の 4ステムツールは Huge-SCNet-4stems V1.2 を使い、フルミックスを vocals、drums、bass、other に分離します。この記事では MSS アーキテクチャの流れ、Mel-Band RoFormer の強みと限界、SCNet のサブバンドモデリング、公開 4ステムスコアから選択理由を説明します。
標準的な 4ステム目標は vocals、drums、bass、other です。Other は vocals、drums、bass 以外の楽器群を受け持ちます。
Mel-Band RoFormer は mel-band と RoPE によりボーカル細部に強い一方、4ステム分離では drums、bass、other 内の高周波楽器細部も守る必要があります。
SCNet 系はサブバンドモデリングと sparse compression で 4 つの stem をより均衡して扱います。そのため Huge-SCNet-4stems V1.2 が現在の 4ステムツールのモデル境界です。
MVSep Ensemble は品質上限の参照になりますが、単一モデルではなく複数モデル workflow として説明する必要があります。
TelkNet の現在のプロダクト契約は Huge-SCNet-4stems V1.2 です。MVSep Ensemble は品質参照として有用ですが、単体モデルではなくプラットフォーム上の複数モデル workflow です。