Mel-Band RoFormer for Music Source Separation
arXiv / ISMIR late-breaking demo - 2023
Mel-RoFormer는 경험적 비중첩 밴드를 중첩 멜밴드 서브밴드로 대체하고 MUSDB18HQ의 보컬, 드럼 및 기타 스템에 대해 BS-RoFormer보다 더 나은 분리를 보고합니다.
연습, 더빙, 리믹스 전에 더 깨끗한 보컬을 얻고 싶은 사용자
연습, 샘플링, 전사, 커버 제작에 이어 쓸 수 있는 보컬/반주 stem
입력
전체 곡, 커버 소재, 반주가 있는 보컬 파일을 먼저 RoFormer stem으로 분리합니다
오디오 형식
출력
연습, 샘플링, 전사, 커버 제작에 이어 쓸 수 있는 보컬/반주 stem
가장 적합
연습, 더빙, 리믹스 전에 더 깨끗한 보컬을 얻고 싶은 사용자
보컬/반주 분리는 이제 고정된 RoFormer 분리기 체인입니다. YourMT3를 호출하지 않고도 하모니가 있는 보컬, 하모니 없는 반주, 독창적인 보컬, 하모니가 있는 반주를 만들어냅니다.
기본 보컬/악기 패스. TelkNet은 전사 모델이 아닌 보컬/RVC 스타일 분리에 최적화된 오디오 분리기 RoFormer 앙상블을 사용합니다.
두 번째 패스 리드/백 보컬 분리. 추출된 보컬 스템에서만 실행되므로 백킹 보컬이 하모니 인식 반주로 보존될 수 있습니다.
UVR/MVSep 스타일 구분자 체크포인트를 위한 런타임 래퍼입니다. 이 도구에서 사용되는 모델 로딩, WAV 줄기 내보내기 및 FFmpeg 지원 오디오 형식 처리를 제공합니다.
arXiv / ISMIR late-breaking demo - 2023
Mel-RoFormer는 경험적 비중첩 밴드를 중첩 멜밴드 서브밴드로 대체하고 MUSDB18HQ의 보컬, 드럼 및 기타 스템에 대해 BS-RoFormer보다 더 나은 분리를 보고합니다.
SDX23 music separation track - 2023
BS-RoFormer는 대역 분할 스펙트로그램 기능과 RoPE Transformer를 사용합니다. SDX23 시스템은 음악 소스 분리 트랙에서 1위를 차지했으며 더 작은 버전은 MUSDB18HQ에서 9.80dB 평균 SDR을 보고했습니다.
TISMIR - 2024
SDX23 음악 디믹싱 문서에는 강력한 MSS 벤치마크, 청취 테스트 및 최고의 시스템이 MDXDB21에서 1.6dB SDR 이상 이전 문제보다 개선되었음을 문서화했습니다.