Atualizações de produtos, alterações de modelos e correções importantes — o registro completo.
As páginas executáveis e de detalhes agora mostram links de fontes públicas abaixo dos cartões de modelo e das linhas de comparação, incluindo repositórios GitHub, páginas de modelos Hugging Face, rankings MVSep, desafios MIREX/AMT, artigos e páginas técnicas oficiais. Os links são agrupados por modelo e comparação para verificar diretamente o modelo ativo, alternativas e fontes públicas de benchmark.
O conversor MIDI agora converte eventos Meta de texto de arquivos .mid/.midi existentes diretamente no navegador para a codificação escolhida. Há suporte a UTF-8, Shift_JIS, GBK, Big5, EUC-KR e ISO-8859-1, sem upload do arquivo e sem criar tarefa no servidor. A página também deixa claro que só reescreve letras, nomes de faixas, nomes de instrumentos, marcadores, cue points e eventos de texto relacionados, sem alterar notas, tempo, velocity, controladores ou áudio.
As páginas de detalhe e execução agora corrigem fontes públicas de benchmark, linhas de leaderboard, unidades de métricas e rótulos localizados para que unidades definidas pela fonte, rankings atuais, SDR, vocals e accompaniment não sejam marcados incorretamente.
Cards, workspaces executáveis e páginas de detalhe agora mostram cadeia de modelo, parâmetros recomendados, artigos ou fontes técnicas e contexto público de benchmark quando há rankings ou métricas publicados. As páginas executáveis unem a cadeia atual e gráficos de benchmark em um painel superior de evidências, evitando leaderboards repetidos. O conversor MIDI é marcado como utilitário determinístico, não como modelo neural.
A separação de vocais e acompanhamento agora usa uma cadeia RoFormer ensemble e exporta vocals with harmony, original vocals, accompaniment with harmony e accompaniment without harmony. Os parâmetros também mostram valores recomendados no idioma da página.
Ao atualizar uma página de ferramenta, o estado correto da tarefa é preservado: tarefas em andamento continuam mostrando progresso, e tarefas concluídas voltam ao formulário executável em vez de ficar numa visualização antiga de resultado.
The tool catalog now includes Ideogram 4 text-to-image generation. Users can submit a prompt directly and receive PNG output, with explicit 256-2048px canvas width and height in multiples of 16, defaulting to 2048x2048 and the official V4_QUALITY_48 quality preset. Seed and 1-4 image candidate controls are available.
As páginas de detalhe agora mostram fontes do modelo, adaptadores fixos, orientação de parâmetros-chave, repositórios oficiais e links para artigos ou fontes técnicas. AI voice conversion foi renomeado para AI Cover Vocals, e ferramentas dedicadas de piano como Piano Pedal AMT não exibem mais controles genéricos YourMT3 que não se aplicam.
GPU bridge now keeps timed-out workers unschedulable until they truly recover, preventing later jobs from being dispatched into still-running processes. The six-stem tool also fixes model import paths and female/male output detection, so real MP3 submissions can produce all 12 result files.
Cancelar ou expirar uma tarefa agora libera a tarefa ativa, mostra um caminho de nova tentativa e impede que jobs cancelados na fila continuem ocupando a fila GPU.
A página inicial da documentação não mostra mais o card de API quickstart e mantém o índice focado no Web quickstart comum e nos guias de uso de credits.
A home agora abre diretamente o catálogo e páginas executáveis de ferramentas. Usuários podem iniciar voice conversion, stem separation, F0 extraction, retrieval, cleanup e post-processing a partir de um único workspace.
Esta atualização também corrige inconsistências em atualização de status, nomes de resultados e entrega, tornando fluxos de voice conversion, stem separation e conversão MIDI mais fáceis de acompanhar.