Actualizaciones de productos, cambios de modelo y correcciones clave: el registro completo.
Las páginas ejecutables y de detalle muestran ahora enlaces de fuente pública debajo de las tarjetas de modelo y las filas de comparación: repositorios de GitHub, páginas de Hugging Face, rankings de MVSep, desafíos MIREX/AMT, papers y páginas técnicas oficiales. Los enlaces se agrupan por modelo y comparación para verificar el modelo activo, las alternativas y las fuentes públicas de benchmark.
El conversor MIDI transforma ahora los eventos Meta de texto de archivos .mid/.midi existentes directamente en el navegador hacia la codificación elegida. Admite UTF-8, Shift_JIS, GBK, Big5, EUC-KR e ISO-8859-1, sin subir el archivo ni crear una tarea de servidor. La página aclara que solo reescribe letras, nombres de pistas, nombres de instrumentos, marcadores, puntos de cue y eventos de texto relacionados, sin cambiar notas, tempo, velocity, controladores ni audio.
Las páginas de detalle y ejecución corrigen ahora fuentes públicas de benchmark, filas de clasificación, unidades de métricas y etiquetas localizadas para que las unidades definidas por la fuente, rankings actuales, SDR, vocals y accompaniment no queden mal rotulados.
Las tarjetas, espacios ejecutables y páginas de detalle muestran ahora la cadena de modelo, parámetros recomendados, artículos o fuentes técnicas y el contexto público de benchmark cuando existen rankings o métricas publicados. Las páginas ejecutables unen la cadena actual y los gráficos de benchmark en un panel superior de evidencia, evitando leaderboards repetidos. El conversor MIDI queda marcado como utilidad determinista, no como modelo neuronal.
La separación de voces y acompañamiento usa ahora una cadena RoFormer ensemble y exporta vocals with harmony, original vocals, accompaniment with harmony y accompaniment without harmony. Los parámetros de la herramienta muestran valores recomendados en el idioma de la página.
Al refrescar una página de herramienta se mantiene el estado correcto: las tareas en curso siguen mostrando progreso y las completadas vuelven al formulario ejecutable en vez de quedarse en una vista antigua de resultados.
The tool catalog now includes Ideogram 4 text-to-image generation. Users can submit a prompt directly and receive PNG output, with explicit 256-2048px canvas width and height in multiples of 16, defaulting to 2048x2048 and the official V4_QUALITY_48 quality preset. Seed and 1-4 image candidate controls are available.
Las páginas de detalle muestran fuentes del modelo, adaptadores fijos, guía de parámetros clave, repositorios oficiales y enlaces a artículos o documentación técnica. AI voice conversion pasa a llamarse AI Cover Vocals, y herramientas de piano dedicadas como Piano Pedal AMT ya no muestran controles genéricos YourMT3 que no aplican.
GPU bridge now keeps timed-out workers unschedulable until they truly recover, preventing later jobs from being dispatched into still-running processes. The six-stem tool also fixes model import paths and female/male output detection, so real MP3 submissions can produce all 12 result files.
Al cancelar o agotar una tarea se libera la tarea activa, aparece una ruta de reintento y se evita que trabajos cancelados en cola sigan ocupando la cola GPU.
La portada de documentación ya no muestra la tarjeta de inicio rápido de API y mantiene el índice centrado en el inicio rápido web normal y las guías de uso de créditos.
La página de inicio abre directamente el catálogo y las páginas ejecutables de herramientas. Desde un único workspace se puede iniciar voice conversion, stem separation, F0 extraction, retrieval, cleanup y post-processing.
Esta actualización corrige incoherencias en refresco de estado, nombres de resultados y entrega de archivos para que los flujos de voice conversion, stem separation y conversión MIDI sean más fáciles de seguir.