Aggiornamenti del prodotto, modifiche al modello e correzioni chiave: il record completo.
Le pagine eseguibili e di dettaglio ora mostrano sotto le schede modello e le righe di confronto i link alle fonti pubbliche: repository GitHub, pagine modello Hugging Face, classifiche MVSep, challenge MIREX/AMT, paper e pagine tecniche ufficiali. I link sono raggruppati per modello e confronto, così è possibile verificare subito il modello attivo, le alternative e le fonti dei benchmark pubblici.
Il convertitore MIDI converte ora gli eventi Meta testuali dei file .mid/.midi esistenti direttamente nel browser verso la codifica scelta. Supporta UTF-8, Shift_JIS, GBK, Big5, EUC-KR e ISO-8859-1, senza caricare il file né creare attività server. La pagina chiarisce anche che riscrive solo testi, nomi traccia, nomi strumenti, marker, cue point ed eventi testuali correlati, senza modificare note, tempo, velocity, controller o audio.
Le pagine di dettaglio e di esecuzione correggono fonti pubbliche di benchmark, righe di classifica, unità metriche ed etichette localizzate, così unità definite dalla fonte, ranking attuali, SDR, vocals e accompaniment non vengono etichettati in modo errato.
Schede, workspace eseguibili e pagine di dettaglio mostrano ora catena del modello, parametri consigliati, paper o fonti tecniche e contesto di benchmark pubblico quando esistono ranking o metriche pubblicati. Le pagine eseguibili uniscono catena modello e grafici benchmark in un pannello superiore, evitando leaderboard ripetute. Il convertitore MIDI è indicato come utility deterministica, non come modello neurale.
La separazione di voce e accompagnamento usa ora una catena RoFormer ensemble ed esporta vocals with harmony, original vocals, accompaniment with harmony e accompaniment without harmony. I parametri mostrano anche valori consigliati nella lingua della pagina.
Aggiornare una pagina strumento mantiene ora lo stato corretto: le attività in corso continuano a mostrare il progresso, mentre quelle completate tornano al form eseguibile invece di restare su una vecchia vista risultato.
The tool catalog now includes Ideogram 4 text-to-image generation. Users can submit a prompt directly and receive PNG output, with explicit 256-2048px canvas width and height in multiples of 16, defaulting to 2048x2048 and the official V4_QUALITY_48 quality preset. Seed and 1-4 image candidate controls are available.
Le pagine di dettaglio mostrano fonti modello, adattatori fissi, guida ai parametri chiave, repository ufficiali e link a paper o documenti tecnici. AI voice conversion diventa AI Cover Vocals, e strumenti piano dedicati come Piano Pedal AMT non espongono più controlli generici YourMT3 non applicabili.
GPU bridge now keeps timed-out workers unschedulable until they truly recover, preventing later jobs from being dispatched into still-running processes. The six-stem tool also fixes model import paths and female/male output detection, so real MP3 submissions can produce all 12 result files.
Annullare o mandare in timeout un'attività libera ora l'attività attiva, mostra un percorso di retry e impedisce ai job annullati in coda di occupare ancora la coda GPU.
La homepage della documentazione non mostra più la scheda quickstart API e mantiene l'indice concentrato su quickstart Web ordinario e guide all'uso dei crediti.
La home page apre ora direttamente il catalogo strumenti e le pagine eseguibili. Gli utenti possono avviare voice conversion, stem separation, F0 extraction, retrieval, cleanup e post-processing da un solo workspace.
Questo aggiornamento corregge anche incoerenze in refresh dello stato, nomi dei risultati e consegna, rendendo più tracciabili voice conversion, stem separation e conversione MIDI.