Produktoppdateringer, modellendringer og viktige rettelser – hele posten.
Kjørbare verktøysider og detaljsider viser nå offentlige kildelenker under modellkort og sammenligningsrader, inkludert GitHub-repositorier, Hugging Face-modellsider, MVSep-rangeringer, MIREX/AMT-utfordringer, artikler og offisielle tekniske sider. Lenkene er gruppert etter modell og sammenligning, slik at aktiv modell, alternativer og offentlige benchmark-kilder kan kontrolleres direkte.
MIDI-konverteren gjør nå om tekst-Meta-events i eksisterende .mid/.midi-filer direkte i nettleseren til valgt målkoding. UTF-8, Shift_JIS, GBK, Big5, EUC-KR og ISO-8859-1 støttes uten filopplasting og uten serveroppgave. Siden gjør også klart at bare tekster, spornavn, instrumentnavn, markører, cue points og relaterte tekst-events skrives om, ikke noter, tempo, velocity, kontrollere eller lyd.
Detalj- og kjøresider retter nå offentlige benchmark-kilder, leaderboard-rader, metrikkenheter og lokaliserte metrikknavn, slik at kildefastsatte kjøreenheter, gjeldende rangeringer, SDR, vocals og accompaniment ikke feilmerkes.
Verktøykort, kjørbare arbeidsflater og detaljsider viser nå modellkjede, anbefalte parametere, artikler eller tekniske kilder og offentlig benchmark-kontekst når publiserte rangeringer eller metrikker finnes. Kjørbare sider samler modellkjede og benchmark-diagrammer i et øvre dokumentasjonspanel, uten gjentatte leaderboard-seksjoner. MIDI-konverteren merkes som deterministisk verktøy, ikke neural modell.
Separasjon av vokal og akkompagnement bruker nå en RoFormer ensemble-kjede og eksporterer vocals with harmony, original vocals, accompaniment with harmony og accompaniment without harmony. Verktøyparametere viser også anbefalte verdier på valgt sidespråk.
Når en verktøyside oppdateres, beholdes riktig oppgavestatus: oppgaver som kjører viser fortsatt fremdrift, mens fullførte oppgaver går tilbake til det kjørbare skjemaet i stedet for en gammel resultatvisning.
The tool catalog now includes Ideogram 4 text-to-image generation. Users can submit a prompt directly and receive PNG output, with explicit 256-2048px canvas width and height in multiples of 16, defaulting to 2048x2048 and the official V4_QUALITY_48 quality preset. Seed and 1-4 image candidate controls are available.
Detaljsider viser nå modellkilder, faste adaptere, nøkkelparametere, offisielle repositories og lenker til artikler eller tekniske kilder. AI voice conversion heter nå AI Cover Vocals, og dedikerte pianoverktøy som Piano Pedal AMT viser ikke lenger generiske YourMT3-kontroller som ikke gjelder.
GPU bridge now keeps timed-out workers unschedulable until they truly recover, preventing later jobs from being dispatched into still-running processes. The six-stem tool also fixes model import paths and female/male output detection, so real MP3 submissions can produce all 12 result files.
Når en oppgave kanselleres eller får timeout, frigjøres den aktive verktøyoppgaven, en ny prøvevei vises, og kansellerte køjobber hindres i å fortsette å oppta GPU-køen.
Docs-forsiden viser ikke lenger API quickstart-kortet og holder indeksen fokusert på vanlig Web quickstart og veiledninger for credits.
Forsiden åpner nå direkte i verktøykatalogen og kjørbare detaljsider. Brukere kan starte voice conversion, stem separation, F0 extraction, retrieval, cleanup og post-processing fra ett workspace.
Denne oppdateringen retter også uoverensstemmelser i statusoppdatering, resultatnavn og resultatlevering, slik at voice conversion, stem separation og MIDI-konvertering blir lettere å følge.