Produktopdateringer, modelændringer og nøglerettelser - den komplette rekord.
The tool catalog now includes ZONOS2 Voice Cloning TTS. Users can upload a reference voice clip, enter multilingual text, and generate a 44.1 kHz WAV result. The default run uses highest-quality parameters and presents model/source references.
The tool catalog now includes ZONOS2 TTS. Users can upload a reference voice clip, enter multilingual text, and generate a 44.1 kHz WAV result through the local dual-GPU ZONOS2 runtime. The default run uses the highest-quality local parameters, requires the model weights to be downloaded on the GPU server, and does not pull from Hugging Face with a runtime token.
Kørbare værktøjssider og detaljesider viser nu offentlige kildelinks under modelkort og sammenligningsrækker, herunder GitHub-repositories, Hugging Face-modelsider, MVSep-ranglister, MIREX/AMT-udfordringer, papers og officielle tekniske sider. Links er grupperet efter model og sammenligning, så den aktive model, alternativer og offentlige benchmark-kilder kan kontrolleres direkte.
MIDI-konverteren ændrer nu tekst-Meta-events i eksisterende .mid/.midi-filer direkte i browseren til den valgte målkodning. UTF-8, Shift_JIS, GBK, Big5, EUC-KR og ISO-8859-1 understøttes uden upload og uden serveropgave. Siden gør også klart, at kun tekster, spornavne, instrumentnavne, markører, cue points og relaterede tekst-events omskrives, ikke noder, tempo, velocity, controllere eller lyd.
Detalje- og kørselssider retter nu offentlige benchmark-kilder, leaderboard-rækker, metrik-enheder og lokaliserede metriknavne, så kildefastlagte kørselsenheder, aktuelle placeringer, SDR, vocals og accompaniment ikke fejlmærkes.
Værktøjskort, kørselsflader og detaljesider viser nu hvert værktøjs modelkæde, anbefalede parametre, artikler eller tekniske kilder samt offentlig benchmark-kontekst, når rankings eller målinger findes. Kørselsflader samler modelkæde og benchmark-grafer i et øvre dokumentationspanel og undgår gentagne leaderboards. MIDI-konverteren markeres som deterministisk utility, ikke som neural model.
Adskillelse af vokal og akkompagnement bruger nu en RoFormer ensemble-kæde og eksporterer vocals with harmony, original vocals, accompaniment with harmony og accompaniment without harmony. Værktøjsparametre viser også anbefalede værdier på sidens valgte sprog.
Når en værktøjsside genindlæses, bevares den rigtige opgavestatus: igangværende opgaver viser fortsat fremdrift, mens afsluttede opgaver vender tilbage til den kørbare formular i stedet for en gammel resultatvisning.
The tool catalog now includes Ideogram 4 text-to-image generation. Users can submit a prompt directly and receive PNG output, with explicit 256-2048px canvas width and height in multiples of 16, defaulting to 2048x2048 and the official V4_QUALITY_48 quality preset. Seed and 1-4 image candidate controls are available.
Detaljesider viser nu modelkilder, faste adaptere, nøgleparametervejledning, officielle repositories og links til artikler eller tekniske kilder. AI voice conversion hedder nu AI Cover Vocals, og dedikerede pianoværktøjer som Piano Pedal AMT viser ikke længere generiske YourMT3-kontroller, der ikke gælder.
GPU bridge now keeps timed-out workers unschedulable until they truly recover, preventing later jobs from being dispatched into still-running processes. The six-stem tool also fixes model import paths and female/male output detection, so real MP3 submissions can produce all 12 result files.
Når en opgave annulleres eller timer ud, frigives den aktive værktøjsopgave, der vises en ny forsøgsvej, og annullerede køjobs forhindres i fortsat at optage GPU-køen.
Docs-forsiden viser ikke længere API quickstart-kortet og holder indekset fokuseret på almindelig Web quickstart og vejledninger til credits.
Forsiden åbner nu direkte i værktøjskataloget og kørbare værktøjsdetaljer. Brugere kan starte voice conversion, stem separation, F0 extraction, retrieval, cleanup og post-processing fra ét workspace.
Opdateringen retter også uoverensstemmelser i statusgenindlæsning, resultatnavne og resultatlevering, så voice conversion, stem separation og MIDI-konvertering er lettere at følge.