Aktualizacje produktów, zmiany modeli i kluczowe poprawki — kompletny zapis.
The tool catalog now includes ZONOS2 Voice Cloning TTS. Users can upload a reference voice clip, enter multilingual text, and generate a 44.1 kHz WAV result. The default run uses highest-quality parameters and presents model/source references.
The tool catalog now includes ZONOS2 TTS. Users can upload a reference voice clip, enter multilingual text, and generate a 44.1 kHz WAV result through the local dual-GPU ZONOS2 runtime. The default run uses the highest-quality local parameters, requires the model weights to be downloaded on the GPU server, and does not pull from Hugging Face with a runtime token.
Strony uruchamiania i szczegółów pokazują teraz pod kartami modeli oraz wierszami porównania publiczne linki źródłowe: repozytoria GitHub, strony modeli Hugging Face, rankingi MVSep, wyzwania MIREX/AMT, artykuły i oficjalne strony techniczne. Linki są grupowane według modelu i porównania, aby można było od razu sprawdzić aktywny model, alternatywy i publiczne źródła benchmarków.
Konwerter MIDI przekształca teraz tekstowe zdarzenia Meta z istniejących plików .mid/.midi bezpośrednio w przeglądarce do wybranego kodowania docelowego. Obsługiwane są UTF-8, Shift_JIS, GBK, Big5, EUC-KR i ISO-8859-1, bez wysyłania pliku i bez tworzenia zadania serwerowego. Opis strony wyjaśnia też, że zmieniane są tylko teksty, nazwy ścieżek, nazwy instrumentów, markery, cue points i powiązane zdarzenia tekstowe, bez zmian nut, tempo, velocity, kontrolerów ani audio.
Strony szczegółów i uruchamiania narzędzi poprawiają publiczne źródła benchmarków, wiersze rankingów, jednostki metryk i lokalizowane etykiety, aby jednostki zdefiniowane przez źródło, aktualne pozycje, SDR, vocals i accompaniment nie były błędnie opisane.
Karty narzędzi, workspace uruchomieniowe i strony szczegółów pokazują teraz łańcuch modelu, zalecane parametry, artykuły lub źródła techniczne oraz kontekst publicznych benchmarków, gdy istnieją opublikowane rankingi lub metryki. Strony uruchomieniowe łączą łańcuch modelu i wykresy benchmarków w górnym panelu dowodowym, bez powtarzania leaderboardów. Konwerter MIDI jest oznaczony jako deterministyczne narzędzie, a nie model neuronowy.
Separacja wokalu i akompaniamentu używa teraz łańcucha RoFormer ensemble i eksportuje vocals with harmony, original vocals, accompaniment with harmony oraz accompaniment without harmony. Parametry narzędzia pokazują też zalecane wartości w języku strony.
Odświeżenie strony narzędzia zachowuje poprawny stan zadania: zadania w toku nadal pokazują postęp, a ukończone wracają do formularza uruchamiania zamiast pozostawać na starej stronie wyników.
The tool catalog now includes Ideogram 4 text-to-image generation. Users can submit a prompt directly and receive PNG output, with explicit 256-2048px canvas width and height in multiples of 16, defaulting to 2048x2048 and the official V4_QUALITY_48 quality preset. Seed and 1-4 image candidate controls are available.
Strony szczegółów pokazują źródła modeli, stałe adaptery, kluczowe parametry, oficjalne repozytoria oraz linki do artykułów lub dokumentacji technicznej. AI voice conversion zmienia nazwę na AI Cover Vocals, a dedykowane narzędzia fortepianowe, takie jak Piano Pedal AMT, nie pokazują już ogólnych kontrolek YourMT3, które ich nie dotyczą.
GPU bridge now keeps timed-out workers unschedulable until they truly recover, preventing later jobs from being dispatched into still-running processes. The six-stem tool also fixes model import paths and female/male output detection, so real MP3 submissions can produce all 12 result files.
Anulowanie lub timeout zadania zwalnia teraz aktywne zadanie narzędzia, pokazuje ścieżkę ponowienia i zapobiega dalszemu zajmowaniu kolejki GPU przez anulowane zadania w kolejce.
Strona główna dokumentacji nie pokazuje już karty API quickstart i skupia indeks na zwykłym Web quickstart oraz przewodnikach użycia kredytów.
Strona główna otwiera teraz bezpośrednio katalog narzędzi i wykonywalne strony szczegółów. Użytkownicy mogą rozpocząć voice conversion, stem separation, F0 extraction, retrieval, cleanup i post-processing z jednego workspace.
Ta aktualizacja poprawia też niespójności odświeżania statusu, nazw wyników i dostarczania wyników, aby przepływy voice conversion, stem separation i konwersji MIDI były łatwiejsze do śledzenia.