পণ্য আপডেট, মডেল পরিবর্তন, এবং মূল সংশোধন - সম্পূর্ণ রেকর্ড.
রানযোগ্য টুল পেজ এবং বিস্তারিত পেজে এখন মডেল কার্ড ও তুলনা সারির নিচে GitHub রিপোজিটরি, Hugging Face মডেল পেজ, MVSep লিডারবোর্ড, MIREX/AMT চ্যালেঞ্জ, পেপার এবং অফিসিয়াল টেকনিক্যাল পেজের পাবলিক উৎস লিংক দেখানো হয়। লিংকগুলো মডেল ও তুলনা সারি অনুযায়ী সাজানো, তাই সক্রিয় মডেল, বিকল্প মডেল এবং পাবলিক benchmark উৎস সরাসরি যাচাই করা যায়।
MIDI কনভার্টার এখন বিদ্যমান .mid/.midi ফাইলের টেক্সট Meta ইভেন্ট সরাসরি ব্রাউজারে নির্বাচিত target encoding-এ রূপান্তর করে। UTF-8, Shift_JIS, GBK, Big5, EUC-KR এবং ISO-8859-1 সমর্থিত, ফাইল আপলোড বা সার্ভার টাস্ক তৈরি ছাড়াই। পৃষ্ঠার লেখা আরও স্পষ্ট করে যে শুধু lyric, track name, instrument name, marker, cue point এবং সংশ্লিষ্ট টেক্সট ইভেন্ট বদলানো হয়; note, tempo, velocity, controller বা audio বদলায় না।
টুলের detail ও runnable পৃষ্ঠা এখন public benchmark source, leaderboard row, metric unit এবং localized metric label ঠিক করে, যাতে উৎস-নির্ধারিত runtime unit, বর্তমান ranking, SDR, vocals এবং accompaniment ভুল নামে না দেখায়।
টুল কার্ড, runnable workspace এবং detail পৃষ্ঠা এখন প্রতিটি টুলের model chain, recommended parameter, paper বা technical source এবং প্রকাশিত ranking বা metric থাকলে public benchmark context দেখায়। Runnable পৃষ্ঠা current model chain ও benchmark chart এক upper evidence panel-এ আনে, একই পৃষ্ঠায় leaderboard পুনরাবৃত্তি এড়ায়। MIDI converter-কে neural model নয়, deterministic utility হিসেবে স্পষ্ট করা হয়েছে।
Vocal ও accompaniment separation এখন RoFormer ensemble chain ব্যবহার করে এবং vocals with harmony, original vocals, accompaniment with harmony ও accompaniment without harmony export করে। টুল parameter-ও নির্বাচিত পৃষ্ঠার ভাষায় recommended value দেখায়।
টুল পৃষ্ঠা refresh করলে এখন সঠিক task state থাকে: in-progress task progress দেখাতে থাকে, আর completed task পুরোনো result view-তে আটকে না থেকে runnable tool form-এ ফিরে যায়।
The tool catalog now includes Ideogram 4 text-to-image generation. Users can submit a prompt directly and receive PNG output, with explicit 256-2048px canvas width and height in multiples of 16, defaulting to 2048x2048 and the official V4_QUALITY_48 quality preset. Seed and 1-4 image candidate controls are available.
Tool detail page এখন model source, fixed adapter, key parameter guidance, official repository এবং paper বা technical link দেখায়। AI voice conversion-এর নাম AI Cover Vocals করা হয়েছে, এবং Piano Pedal AMT-এর মতো dedicated piano tool আর প্রযোজ্য নয় এমন generic YourMT3 control দেখায় না।
GPU bridge now keeps timed-out workers unschedulable until they truly recover, preventing later jobs from being dispatched into still-running processes. The six-stem tool also fixes model import paths and female/male output detection, so real MP3 submissions can produce all 12 result files.
Task cancel বা timeout হলে এখন active tool task release হয়, retry path দেখা যায়, এবং queued cancelled job আর GPU queue দখল করে থাকে না।
Docs homepage আর API quickstart card দেখায় না; index এখন regular Web quickstart এবং credits usage guide-এ কেন্দ্রীভূত।
Home page এখন সরাসরি tool catalog এবং runnable tool detail page খুলে। ব্যবহারকারী একই workspace থেকে voice conversion, stem separation, F0 extraction, retrieval, cleanup এবং post-processing শুরু করতে পারেন।
এই update task status refresh, result naming এবং result delivery-র অসঙ্গতিও ঠিক করে, যাতে voice conversion, stem separation এবং MIDI conversion flow অনুসরণ করা সহজ হয়।