ZONOS2
Official repository and model card - 2026
ZONOS2 官方资源说明了 Apache-2.0 发布、多语言 TTS API、超过 600 万小时训练语音、高保真人声克隆和 44.1 kHz PCM 输出。
适合对比表现力零样本人声克隆、多语言旁白和本地 TTS 质量的创作者
使用上传的人声参考和最高质量默认值生成 44.1 kHz WAV 语音
输入
参考人声音频和多语言文本用于 ZONOS2 人声克隆 TTS
音频格式
输出
使用上传的人声参考和最高质量默认值生成 44.1 kHz WAV 语音
最适合
适合对比表现力零样本人声克隆、多语言旁白和本地 TTS 质量的创作者
ZONOS2 人声克隆 TTS 使用短参考人声生成多语言语音。TelkNet 以服务端官方 ZONOS2 部署和最高质量默认值提供上传、输入文本、下载结果的简洁流程。
ZONOS2 是 Zyphra 以 Apache-2.0 发布的零样本 TTS 模型,采用 MoE 架构,支持多语言人声克隆,并输出 44.1 kHz PCM 音频。
ZONOS2 通过 DAC 编码路径返回 44.1 kHz PCM 音频。
Official repository and model card - 2026
ZONOS2 官方资源说明了 Apache-2.0 发布、多语言 TTS API、超过 600 万小时训练语音、高保真人声克隆和 44.1 kHz PCM 输出。
未列出公开论文链接;使用官方存储库或适配器实现作为源。