Qwen TTS Gateway

Voices

Референс для клона: лучше 3-10 секунд чистой речи одного человека, без музыки, эха и фонового шума. Официально Base умеет быстрый клон примерно от 3 секунд. Длинные записи обычно не нужны.

Uploaded clone voices

NameReferenceCreatedAction

custom_voice использует встроенный голос и инструкции. voice_clone берет загруженный референс.

Auto пытается определить язык сам. Если произношение плавает, выберите язык явно.

mp3 удобнее для сайта и скачивания. wav оставляйте для дальнейшей обработки.

Голоса CustomVoice. Для клона выберите режим voice_clone.

Список ваших загруженных референсов для Base-клона.

1.00 - обычный темп. Ниже медленнее, выше быстрее; сильные значения могут ухудшать естественность.

Работает для custom_voice: темп, эмоция, подача, стиль. Не пишите сюда текст реплики.

Jobs

IDModeStatusCreatedAudioActionError