Qwen TTS — это модель для преобразования текста в речь. Qwen TTS имеет лучшее качество, высокую скорость и низкое потребление VRAM (7 ГБ на старшей модели). Качество сравнимо с платными аналогами ElevenLabs и MiniMax. В этом видео вы узнаете: как преобразовать текст в речь, как клонировать голос, как кастомизировать голос, как записать голос и даже как обучить модель Qwen TTS (fine-tune qwen tts). Все это будет работать в comfyui.
МЕНЮ
00:00 — Что такое Qwen TTS
00:40 — Обзор Qwen TTS
02:45 — Установка Qwen 3 TTS в ComfyUI
03:32 — Базовые схемы Qwen TTS
04:32 — Клонирование голоса с Qwen3 TTS
08:00 — Коллекция голосов Qwen TTS
10:46 — Disign Voice — создание своего голоса
11:45 — Multi speaker — озвучка с несколькими спикерами
20:05 — Обучение модели Qwen TTS — Fine tune model
21:36 — Wisper для транскрибации аудио — audio to text
33:56 — Выводы
Сборку ComfyUI можно скачать бесплатно тут:
https://boosty.to/stabledif/posts/c64c559f-1357-432b-b7c6-19c1f7eb8882
🔥 Мой структурированный курс по «ComfyUI» с моей поддержкой на сайте https://stabledif.ru/comfyui
🔥 Мой структурированный курс по «AUTOMATIC 1111» с моей поддержкой на сайте https://stabledif.ru
🔑 Все ссылки и файлы доступны на Boosty:
https://boosty.to/stabledif/posts/0c37a7ee-cc89-4710-a239-9a8cb97790a1
✔️Телеграм-канал: https://t.me/stabledif_lesson
✔️ Telegram ЧАТ: https://t.me/stable_dif
✔️VK Prompts: https://vk.com/stabledif






































