Сборка Demagog для models VOSK-TTS от tonio_k
|
|
faorekh | Дата: Понедельник, 27.01.2025, 15:56 | Сообщение #31 |
Группа: Пользователи
Сообщений: 29
Статус: Offline
| Цитата tonio_k (  ) Поправил скрипт Отлично сделано! Спасибо! Всё работает, как надо. Книгу на 2.5 часа отработало примерно за такое же время. Терпимо, это такой TTS. Главное, что отработало без остановки процесса и офф-лайн!
|
|
| |
faorekh | Дата: Понедельник, 27.01.2025, 16:03 | Сообщение #32 |
Группа: Пользователи
Сообщений: 29
Статус: Offline
| Цитата tonio_k (  ) Сборка Demagog для models VOSK-TTS от tonio_k от 2025-01-12 Буквально вчера появилась новая версия vosk_tts_ru_0.8 https://huggingface.co/alphacep/vosk-tts-ru-stabletts/tree/main Интересно, существует ли возможность интегрировать новую версию модели в данную сборку?
|
|
| |
Dlmon | Дата: Пятница, 07.02.2025, 16:09 | Сообщение #33 |
Группа: Пользователи
Сообщений: 34
Статус: Offline
| на сколько я понял, это не новая версия голоса, а просто пересобранная для использования в других движках TTS: "Matcha", "StableTTS" и "StyleTTS2"
|
|
| |
Suravel | Дата: Понедельник, 10.02.2025, 19:54 | Сообщение #34 |
Группа: Пользователи
Сообщений: 14
Статус: Offline
| Цитата Dlmon (  ) выложена сборкаpython-3.11.7__torch-2.5.0_+cu121-cp311__vosk-tts-ru-gpt-sovits многотомный архив из двух частей + там еще видео как запустить... короче: нужно ее проверить и убедится что она 100% портабельная. тогда ее можно будет встроить в демагог . Хорошая сборка, но я не поняла, почему скрипт называется !_mp3_book_, если в сборке нет ни ffmpeg, ни lame, да и в самом скрипте mp3 нигде не упоминается? Или это как-то по-другому должно работать и я просто не понимаю? У меня, во всяком случае, никак не работает. Всё остается в wav.
|
|
| |
Dlmon | Дата: Вторник, 11.02.2025, 18:33 | Сообщение #35 |
Группа: Пользователи
Сообщений: 34
Статус: Offline
| это просто сборка именно python-3.11.7__torch-2.5.0_+cu121-cp311__vosk-tts-ru-gpt-sovits а mp3 нужно делать самому, там вроде батник должен быть, но вам его нужно править под ваш путь к ffmpeg
|
|
| |
Suravel | Дата: Вторник, 11.02.2025, 19:09 | Сообщение #36 |
Группа: Пользователи
Сообщений: 14
Статус: Offline
| Цитата Dlmon (  ) это просто сборка именно python-3.11.7__torch-2.5.0_+cu121-cp311__vosk-tts-ru-gpt-sovits а mp3 нужно делать самому, там вроде батник должен быть, но вам его нужно править под ваш путь к ffmpeg Спасибо, с этим уже разобралась. Попробую, из интереса, прилепить это прямо к скрипту, хотя для меня пока проще переформатировать напрямую ffmpeg или ещё проще аудио конвертером. Будь я помоложе, начала бы углубленно учить язык, а так... Глубоко погружаться в программирование на восьмом десятке не вижу смысла. Могу разве что мелкие ошибки найти и исправить, как вот к примеру в сборке "Демагог-воск". Почему не всё работает?... Да потому что в некоторых скриптах ссылка идет на папку демагог-силеро, а ее там нет.
|
|
| |
tonio_k | Дата: Вторник, 11.02.2025, 19:38 | Сообщение #37 |
Группа: Пользователи
Сообщений: 178
Статус: Offline
| Цитата Suravel (  ) Почему не всё работает? к сожалению, лично у меня либо времени нет, либо откровенно забываю. Мне вообще казалось, что воск никто особо не слушает. Сборку выложил с расчётом, что выложу переделанную сборку из силеро под воск и кто-нибудь разберётся и сам продолжит, доработает, а я подскажу если что. Я сбоку даже не тестировал. Запустил на небольшом куске книги вроде работает ну и ладно. Вот вы сказали, что что то не работает, причём из за мусора от силеро. Вы подскажете где посмотреть? Я подскажу что можно подправить. Либо что то доработаю. Если эта сборка действительно кому то нужна я найду время. Можно и подправить сборку под новый вариант воск ттс.
|
|
| |
tonio_k | Дата: Вторник, 11.02.2025, 21:29 | Сообщение #38 |
Группа: Пользователи
Сообщений: 178
Статус: Offline
| Цитата Suravel (  ) Да потому что в некоторых скриптах ссылка идет на папку демагог-силеро, а ее там нет. подправил скрипт ОЗВУЧИТЬ ВЫДЕЛЕННЫЙ ФРАГМЕНТ БЕЗ СЛОВАРЕЙ.lua вроде работает. Этот скрипт я вообще не планировал добавлять в сборку. Хотя для работы со словарями очень удобен - что бы понимать как влияют на произношение те или иные правки в тексте.
Сообщение отредактировал tonio_k - Вторник, 11.02.2025, 21:29 |
|
| |
Suravel | Дата: Вторник, 11.02.2025, 21:51 | Сообщение #39 |
Группа: Пользователи
Сообщений: 14
Статус: Offline
| Цитата tonio_k (  ) к сожалению, лично у меня либо времени нет, либо откровенно забываю. Да, понятно, что у всех свои дела, а эта работа - на чистом энтузиазме, за что отдельное спасибо. К сожалению, халяву народ у нас любит, но чужой труд ценить не умеет, а это мало способствует желанию что-то делать. Это у меня времени хватает, а вот знаний - нет. Я попробовала запустить чтение из файла, чтобы оценить хотя бы голоса, получила ошибку и поняла, что просто название папки другое, а пути к ней остались от силеро. Где эти пути прописаны искать не стала. Временно переименовала папку и чтение заработало. ...Зато запись, естественно работать перестала. Но, поскольку голоса от vosk, silero и piper меня не впечатлили, я и заморачиваться не стала. А вот gpt-sovits мне понравился. Там есть с чем поработать, вот его бы в демагог засунуть. Хоть и тяжеловат для моего компьютера. Пишет долго и процессор занят 100%. Я вообще пишу все через балаболку. Раньше писала с сервиса speechPro Только приспособилась делать разметку для правильной интонации, вопросительной, восклицательной и т.д., как их сбер купил. Перешла на Яндекс. Тоже, вроде бы, приспособилась, так, что люди с роботами разговаривать начали, но качество интернета с каждым днем всё хуже, да и нет гарантий, что спичкит не закончит также, как спичпро. Вот и смотрю заранее на оффлайн разработки. Вот на линуксе собрала среду, для добавления слов в модель воска. Но знаний не хватает, а голова уже не так быстро соображает, как в молодости.
|
|
| |
tonio_k | Дата: Вторник, 11.02.2025, 23:01 | Сообщение #40 |
Группа: Пользователи
Сообщений: 178
Статус: Offline
| Цитата Suravel (  ) Я попробовала запустить чтение из файла, чтобы оценить хотя бы голоса, получила ошибку и поняла, что просто название папки другое, а пути к ней остались от силеро. я вас не понимаю - через этот вариант скрипта сборка с vosk-tts работает и голоса выбираются и книги записываются. Cсылок на Папки с Силеро в скриптах нет - я проверил. Чтение выделенного текста (чуть выше) поправил.
Цитата Suravel (  ) А вот gpt-sovits мне понравился. если у вас есть готовый рабочий пример - запускаете батник с несколькими строками текста в папке с gpt-sovits и на выходе получаем аудиофайлы, то "адаптировать" её в сборку Демагог - уже дело техники. Сборка с Демагогом это по сути автоматическое создание текстового файла (батника), только с интерфейсом и словарями
|
|
| |
Suravel | Дата: Среда, 12.02.2025, 00:57 | Сообщение #41 |
Группа: Пользователи
Сообщений: 14
Статус: Offline
| Цитата tonio_k (  ) через этот вариант скрипта сборка с vosk-tts работает и голоса выбираются и книги записываются. Cсылок на Папки с Силеро в скриптах нет - я проверил. Чтение выделенного текста (чуть выше) поправил. Это я уже заменила. Запись работает. Я Говорила я именно о ссылках на силеро при чтении, что видно на прикрепленном файле. Понятия не имею, где они прописаны, но ругался именно на это. Мне не понравились сами голоса.Цитата tonio_k (  ) если у вас есть готовый рабочий пример - запускаете батник с несколькими строками текста в папке с gpt-sovits и на выходе получаем аудиофайлы, то "адаптировать" её в сборку Демагог - уже дело техники. Сборка с Демагогом это по сути автоматическое создание текстового файла (батника), только с интерфейсом и словарями Так я и пробую пока записывать из папки gpt-sovits. Если выбрать хороший пример голоса и сделать правильную разметку, то записывает хоть и долго, но довольно сносно. Я для себя исходный батник вообще разделила на 2: один для txt, второй для ssml, чтобы быстро переписать фразы с ошибками, потому что как не размечай, робот всегда найдет, где ошибку сделать . Я потом полученный аудиофайл исправляю в аудиоредакторе. Делать это с балаболкой быстро и просто. Демагог же быстрее обрабатывает длинные тексты, но переписывать в нем отдельные короткие фразы менее удобно. Или я пока просто не выработала алгоритм. А по поводу графического интерфейса, который безусловно, более удобен, чем прямая запись в скрипт, то, да, это - дело техники, которой лично у меня нет. Это по молодости я любила головоломки и сложные задачи, а сейчас хочется уже чего-нибудь попроще. Может я еще и смогу сделать себе вебинтерфейс для gpt-sovits, а вот всякие-разные gui для меня уже темный лес. Я легко учусь, просто уже не хочется. Понятно же, что смысла нет. Вот и пытаюсь найти готовое решение... А озвучивание книг помогает отключиться от не слишком обнадёживающих мыслей. Дети и старики любят сказки.
|
|
| |
tonio_k | Дата: Среда, 12.02.2025, 01:14 | Сообщение #42 |
Группа: Пользователи
Сообщений: 178
Статус: Offline
| Цитата Suravel (  ) при чтении, что видно на прикрепленном файле а можете пояснить что вы имеетев виду под словом " чтение "? В сборке присутствует только запись книги в аудио файлы mp3 и озвучка выделенного на экране текста (около 800 символов) - все делается только через скрипты. Мне очень интересно, какие вы делаете действия, что бы вызвать такую ошибку? Хочу ее у себя воспроизвести.
|
|
| |
Suravel | Дата: Среда, 12.02.2025, 08:39 | Сообщение #43 |
Группа: Пользователи
Сообщений: 14
Статус: Offline
| Цитата tonio_k (  ) а можете пояснить что вы имеете в виду под словом " чтение "? Под словом "Чтение" я имею ввиду чтение именно этих 800 символов. Я предпочитаю заранее определить ошибки, чтобы предотвратить их. Обычно мне удается разметить текст так, чтобы было не более 1-2 ошибок на 15 минут звучания. Не люблю,, когда неправильные ударения бьют по ушам. Просто запускаю программу, выделяю абзац и ..получаю ошибку.
|
|
| |
tonio_k | Дата: Среда, 12.02.2025, 08:44 | Сообщение #44 |
Группа: Пользователи
Сообщений: 178
Статус: Offline
| Т.е. вы заменили скрипт в сборке на этот, запускаете его и выходит ошибка?
|
|
| |
Suravel | Дата: Среда, 12.02.2025, 13:26 | Сообщение #45 |
Группа: Пользователи
Сообщений: 14
Статус: Offline
| Цитата tonio_k (  ) Т.е. вы заменили скрипт в сборке на этот, запускаете его и выходит ошибка? Нет, при чтении БЕЗ словарей ошибка уже не выходит. Она осталась теперь только при чтении со словарями, поэтому не получается предварительно сравнить и выбрать какой вариант лучше запускать. А еще иногда при запуске демагога выскакивает ошибка "invalid pointer operation". Но это, если я правильно понимаю, уже делфи не нравится что-то именно в моей системе и к питону отношения не имеет, Исчезает после перезагрузки компьютера. На данный момент пытаюсь разобраться со словарями. Никогда не любила фонетический алфавит и регулярные выражения...
|
|
| |