Сборка Demagog для models VOSK-TTS от tonio_k - Страница 3

[ ]

Страница 3 из 5 « 1 2 3 4 5 »
Модератор форума: flegont

Сборка Demagog для models VOSK-TTS от tonio_k

faorekh

Дата: Понедельник, 27.01.2025, 15:56 | Сообщение #31

Группа: Пользователи

Сообщений: 31

Статус: Offline

Цитата tonio_k (

)

Поправил скрипт

Отлично сделано! Спасибо! Всё работает, как надо. Книгу на 2.5 часа отработало примерно за такое же время. Терпимо, это такой TTS. Главное, что отработало без остановки процесса и офф-лайн!

faorekh

Дата: Понедельник, 27.01.2025, 16:03 | Сообщение #32

Группа: Пользователи

Сообщений: 31

Статус: Offline

Цитата tonio_k (

)

Сборка Demagog для models VOSK-TTS от tonio_k от 2025-01-12

Буквально вчера появилась новая версия vosk_tts_ru_0.8
https://huggingface.co/alphacep/vosk-tts-ru-stabletts/tree/main
Интересно, существует ли возможность интегрировать новую версию модели в данную сборку?

Dlmon

Дата: Пятница, 07.02.2025, 16:09 | Сообщение #33

Группа: Пользователи

Сообщений: 47

Статус: Offline

на сколько я понял, это не новая версия голоса, а просто пересобранная для использования в других движках TTS:
"Matcha", "StableTTS" и "StyleTTS2"

Suravel

Дата: Понедельник, 10.02.2025, 19:54 | Сообщение #34

Группа: Пользователи

Сообщений: 22

Статус: Offline

Цитата Dlmon (

)

выложена сборкаpython-3.11.7__torch-2.5.0_+cu121-cp311__vosk-tts-ru-gpt-sovits
многотомный архив из двух частей
+ там еще видео как запустить...
короче:
нужно ее проверить и убедится что она 100% портабельная.
тогда ее можно будет встроить в демагог
.

Хорошая сборка, но я не поняла, почему скрипт называется !_mp3_book_, если в сборке нет ни ffmpeg, ни lame, да и в самом скрипте mp3 нигде не упоминается? Или это как-то по-другому должно работать и я просто не понимаю? У меня, во всяком случае, никак не работает. Всё остается в wav.

Dlmon

Дата: Вторник, 11.02.2025, 18:33 | Сообщение #35

Группа: Пользователи

Сообщений: 47

Статус: Offline

это просто сборка именно python-3.11.7__torch-2.5.0_+cu121-cp311__vosk-tts-ru-gpt-sovits а mp3 нужно делать самому, там вроде батник должен быть, но вам его нужно править под ваш путь к ffmpeg

Suravel

Дата: Вторник, 11.02.2025, 19:09 | Сообщение #36

Группа: Пользователи

Сообщений: 22

Статус: Offline

Цитата Dlmon (

)

Спасибо, с этим уже разобралась. Попробую, из интереса, прилепить это прямо к скрипту, хотя для меня пока проще переформатировать напрямую ffmpeg или ещё проще аудио конвертером. Будь я помоложе, начала бы углубленно учить язык, а так... Глубоко погружаться в программирование на восьмом десятке не вижу смысла. Могу разве что мелкие ошибки найти и исправить, как вот к примеру в сборке "Демагог-воск". Почему не всё работает?... Да потому что в некоторых скриптах ссылка идет на папку демагог-силеро, а ее там нет.

tonio_k

Дата: Вторник, 11.02.2025, 19:38 | Сообщение #37

Группа: Пользователи

Сообщений: 185

Статус: Offline

Цитата Suravel (

)

Почему не всё работает?

к сожалению, лично у меня либо времени нет, либо откровенно забываю. Мне вообще казалось, что воск никто особо не слушает. Сборку выложил с расчётом, что выложу переделанную сборку из силеро под воск и кто-нибудь разберётся и сам продолжит, доработает, а я подскажу если что.
Я сбоку даже не тестировал. Запустил на небольшом куске книги вроде работает ну и ладно.
Вот вы сказали, что что то не работает, причём из за мусора от силеро. Вы подскажете где посмотреть? Я подскажу что можно подправить. Либо что то доработаю. Если эта сборка действительно кому то нужна я найду время. Можно и подправить сборку под новый вариант воск ттс.

tonio_k

Дата: Вторник, 11.02.2025, 21:29 | Сообщение #38

Группа: Пользователи

Сообщений: 185

Статус: Offline

Цитата Suravel (

)

Да потому что в некоторых скриптах ссылка идет на папку демагог-силеро, а ее там нет.

подправил скрипт ОЗВУЧИТЬ ВЫДЕЛЕННЫЙ ФРАГМЕНТ БЕЗ СЛОВАРЕЙ.lua вроде работает. Этот скрипт я вообще не планировал добавлять в сборку. Хотя для работы со словарями очень удобен - что бы понимать как влияют на произношение те или иные правки в тексте.

Сообщение отредактировал tonio_k - Вторник, 11.02.2025, 21:29

Suravel

Дата: Вторник, 11.02.2025, 21:51 | Сообщение #39

Группа: Пользователи

Сообщений: 22

Статус: Offline

Цитата tonio_k (

)

к сожалению, лично у меня либо времени нет, либо откровенно забываю.

Да, понятно, что у всех свои дела, а эта работа - на чистом энтузиазме, за что отдельное спасибо. К сожалению, халяву народ у нас любит, но чужой труд ценить не умеет, а это мало способствует желанию что-то делать. Это у меня времени хватает, а вот знаний - нет. Я попробовала запустить чтение из файла, чтобы оценить хотя бы голоса, получила ошибку и поняла, что просто название папки другое, а пути к ней остались от силеро. Где эти пути прописаны искать не стала. Временно переименовала папку и чтение заработало. ...Зато запись, естественно работать перестала. Но, поскольку голоса от vosk, silero и piper меня не впечатлили, я и заморачиваться не стала. А вот gpt-sovits мне понравился. Там есть с чем поработать, вот его бы в демагог засунуть. Хоть и тяжеловат для моего компьютера. Пишет долго и процессор занят 100%.
Я вообще пишу все через балаболку. Раньше писала с сервиса speechPro Только приспособилась делать разметку для правильной интонации, вопросительной, восклицательной и т.д., как их сбер купил. Перешла на Яндекс. Тоже, вроде бы, приспособилась, так, что люди с роботами разговаривать начали, но качество интернета с каждым днем всё хуже, да и нет гарантий, что спичкит не закончит также, как спичпро. Вот и смотрю заранее на оффлайн разработки.
Вот на линуксе собрала среду, для добавления слов в модель воска. Но знаний не хватает, а голова уже не так быстро соображает, как в молодости.

Прикрепления: 3655340.jpg (17.3 Kb)

tonio_k

Дата: Вторник, 11.02.2025, 23:01 | Сообщение #40

Группа: Пользователи

Сообщений: 185

Статус: Offline

Цитата Suravel (

)

Я попробовала запустить чтение из файла, чтобы оценить хотя бы голоса, получила ошибку и поняла, что просто название папки другое, а пути к ней остались от силеро.

я вас не понимаю - через этот вариант скрипта сборка с vosk-tts работает и голоса выбираются и книги записываются. Cсылок на Папки с Силеро в скриптах нет - я проверил. Чтение выделенного текста (чуть выше) поправил.

Цитата Suravel (

)

А вот gpt-sovits мне понравился.

если у вас есть готовый рабочий пример - запускаете батник с несколькими строками текста в папке с gpt-sovits и на выходе получаем аудиофайлы, то "адаптировать" её в сборку Демагог - уже дело техники. Сборка с Демагогом это по сути автоматическое создание текстового файла (батника), только с интерфейсом и словарями wink

Suravel

Дата: Среда, 12.02.2025, 00:57 | Сообщение #41

Группа: Пользователи

Сообщений: 22

Статус: Offline

Цитата tonio_k (

)

через этот вариант скрипта сборка с vosk-tts работает и голоса выбираются и книги записываются. Cсылок на Папки с Силеро в скриптах нет - я проверил. Чтение выделенного текста (чуть выше) поправил.

Это я уже заменила. Запись работает. Я Говорила я именно о ссылках на силеро при чтении, что видно на прикрепленном файле. Понятия не имею, где они прописаны, но ругался именно на это. Мне не понравились сами голоса.

Цитата tonio_k (

)

Так я и пробую пока записывать из папки gpt-sovits. Если выбрать хороший пример голоса и сделать правильную разметку, то записывает хоть и долго, но довольно сносно. Я для себя исходный батник вообще разделила на 2: один для txt, второй для ssml, чтобы быстро переписать фразы с ошибками, потому что как не размечай, робот всегда найдет, где ошибку сделать . Я потом полученный аудиофайл исправляю в аудиоредакторе. Делать это с балаболкой быстро и просто. Демагог же быстрее обрабатывает длинные тексты, но переписывать в нем отдельные короткие фразы менее удобно. Или я пока просто не выработала алгоритм. А по поводу графического интерфейса, который безусловно, более удобен, чем прямая запись в скрипт, то, да, это - дело техники, которой лично у меня нет. Это по молодости я любила головоломки и сложные задачи, а сейчас хочется уже чего-нибудь попроще. Может я еще и смогу сделать себе вебинтерфейс для gpt-sovits, а вот всякие-разные gui для меня уже темный лес. Я легко учусь, просто уже не хочется. Понятно же, что смысла нет. Вот и пытаюсь найти готовое решение... А озвучивание книг помогает отключиться от не слишком обнадёживающих мыслей. Дети и старики любят сказки.

tonio_k

Дата: Среда, 12.02.2025, 01:14 | Сообщение #42

Группа: Пользователи

Сообщений: 185

Статус: Offline

Цитата Suravel (

)

при чтении, что видно на прикрепленном файле

а можете пояснить что вы имеетев виду под словом " чтение "? В сборке присутствует только запись книги в аудио файлы mp3 и озвучка выделенного на экране текста (около 800 символов) - все делается только через скрипты. Мне очень интересно, какие вы делаете действия, что бы вызвать такую ошибку? Хочу ее у себя воспроизвести.

Suravel

Дата: Среда, 12.02.2025, 08:39 | Сообщение #43

Группа: Пользователи

Сообщений: 22

Статус: Offline

Цитата tonio_k (

)

а можете пояснить что вы имеете в виду под словом " чтение "?

Под словом "Чтение" я имею ввиду чтение именно этих 800 символов. Я предпочитаю заранее определить ошибки, чтобы предотвратить их. Обычно мне удается разметить текст так, чтобы было не более 1-2 ошибок на 15 минут звучания. Не люблю,, когда неправильные ударения бьют по ушам. Просто запускаю программу, выделяю абзац и ..получаю ошибку.

tonio_k

Дата: Среда, 12.02.2025, 08:44 | Сообщение #44

Группа: Пользователи

Сообщений: 185

Статус: Offline

Т.е. вы заменили скрипт в сборке на этот, запускаете его и выходит ошибка?

Suravel

Дата: Среда, 12.02.2025, 13:26 | Сообщение #45

Группа: Пользователи

Сообщений: 22

Статус: Offline

Цитата tonio_k (

)

Т.е. вы заменили скрипт в сборке на этот, запускаете его и выходит ошибка?

Нет, при чтении БЕЗ словарей ошибка уже не выходит. Она осталась теперь только при чтении со словарями, поэтому не получается предварительно сравнить и выбрать какой вариант лучше запускать.
А еще иногда при запуске демагога выскакивает ошибка "invalid pointer operation". Но это, если я правильно понимаю, уже делфи не нравится что-то именно в моей системе и к питону отношения не имеет, Исчезает после перезагрузки компьютера.
На данный момент пытаюсь разобраться со словарями. Никогда не любила фонетический алфавит и регулярные выражения...

Сборка Demagog для models VOSK-TTS от tonio_k

Страница 3 из 5
«
1
2
3
4
5
»