[ ]
  • Страница 3 из 5
  • «
  • 1
  • 2
  • 3
  • 4
  • 5
  • »
Модератор форума: flegont  
Сборка Demagog для models VOSK-TTS от tonio_k
faorekhДата: Понедельник, 27.01.2025, 15:56 | Сообщение #31
Группа: Пользователи
Сообщений: 29
Статус: Offline
Цитата tonio_k ()
Поправил скрипт
Отлично сделано! Спасибо! Всё работает, как надо. Книгу на 2.5 часа отработало примерно за такое же время. Терпимо, это такой TTS. Главное, что отработало без остановки процесса и офф-лайн!
 
faorekhДата: Понедельник, 27.01.2025, 16:03 | Сообщение #32
Группа: Пользователи
Сообщений: 29
Статус: Offline
Цитата tonio_k ()
Сборка Demagog для models VOSK-TTS от tonio_k от 2025-01-12
Буквально вчера появилась новая версия vosk_tts_ru_0.8
https://huggingface.co/alphacep/vosk-tts-ru-stabletts/tree/main
Интересно, существует ли возможность интегрировать новую версию модели в данную сборку?
 
DlmonДата: Пятница, 07.02.2025, 16:09 | Сообщение #33
Группа: Пользователи
Сообщений: 34
Статус: Offline
на сколько я понял, это не новая версия голоса, а просто пересобранная для использования в других движках TTS:
"Matcha", "StableTTS" и "StyleTTS2"
 
SuravelДата: Понедельник, 10.02.2025, 19:54 | Сообщение #34
Группа: Пользователи
Сообщений: 14
Статус: Offline
Цитата Dlmon ()
выложена сборкаpython-3.11.7__torch-2.5.0_+cu121-cp311__vosk-tts-ru-gpt-sovits
многотомный архив из двух частей
+ там еще видео как запустить...
короче:
нужно ее проверить и убедится что она 100% портабельная.
тогда ее можно будет встроить в демагог
.
Хорошая сборка, но я не поняла, почему скрипт называется !_mp3_book_, если в сборке нет ни ffmpeg, ни lame, да и в самом скрипте mp3 нигде не упоминается? Или это как-то по-другому должно работать и я просто не понимаю? У меня, во всяком случае, никак не работает. Всё остается в wav.
 
DlmonДата: Вторник, 11.02.2025, 18:33 | Сообщение #35
Группа: Пользователи
Сообщений: 34
Статус: Offline
это просто сборка именно  python-3.11.7__torch-2.5.0_+cu121-cp311__vosk-tts-ru-gpt-sovits   а  mp3  нужно делать самому, там вроде батник должен быть, но вам его нужно править под ваш путь к ffmpeg
 
SuravelДата: Вторник, 11.02.2025, 19:09 | Сообщение #36
Группа: Пользователи
Сообщений: 14
Статус: Offline
Цитата Dlmon ()
это просто сборка именно  python-3.11.7__torch-2.5.0_+cu121-cp311__vosk-tts-ru-gpt-sovits   а  mp3  нужно делать самому, там вроде батник должен быть, но вам его нужно править под ваш путь к ffmpeg
Спасибо, с этим уже разобралась. Попробую, из интереса,  прилепить это прямо к скрипту, хотя для меня пока проще переформатировать напрямую ffmpeg или ещё проще аудио конвертером. Будь я помоложе, начала бы углубленно учить язык, а так...  Глубоко погружаться в программирование на восьмом десятке не вижу смысла.  Могу разве что мелкие ошибки найти и исправить, как вот к примеру в сборке "Демагог-воск". Почему не всё работает?... Да потому что в некоторых скриптах ссылка идет на папку демагог-силеро, а ее там нет.
 
tonio_kДата: Вторник, 11.02.2025, 19:38 | Сообщение #37
Группа: Пользователи
Сообщений: 178
Статус: Offline
Цитата Suravel ()
Почему не всё работает?
к сожалению, лично у меня либо времени нет, либо откровенно забываю. Мне вообще казалось, что воск никто особо не слушает. Сборку выложил с расчётом, что выложу переделанную сборку из силеро под воск и кто-нибудь разберётся и сам продолжит, доработает, а я подскажу если что.
Я сбоку даже не тестировал. Запустил на небольшом куске книги вроде работает ну и ладно.
Вот вы сказали, что что то не работает, причём из за мусора от силеро. Вы подскажете где посмотреть? Я подскажу что можно подправить. Либо что то доработаю. Если эта сборка действительно кому то нужна я найду время. Можно и подправить сборку под новый вариант воск ттс.
 
tonio_kДата: Вторник, 11.02.2025, 21:29 | Сообщение #38
Группа: Пользователи
Сообщений: 178
Статус: Offline
Цитата Suravel ()
Да потому что в некоторых скриптах ссылка идет на папку демагог-силеро, а ее там нет.

подправил скрипт ОЗВУЧИТЬ ВЫДЕЛЕННЫЙ ФРАГМЕНТ БЕЗ СЛОВАРЕЙ.lua вроде работает. Этот скрипт я вообще не планировал добавлять в сборку. Хотя для работы со словарями очень удобен - что бы понимать как влияют на произношение те или иные правки в тексте.


Сообщение отредактировал tonio_k - Вторник, 11.02.2025, 21:29
 
SuravelДата: Вторник, 11.02.2025, 21:51 | Сообщение #39
Группа: Пользователи
Сообщений: 14
Статус: Offline
Цитата tonio_k ()
к сожалению, лично у меня либо времени нет, либо откровенно забываю.
Да, понятно, что у всех свои дела, а эта работа - на чистом энтузиазме, за что отдельное спасибо. К сожалению, халяву народ у нас любит, но чужой труд ценить не умеет, а это мало способствует желанию что-то делать.  Это у меня времени хватает, а вот знаний - нет. Я попробовала запустить чтение из файла, чтобы оценить хотя бы голоса, получила ошибку и поняла, что просто название папки другое, а пути к ней остались от силеро.  Где эти пути прописаны искать не стала. Временно переименовала папку и чтение заработало. ...Зато запись, естественно работать перестала. Но, поскольку голоса от vosk, silero и piper меня не впечатлили, я и заморачиваться не стала. А вот gpt-sovits мне понравился. Там есть с чем поработать, вот его бы в демагог засунуть. Хоть и тяжеловат для моего компьютера. Пишет долго и процессор занят 100%.
Я вообще пишу все через балаболку. Раньше писала с сервиса speechPro Только приспособилась делать разметку для правильной интонации, вопросительной, восклицательной и т.д., как их сбер купил. Перешла на Яндекс. Тоже, вроде бы, приспособилась, так, что люди с роботами разговаривать начали, но качество интернета с каждым днем всё хуже, да и нет гарантий, что спичкит не закончит также, как спичпро. Вот и смотрю заранее на оффлайн разработки.
Вот на линуксе собрала среду, для добавления слов в модель воска. Но знаний не хватает, а голова уже не так быстро соображает, как в молодости.
Прикрепления: 3655340.jpg (17.3 Kb)
 
tonio_kДата: Вторник, 11.02.2025, 23:01 | Сообщение #40
Группа: Пользователи
Сообщений: 178
Статус: Offline
Цитата Suravel ()
Я попробовала запустить чтение из файла, чтобы оценить хотя бы голоса, получила ошибку и поняла, что просто название папки другое, а пути к ней остались от силеро.
 я вас не понимаю - через этот вариант скрипта сборка с vosk-tts работает и голоса выбираются и книги записываются. Cсылок на Папки с Силеро в скриптах нет - я проверил. Чтение выделенного текста (чуть выше) поправил.

Цитата Suravel ()
А вот gpt-sovits мне понравился.
если у вас есть готовый рабочий пример - запускаете батник с несколькими строками текста в папке с gpt-sovits и на выходе получаем аудиофайлы, то "адаптировать" её в сборку Демагог - уже дело техники. Сборка с Демагогом это по сути автоматическое создание текстового файла (батника), только с интерфейсом и словарями wink
 
SuravelДата: Среда, 12.02.2025, 00:57 | Сообщение #41
Группа: Пользователи
Сообщений: 14
Статус: Offline
Цитата tonio_k ()
через этот вариант скрипта сборка с vosk-tts работает и голоса выбираются и книги записываются. Cсылок на Папки с Силеро в скриптах нет - я проверил. Чтение выделенного текста (чуть выше) поправил.
Это я уже заменила. Запись работает.  Я Говорила я именно о ссылках на силеро при чтении, что видно на прикрепленном файле. Понятия не имею, где они прописаны, но ругался именно на это. Мне не понравились сами голоса.
Цитата tonio_k  ()
если у вас есть готовый рабочий пример - запускаете батник с несколькими строками текста в папке с gpt-sovits и на выходе получаем аудиофайлы, то "адаптировать" её в сборку Демагог - уже дело техники. Сборка с Демагогом это по сути автоматическое создание текстового файла (батника), только с интерфейсом и словарями
Так я и пробую пока записывать из папки gpt-sovits. Если выбрать хороший пример голоса и сделать правильную разметку, то записывает хоть и долго, но довольно сносно. Я для себя исходный батник вообще разделила на 2: один для txt, второй для ssml, чтобы быстро переписать фразы с ошибками, потому что как не размечай, робот всегда найдет, где ошибку сделать . Я потом полученный аудиофайл исправляю в аудиоредакторе. Делать это с балаболкой быстро и просто. Демагог же быстрее обрабатывает длинные тексты, но переписывать в нем отдельные короткие фразы менее удобно. Или я пока просто не выработала алгоритм. А по поводу графического интерфейса, который безусловно, более удобен, чем прямая запись в скрипт, то, да, это - дело техники, которой лично у меня нет. Это по молодости я любила головоломки и сложные задачи, а сейчас хочется уже чего-нибудь попроще. Может я еще и смогу сделать себе вебинтерфейс для gpt-sovits, а вот всякие-разные gui для меня уже темный лес. Я легко учусь, просто уже не хочется. Понятно же, что смысла нет. Вот и пытаюсь найти готовое решение... А озвучивание книг помогает отключиться от не слишком обнадёживающих мыслей. Дети и старики любят сказки.
 
tonio_kДата: Среда, 12.02.2025, 01:14 | Сообщение #42
Группа: Пользователи
Сообщений: 178
Статус: Offline
Цитата Suravel ()
при чтении, что видно на прикрепленном файле
а можете пояснить что вы имеетев виду под словом " чтение "? В сборке присутствует только запись книги в аудио файлы mp3 и озвучка выделенного на экране текста (около 800 символов) - все делается только через скрипты. Мне очень интересно, какие вы делаете действия, что бы вызвать такую ошибку? Хочу ее у себя воспроизвести.
 
SuravelДата: Среда, 12.02.2025, 08:39 | Сообщение #43
Группа: Пользователи
Сообщений: 14
Статус: Offline
Цитата tonio_k ()
а можете пояснить что вы имеете в виду под словом " чтение "?
Под словом "Чтение" я имею ввиду чтение именно этих 800 символов. Я предпочитаю заранее определить ошибки, чтобы предотвратить их. Обычно мне удается разметить текст так, чтобы было не более 1-2 ошибок на 15 минут звучания. Не люблю,, когда неправильные ударения бьют по ушам. Просто запускаю программу, выделяю абзац и ..получаю ошибку.
 
tonio_kДата: Среда, 12.02.2025, 08:44 | Сообщение #44
Группа: Пользователи
Сообщений: 178
Статус: Offline
Т.е. вы заменили скрипт в сборке на этот, запускаете его и выходит ошибка?
 
SuravelДата: Среда, 12.02.2025, 13:26 | Сообщение #45
Группа: Пользователи
Сообщений: 14
Статус: Offline
Цитата tonio_k ()
Т.е. вы заменили скрипт в сборке на этот, запускаете его и выходит ошибка?
Нет,  при чтении БЕЗ словарей ошибка уже не выходит. Она осталась теперь только при чтении со словарями, поэтому не получается предварительно сравнить и выбрать какой вариант лучше запускать.  
А еще иногда при запуске демагога выскакивает ошибка "invalid pointer operation". Но это, если я правильно понимаю,  уже делфи не нравится что-то именно в моей системе и к питону отношения не имеет,  Исчезает после перезагрузки компьютера.
На данный момент пытаюсь разобраться со словарями.  Никогда не любила фонетический алфавит и регулярные выражения...
 
  • Страница 3 из 5
  • «
  • 1
  • 2
  • 3
  • 4
  • 5
  • »
Поиск:

Общение