[ ]
Модератор форума: flegont  
MyTTS (форум) » Программы, использующие синтез речи в Windows » Demagog » Demagog TTS
Demagog TTS
flegontДата: Четверг, 22.07.2021, 01:25 | Сообщение #1
V.I.P.
Группа: Модераторы
Сообщений: 141
Статус: Offline
Начало темы здесь (ссылка на архивную копию форума mytts.info)

 (44,0 Mb) архивная копия начала текущей ветки с форума mytts.info - для офлайн просмотра и поиска по всем страницам


 Скачать Demagog.zip

Домашняя страница
 
tonio_kДата: Четверг, 24.11.2022, 09:32 | Сообщение #61
Группа: Пользователи
Сообщений: 139
Статус: Offline
Цитата flegont ()
почему модели в основном сами игнорируют символы вне своего алфавита
Эта фраза меня заставила в корне переосмыслить свое утверждение. Ведь Silero в общем случае, работает только с тем языком, с которым работает: для русского языка понимает только русские буквы, и даже не цифры. И озвучивает, по сути только русские буквы, игнорируя (удаляя из текста) символы что не входят в диапазон русской озвучки. Но при этом "почему-то" крашица, если не сможет что то удалить. Можно подойти к вопросу проверки символов по принципу: если есть условие работы Silero, то надо этому условию помочь работать без исключений: в тихую удалять все левые символы под видом, что Silero их все равно игнорирует - не умеет произносить. И вместо краша - будет игнорирование. А почему некое слово у пользователя программа озвучивает с пропусками звуков - ответ один - Silero понимает только буквы того языка, на котором работает. И уже имеет привычку игнорировать то, чего не понимает.
Ищите это слово в тексте и дорабатывайте свои словари. Если нужны проверки, поиски и т.д., то поиск, скрипты и словари вам в помощь.

UPD только если Silero станет в этом вопросе более совершенным, то Эту чистку надо будет корректировать что бы улучшение не превратилось в травму.


Сообщение отредактировал tonio_k - Четверг, 24.11.2022, 09:37
 
tonio_kДата: Четверг, 24.11.2022, 09:39 | Сообщение #62
Группа: Пользователи
Сообщений: 139
Статус: Offline
А ещё, наверно, лучше эту чистку в отдельный рекомендуемый словарь добавить, а не в скрипт вносить? Или все же в скрипт и после словарей?

Все таки в скрипт. Такая замена должна быть на этапе начала работы движка, тем самым делая иллюзию, что это движок символ игнорирует.


Сообщение отредактировал tonio_k - Четверг, 24.11.2022, 09:42
 
flegontДата: Четверг, 24.11.2022, 11:56 | Сообщение #63
V.I.P.
Группа: Модераторы
Сообщений: 141
Статус: Offline

Цитата
эту чистку в отдельный рекомендуемый словарь добавить

Кстати, тоже хорошая идея!
!!CleanText.rex - особый словарь, оставляющий в тексте только "значимые" символы.
Он будет невелик по размеру и сработает достаточно быстро (?)
Надо поэкспериментировать.

P.S. Я периодически проверяю публикации руководителя Silero - Александра Вейсова на Хабре - ведь обещано было существенное обновление публичных моделей. Пока - ничего нового. Ждем-с...
 
flegontДата: Пятница, 25.11.2022, 23:13 | Сообщение #64
V.I.P.
Группа: Модераторы
Сообщений: 141
Статус: Offline
Попробовал добавить в свой скрипт Text to Speech.py режим отладки.
Когда он включен, то в окне Статистики последовательно показываются озвучиваемые фрагменты текста - уже обработанные словарями и со вставленными тегами ssml.
В случае сбоя озвучки проблемный фрагмент остается в окне Статистики. Для размышлений над ним  wink

И почти сразу нашел еще 2 нехороших символа для английской модели:


& вызывает ошибку Invalid SSML
'  апостроф часто в английских текстах используют в качестве замены " при выделении прямой речи. И в диалогах нередко выскакивает та же ошибка Text too long, что и для "
Но тут еще тонкость: ' также используется в некоторых словах, как буква, и там апостроф удалять нельзя. Есть, над чем задуматься.
 
flegontДата: Суббота, 26.11.2022, 16:15 | Сообщение #65
V.I.P.
Группа: Модераторы
Сообщений: 141
Статус: Offline
Добавил в 04_abb-en.dic:
&=
'*=
*'=

и повторил эксперимент с той же англ. книжкой - теперь всё получилось.

doyle_the_adventures_of_sherlock_holmes.txt

14,31 авторских листов

Знаков (с пробелами): 572303

Используемые словари: 01_numbers-en.rex; 04_abb-en.dic

Ноутбук MSI Katana.
Время озвучки: 48 мин 42 сек
 
flegontДата: Суббота, 14.01.2023, 19:04 | Сообщение #66
V.I.P.
Группа: Модераторы
Сообщений: 141
Статус: Offline
Оф. сайт

7.30.417
7.30.417-x64
7.30.417-x64-Silero

[~] Небольшие поправки
 
reborn00Дата: Пятница, 20.01.2023, 12:15 | Сообщение #67
Группа: Пользователи
Сообщений: 3
Статус: Offline
Привет. Есть текст разбитый на главы с помощью Demagog. Как сделать пакетную запись файлов в версии Demagog-x64-Silero голосами Silero. Насколько я понял можно только записать аудио из активной вкладки проги, а из списка файлов нет.
 
flegontДата: Пятница, 20.01.2023, 14:50 | Сообщение #68
V.I.P.
Группа: Модераторы
Сообщений: 141
Статус: Offline
Пока "пакетной" озвучки в Demagog-x64-Silero - нет. Но я над этим работаю.
Чтобы озвучивались все текстовые файлы в заданной папке, и каждому файлу соответствовал один файл аудио.
 
reborn00Дата: Пятница, 20.01.2023, 19:33 | Сообщение #69
Группа: Пользователи
Сообщений: 3
Статус: Offline
Цитата flegont ()
Пока "пакетной" озвучки в Demagog-x64-Silero - нет. Но я над этим работаю.Чтобы озвучивались все текстовые файлы в заданной папке, и каждому файлу соответствовал один файл аудио.

Спасибо. Буду с нетерпением ждать данной функции
 
Pin240Дата: Воскресенье, 22.01.2023, 19:36 | Сообщение #70
Группа: Пользователи
Сообщений: 104
Статус: Offline
В моей сборке каждая книга в отдельном каталоге. Разбить по кусочкам можно по желанию можно 1 книга -> 1 аудиофайл

Сообщение отредактировал Pin240 - Воскресенье, 22.01.2023, 19:37
 
flegontДата: Среда, 25.01.2023, 11:28 | Сообщение #71
V.I.P.
Группа: Модераторы
Сообщений: 141
Статус: Offline
Экспериментирую с 7.30.417-x64-Silero, редакция от 24.01.2023  Оф. сайт
[~] Поправки в служебном модуле profiles\mygui.py
[~] Поправки в служебном модуле profiles\myfunc.py
[~] Поправки в скрипте озвучки текста в активном окне Text to Speech.py - преждевременно удалялись временные файлы при прерывании по Ctrl+P
[+] Добавлен скрипт пакетной озвучки текстов: Batch Text to Speech.py (на стадии бета-теста). Скрипт озвучивает тексты в указанной папке, все тексты должны быть в одной и той же кодировке. Допустимые кодировки: ANSI Latin, ANSI Cyrillic, Unicode, Unicode Big Endian, UTF-8. По умолчанию: UTF-8. Каждому тексту будет соответствовать один аудиофайл. Готовые аудиофайлы помещаются в ту же папку, где исходные тексты.
 
serjufaДата: Суббота, 18.02.2023, 09:42 | Сообщение #72
Группа: Пользователи
Сообщений: 14
Статус: Offline
отличная программа. перевел несколько txt в аудио. однако, на двух книгах затор. чего я только не делал. и всякие лишние символы удалял из текста программой Text Cleanser. и в ворде редактировал. пришлось разбить книги на 2 части. вторые никак не переводятся. выходит ошибка. Причем, не только в Демагоге, но и в Picobook_TTS_Offline_V5.2_GC_fix.
Не подскажите, как решить вопрос?
файл тут часть2_
 
flegontДата: Суббота, 18.02.2023, 15:11 | Сообщение #73
V.I.P.
Группа: Модераторы
Сообщений: 141
Статус: Offline
На моей сборке Demagog-x64-Silero вся часть2 озвучилась за 15 мин 20 сек. 34 аудиофайла mp3 по 5 мин, в сумме = 86 Мб
Голос kseniya, словари отключены, галочка "Режим отладки" - проставлена.
В режиме отладки каждый озвучиваемый фрагмент показывается в окне "0 - Статистика", и в случае сбоя, видно на каком фрагменте ошибка. А тут всё прошло без запинки.

У вас какие-то словари были подключены? Тогда отключать их по одному, чтобы найти, какой из них вносит ошибку 
 
flegontДата: Суббота, 18.02.2023, 16:23 | Сообщение #74
V.I.P.
Группа: Модераторы
Сообщений: 141
Статус: Offline
Диагноз установлен и подтвержен  smile
Затесавшийся в текст код неразрывного пробела   словарем nubers.rex преобразуются в &#сто шестьдесят;
после чего модель Silero TTS выпадает в осадок  wacko

P.S. Замечено в ходе всяких-разных экспериментов. Для модели также опасны короткие строки с обилием кавычек и апрстрофов. Например, стихотворный текст с закавыченными в нем подстроками, изображающими диалог персонажей. Модель воспринимает это, как огромное количество абзацев (каждая строка стиха - абзац) с обилием диалогов, и выдает ошибку, мол текст слишком длинный. Хотя это совсем не так.
 
flegontДата: Четверг, 23.02.2023, 10:38 | Сообщение #75
V.I.P.
Группа: Модераторы
Сообщений: 141
Статус: Offline
Оф. сайт

7.30.418
7.30.418-x64
7.30.418-x64-Silero

[~] Небольшие поправки
 
MyTTS (форум) » Программы, использующие синтез речи в Windows » Demagog » Demagog TTS
Поиск:

Общение