Demagog TTS
|
|
flegont | Дата: Четверг, 22.07.2021, 01:25 | Сообщение #1 |
V.I.P.
Группа: Модераторы
Сообщений: 141
Статус: Offline
| Начало темы здесь (ссылка на архивную копию форума mytts.info)
(44,0 Mb) архивная копия начала текущей ветки с форума mytts.info - для офлайн просмотра и поиска по всем страницам
Скачать Demagog.zip
Домашняя страница
|
|
| |
tonio_k | Дата: Четверг, 24.11.2022, 09:32 | Сообщение #61 |
Группа: Пользователи
Сообщений: 139
Статус: Offline
| Цитата flegont ( ) почему модели в основном сами игнорируют символы вне своего алфавита Эта фраза меня заставила в корне переосмыслить свое утверждение. Ведь Silero в общем случае, работает только с тем языком, с которым работает: для русского языка понимает только русские буквы, и даже не цифры. И озвучивает, по сути только русские буквы, игнорируя (удаляя из текста) символы что не входят в диапазон русской озвучки. Но при этом "почему-то" крашица, если не сможет что то удалить. Можно подойти к вопросу проверки символов по принципу: если есть условие работы Silero, то надо этому условию помочь работать без исключений: в тихую удалять все левые символы под видом, что Silero их все равно игнорирует - не умеет произносить. И вместо краша - будет игнорирование. А почему некое слово у пользователя программа озвучивает с пропусками звуков - ответ один - Silero понимает только буквы того языка, на котором работает. И уже имеет привычку игнорировать то, чего не понимает. Ищите это слово в тексте и дорабатывайте свои словари. Если нужны проверки, поиски и т.д., то поиск, скрипты и словари вам в помощь.
UPD только если Silero станет в этом вопросе более совершенным, то Эту чистку надо будет корректировать что бы улучшение не превратилось в травму.
Сообщение отредактировал tonio_k - Четверг, 24.11.2022, 09:37 |
|
| |
tonio_k | Дата: Четверг, 24.11.2022, 09:39 | Сообщение #62 |
Группа: Пользователи
Сообщений: 139
Статус: Offline
| А ещё, наверно, лучше эту чистку в отдельный рекомендуемый словарь добавить, а не в скрипт вносить? Или все же в скрипт и после словарей?
Все таки в скрипт. Такая замена должна быть на этапе начала работы движка, тем самым делая иллюзию, что это движок символ игнорирует.
Сообщение отредактировал tonio_k - Четверг, 24.11.2022, 09:42 |
|
| |
flegont | Дата: Четверг, 24.11.2022, 11:56 | Сообщение #63 |
V.I.P.
Группа: Модераторы
Сообщений: 141
Статус: Offline
| Цитата эту чистку в отдельный рекомендуемый словарь добавить Кстати, тоже хорошая идея! !!CleanText.rex - особый словарь, оставляющий в тексте только "значимые" символы. Он будет невелик по размеру и сработает достаточно быстро (?) Надо поэкспериментировать.
P.S. Я периодически проверяю публикации руководителя Silero - Александра Вейсова на Хабре - ведь обещано было существенное обновление публичных моделей. Пока - ничего нового. Ждем-с...
|
|
| |
flegont | Дата: Пятница, 25.11.2022, 23:13 | Сообщение #64 |
V.I.P.
Группа: Модераторы
Сообщений: 141
Статус: Offline
| Попробовал добавить в свой скрипт Text to Speech.py режим отладки. Когда он включен, то в окне Статистики последовательно показываются озвучиваемые фрагменты текста - уже обработанные словарями и со вставленными тегами ssml. В случае сбоя озвучки проблемный фрагмент остается в окне Статистики. Для размышлений над ним
И почти сразу нашел еще 2 нехороших символа для английской модели:
& вызывает ошибку Invalid SSML ' апостроф часто в английских текстах используют в качестве замены " при выделении прямой речи. И в диалогах нередко выскакивает та же ошибка Text too long, что и для " Но тут еще тонкость: ' также используется в некоторых словах, как буква, и там апостроф удалять нельзя. Есть, над чем задуматься.
|
|
| |
flegont | Дата: Суббота, 26.11.2022, 16:15 | Сообщение #65 |
V.I.P.
Группа: Модераторы
Сообщений: 141
Статус: Offline
| Добавил в 04_abb-en.dic: &= '*= *'= и повторил эксперимент с той же англ. книжкой - теперь всё получилось.
doyle_the_adventures_of_sherlock_holmes.txt
14,31 авторских листов
Знаков (с пробелами): 572303
Используемые словари: 01_numbers-en.rex; 04_abb-en.dic
Ноутбук MSI Katana. Время озвучки: 48 мин 42 сек
|
|
| |
flegont | Дата: Суббота, 14.01.2023, 19:04 | Сообщение #66 |
V.I.P.
Группа: Модераторы
Сообщений: 141
Статус: Offline
| Оф. сайт
7.30.417 7.30.417-x64 7.30.417-x64-Silero
[~] Небольшие поправки
|
|
| |
reborn00 | Дата: Пятница, 20.01.2023, 12:15 | Сообщение #67 |
Группа: Пользователи
Сообщений: 3
Статус: Offline
| Привет. Есть текст разбитый на главы с помощью Demagog. Как сделать пакетную запись файлов в версии Demagog-x64-Silero голосами Silero. Насколько я понял можно только записать аудио из активной вкладки проги, а из списка файлов нет.
|
|
| |
flegont | Дата: Пятница, 20.01.2023, 14:50 | Сообщение #68 |
V.I.P.
Группа: Модераторы
Сообщений: 141
Статус: Offline
| Пока "пакетной" озвучки в Demagog-x64-Silero - нет. Но я над этим работаю. Чтобы озвучивались все текстовые файлы в заданной папке, и каждому файлу соответствовал один файл аудио.
|
|
| |
reborn00 | Дата: Пятница, 20.01.2023, 19:33 | Сообщение #69 |
Группа: Пользователи
Сообщений: 3
Статус: Offline
| Цитата flegont ( ) Пока "пакетной" озвучки в Demagog-x64-Silero - нет. Но я над этим работаю.Чтобы озвучивались все текстовые файлы в заданной папке, и каждому файлу соответствовал один файл аудио. Спасибо. Буду с нетерпением ждать данной функции
|
|
| |
Pin240 | Дата: Воскресенье, 22.01.2023, 19:36 | Сообщение #70 |
Группа: Пользователи
Сообщений: 104
Статус: Offline
| В моей сборке каждая книга в отдельном каталоге. Разбить по кусочкам можно по желанию можно 1 книга -> 1 аудиофайл
Сообщение отредактировал Pin240 - Воскресенье, 22.01.2023, 19:37 |
|
| |
flegont | Дата: Среда, 25.01.2023, 11:28 | Сообщение #71 |
V.I.P.
Группа: Модераторы
Сообщений: 141
Статус: Offline
| Экспериментирую с 7.30.417-x64-Silero, редакция от 24.01.2023 Оф. сайт [~] Поправки в служебном модуле profiles\mygui.py [~] Поправки в служебном модуле profiles\myfunc.py [~] Поправки в скрипте озвучки текста в активном окне Text to Speech.py - преждевременно удалялись временные файлы при прерывании по Ctrl+P [+] Добавлен скрипт пакетной озвучки текстов: Batch Text to Speech.py (на стадии бета-теста). Скрипт озвучивает тексты в указанной папке, все тексты должны быть в одной и той же кодировке. Допустимые кодировки: ANSI Latin, ANSI Cyrillic, Unicode, Unicode Big Endian, UTF-8. По умолчанию: UTF-8. Каждому тексту будет соответствовать один аудиофайл. Готовые аудиофайлы помещаются в ту же папку, где исходные тексты.
|
|
| |
serjufa | Дата: Суббота, 18.02.2023, 09:42 | Сообщение #72 |
Группа: Пользователи
Сообщений: 14
Статус: Offline
| отличная программа. перевел несколько txt в аудио. однако, на двух книгах затор. чего я только не делал. и всякие лишние символы удалял из текста программой Text Cleanser. и в ворде редактировал. пришлось разбить книги на 2 части. вторые никак не переводятся. выходит ошибка. Причем, не только в Демагоге, но и в Picobook_TTS_Offline_V5.2_GC_fix. Не подскажите, как решить вопрос? файл тут часть2_
|
|
| |
flegont | Дата: Суббота, 18.02.2023, 15:11 | Сообщение #73 |
V.I.P.
Группа: Модераторы
Сообщений: 141
Статус: Offline
| На моей сборке Demagog-x64-Silero вся часть2 озвучилась за 15 мин 20 сек. 34 аудиофайла mp3 по 5 мин, в сумме = 86 Мб Голос kseniya, словари отключены, галочка "Режим отладки" - проставлена. В режиме отладки каждый озвучиваемый фрагмент показывается в окне "0 - Статистика", и в случае сбоя, видно на каком фрагменте ошибка. А тут всё прошло без запинки.
У вас какие-то словари были подключены? Тогда отключать их по одному, чтобы найти, какой из них вносит ошибку
|
|
| |
flegont | Дата: Суббота, 18.02.2023, 16:23 | Сообщение #74 |
V.I.P.
Группа: Модераторы
Сообщений: 141
Статус: Offline
| Диагноз установлен и подтвержен Затесавшийся в текст код неразрывного пробела   словарем nubers.rex преобразуются в сто шестьдесят; после чего модель Silero TTS выпадает в осадок
P.S. Замечено в ходе всяких-разных экспериментов. Для модели также опасны короткие строки с обилием кавычек и апрстрофов. Например, стихотворный текст с закавыченными в нем подстроками, изображающими диалог персонажей. Модель воспринимает это, как огромное количество абзацев (каждая строка стиха - абзац) с обилием диалогов, и выдает ошибку, мол текст слишком длинный. Хотя это совсем не так.
|
|
| |
flegont | Дата: Четверг, 23.02.2023, 10:38 | Сообщение #75 |
V.I.P.
Группа: Модераторы
Сообщений: 141
Статус: Offline
| Оф. сайт
7.30.418 7.30.418-x64 7.30.418-x64-Silero
[~] Небольшие поправки
|
|
| |