Предположение: ошибку вызывает встречающаяся в исходном тексте комбинация символов Это html-код неразрывного пробела. Его часть - цифры 160 заменяются словарем на "сто шестьдесят", а оставшийся набор: аперсанд, решетка и точка с запятой - модель Silero не понимает.
UPD! Да, я прав. Коротенький отрывок — Странно. Очень странно. Неужели вы так и не поняли, зачем? Да хотя бы затем, чтобы помочь вам уяснить прописную, но важную истину: с таким настроением, как ваше, жить нельзя. К тому же еще и сражаться с врагом. О холодной голове вспомнили. А каким должно быть сердце? Какими — руки? Если уж цитировать Феликса Эдмундовича, то надо полностью, от точки до точки. с подключенным словарем numbers.rex сразу выпал ошибку! (кстати, этот Форум не дает ее увидеть прямо в тексте, преобразкет код в невидимый символ 160 )
<speak><p><s>— Странно.</s> <s>Очень странно.</s> <s>Неужели вы так и не поняли, зачем?</s> <s>Да хотя бы затем, чтобы помочь вам уяснить прописную, но важную истину:</s> <s>с таким настроением, как ваше, жить нельзя.</s> <s>К тому же еще и сражаться с врагом.</s> <s>О холодной голове вспомнили.сто шестьдесят;А каким должно быть сердце?</s> <s>Какими — руки?</s> <s>Если уж цитировать Феликса Эдмундовича, то надо полностью, от точки до точки.</s></p></speak>Traceback (most recent call last):File "<torch_package_1>.multi_acc_v3_package.py", line 102, in process_ssmlFile "xml\etree\ElementTree.py", line 1349, in XMLxml.etree.ElementTree.ParseError: not well-formed (invalid token): line 1, column 298 During handling of the above exception, another exception occurred: Traceback (most recent call last):File "<string>", line 254, in <module>File "<torch_package_1>.multi_acc_v3_package.py", line 366, in save_wavFile "<torch_package_1>.multi_acc_v3_package.py", line 316, in apply_ttsFile "<torch_package_1>.multi_acc_v3_package.py", line 61, in prepare_tts_model_inputFile "<torch_package_1>.multi_acc_v3_package.py", line 104, in process_ssmlValueError: Invalid XML format
Сообщение отредактировал flegont - Суббота, 18.02.2023, 15:51
Дата: Воскресенье, 19.02.2023, 18:57 | Сообщение #124
Группа: Пользователи
Сообщений: 14
Статус: Offline
всем спасибо. я тоже дошел до этого. но, проблемы на этом не закончились. в итоге, я выкосил пару абзацев. и все ок. опытным путем выяснил, что Pico работает более устойчиво, чем Демагог. там все красиво сделано, но вылетает. И процент загрузки проца можно задать. тут больше интерфейс MS DOS. Но устойчиво.
Дата: Понедельник, 20.02.2023, 19:07 | Сообщение #126
Группа: Пользователи
Сообщений: 1
Статус: Offline
Пока Silero во всех сборках сырой и тормозной продукт, да и на определенных текстах (txt, utf8) постоянно вылетает. На этих же текстах "Демагог одной кнопкой" с Максимом со всеми словарями работает намного быстрее, стабильно проходит до конца, качество звучания почти такое же, намного лучше с ударениями, текст не разбивает на такие мелкие кусочки, соответственно не заикается после каждого абзаца. Короче, лучшее-враг хорошего.
Дело в символах . Модель их не жует так как "#" является символом-флагом. Я уже знаю об этой ошибке. Пока что могу предложить занести их в 1-ый словарь замен
Разберусь с этим ближе к выходным. Странно что фильтр вообще пропускает такие символы
Попытка просто замены - неудачная
Сообщение отредактировал Pin240 - Вторник, 21.02.2023, 05:56
Вообще-то смертелен не # а сам по себе & так как воспринимается как начало xml-кода некоего символа
У попа &была собака
<speak><p><s>У попа &была собака.</s></p></speak>Traceback (most recent call last): File "<torch_package_0>.multi_acc_v3_package.py", line 102, in process_ssml File "xml\etree\ElementTree.py", line 1349, in XMLxml.etree.ElementTree.ParseError: not well-formed (invalid token): line 1, column 25During handling of the above exception, another exception occurred:Traceback (most recent call last): File "<string>", line 254, in <module> File "<torch_package_0>.multi_acc_v3_package.py", line 366, in save_wav File "<torch_package_0>.multi_acc_v3_package.py", line 316, in apply_tts File "<torch_package_0>.multi_acc_v3_package.py", line 61, in prepare_tts_model_input File "<torch_package_0>.multi_acc_v3_package.py", line 104, in process_ssmlValueError:Invalid XML format
Сообщение отредактировал flegont - Вторник, 21.02.2023, 10:03
Добрый день! Спасибо автору за замечательное средство для озвучивания книг! Брал текст рассказа, озвучивание прошло замечательно. Затем взял текст побольше. Но вышла ошибка:
Старт деление текста на части Работа модуля ударения и очистки текста Начало в: 2023-05-12 13:10:40.195080 Traceback (most recent call last): File "V6GR_01.py", line 1095, in <module> File "V6GR_01.py", line 348, in txt_telo File "V6GR_01.py", line 827, in audio_gen File "V6GR_01.py", line 578, in dic_clr File "re.py", line 210, in sub File "V6GR_01.py", line 578, in <lambda> File "V6GR_01.py", line 552, in replace_numbers File "roman.py", line 98, in fromRoman roman.InvalidRomanNumeralError: Invalid Roman numeral: GPS [10676] Failed to execute script 'V6GR_01' due to unhandled exception!
Будьте добры, подскажите, как избежать такой ошибки при озвучивании.
Для справки - файл книги:
Переформатировал файл книги. Другая ошибка: Начало в: 2023-05-12 13:40:24.203557 Traceback (most recent call last): File "V6GR_01.py", line 1095, in <module> File "V6GR_01.py", line 348, in txt_telo File "V6GR_01.py", line 827, in audio_gen File "V6GR_01.py", line 578, in dic_clr File "re.py", line 210, in sub File "V6GR_01.py", line 578, in <lambda> File "V6GR_01.py", line 552, in replace_numbers File "roman.py", line 98, in fromRoman roman.InvalidRomanNumeralError: Invalid Roman numeral: GPS [672] Failed to execute script 'V6GR_01' due to unhandled exception!
Добрый день! Ваш труд - замечательный. Отлично озвучивает книги. но. Извините за настойчивость, но снова хочу обратить внимание на некоторые особенности, с которыми я столкнулся при озвучивании книг. Прекрасно были озвучены две книги. Текстовые файлы двух книг были объемом ок.500 кб каждый. Озвучились без проблем. Аудиокниги продолжительностью ок. 5,5 часов были озвучены за 1ч40мин. Без ошибок и остановок. Но опять попытался озвучить книгу большей продолжительности и опять не успешно. Результат зависит от объема текстового файла книги?
Сообщение отредактировал faorekh - Суббота, 13.05.2023, 17:18