Еще раз спасибо! Критическую ощибку нашел. На вкладке "Настройки 2" -> "OGG" в строке "Среднее знчение битрейтора в скобках" в слове "знчение" пропущена буква а. Истинно говорю, из-за этого все проблеммы :)))
Дата: Воскресенье, 08.10.2023, 13:49 | Сообщение #154
Группа: Пользователи
Сообщений: 3
Статус: Offline
Спасибо за фикс, действительно многое исправилось. Но нашел еще ошибку. При обработке этого текста вылазит ошибка:
Она превратила нашу страну в единый и всеобъемлющий тыл, обслуживающий фронт, обслуживающий нашу Красную Армию, наш Военно-Морской Флот. Период мирного строительства кончился. Начался период освободительной войны с немецкими захватчиками. Вполне уместно поэтому поставить вопрос об итогах войны за вторую половину истекшего года, собственно зa четыре с лишним месяца второй половины года, и о тех задачах, которые мы ставим себе в этой освободительной войне.
...
Traceback (most recent call last): File "V6GR_001D.py", line 1340, in <module> File "V6GR_001D.py", line 402, in txt_telo File "V6GR_001D.py", line 1219, in audio_gen File "V6GR_001D.py", line 1048, in txt_tts_spl File "V6GR_001D.py", line 972, in tts File "V6GR_001D.py", line 941, in rus File "V6GR_001D.py", line 815, in rusp File "<torch_package_0>.multi_acc_v3_package.py", line 366, in save_wav File "<torch_package_0>.multi_acc_v3_package.py", line 303, in apply_tts AssertionError: `speaker` should be in aidar, baya, kseniya, xenia, eugene, rand om [3892] Failed to execute script 'V6GR_001D' due to unhandled exception!
Здравствуйте. есть 2 вопроса. 1. эта сборка ест только txt? 2. кто нибудь сравнивал качество озвучки этой сборки (Picobook_TTS_Offline_V6.2.2GC(сборщик_5.13)) и Demagog-x64-Silero flegont? стоит ли переходит на эту сборку?
смотря что вы вкладываете в понятие "качество". Сами голоса абсолютно идентичны в обеих сборках. Что касается ударений,то за счёт словарей и неплохого качества Силеро качество ударений "округлённо" во всех сборках одинаковое. Все отличия упираются в то, что Picobook_TTS_Offline_V6.2.2GC это консольная версия с добавленным визуальными настройками и работа с простыми словарями. А Демагог - это программа с интерфейсом годами заточенная на работу со словарями, голосовыми движками и поддержкой скрриптов. Так что, если вам только озвучить голосами Силеро - то выбор сборки чисто на ваш вкус. Если вы хотите серьёзно, с удобствами и продуманными фишками организовать работу со словарями и самим тестом книги, то Демагог здесь выгодно отличается. Но вы можете аналогично и в Балаболке примерно так же качественно подготовить текст книги обработав ее словарями и полученный txt файл передать на вход в сборки и затем озвучить голосами Силеро. Соответственно, Демагог открывает книгу в любом формате. Консольная Picobook_TTS_Offline_V6.2.2GC требует txt файл. Подытожим: если вам только озвучить книгу - выбираете любую сборку с которой вам удобнее работать. Если вам надо что то больше, чем добавить простое правило в словарь, то смотрите в сторону сборки, содержащую Демагог. Но там вам нужно будет это все изучать, спрашивать и иметь много свободного времени на эти все действия
Дата: Воскресенье, 26.11.2023, 11:12 | Сообщение #160
Группа: Пользователи
Сообщений: 14
Статус: Offline
спасибо за пояснения. вопрос был связан с тем, что примерно полгода назад промелькнуло сообщение о скором выходе обновленного звукового движка. Вот я и жду его каждый раз. по поводу Демагода. прога очень удобная. совсем не сложная. всеядная. правда, на моем ноуте с Core i5 немного тормозит по сравнению с AMD. Там в среднем 1.5 ч идет кодирование. У меня же 2.5 ч. Добавляю каждый раз в словарь новые позиции. Но, это не сложно.
Дата: Воскресенье, 26.11.2023, 14:30 | Сообщение #161
Группа: Пользователи
Сообщений: 178
Статус: Offline
Цитатаserjufa ()
примерно полгода назад промелькнуло сообщение о скором выходе обновленного звукового движка.
обновление было и оно обсуждалось. Но пришли к выводу, что обновлять объективно не стоит. Почитайте ветку начиная с этого сообщения: https://mytts-info.ucoz.net/forum/16-51-846-16-1692266064 И вы поймёте почему новое не всегда лучшее
Сообщение отредактировал tonio_k - Воскресенье, 26.11.2023, 14:30
Дата: Воскресенье, 26.11.2023, 20:39 | Сообщение #162
Группа: Пользователи
Сообщений: 111
Статус: Offline
Цитатаserjufa ()
эта сборка ест только txt?
да utf-8 или CP-1251 (она же Кириллица)
Цитатаserjufa ()
стоит ли переходит на эту сборку?
Если вы не намерены плотно заниматься словарем - то не заметите разницы между версией Picobook_TTS 6.2 и 6.2.2 В ней внесены не большие оптимизации графического режима.
Пико делалось по прицепу раз настроил и забыл. Кидаете txt в каталог с пико Запускаете граф. Делаете 1 раз настройки и дальше только запускаете, каталог сам будет открываться с аудио.
Однако в Demagog обработка словарями лучше, но по скорости преобразования они одинаковы. Здесь наверное выбор между удобно и не удобно пользоваться.
Но в текущий момент я работаю над удалением шума из готового аудио.
Beta для много ядерного запуска для CPU. В V6.2.1_potok_file_CC_beta6 txt закидывать в _internal В V6.2.3_potok_file_CC_beta513 txt закидывать в тот же каталог Запускать через Core.exe
Picobook_TTS_Offline_V6.2.3D_CC(сборщик_5.13) при запуске не каких изменений.
Отличие беты от обычного:
В обычно сборке Picobook берет 1 файл и выполняет его на указном кол-ве логических ядер и так каждый файл
В бете - указываем кол-во пулов равные кол-ву логических ядер, но каждый отдельный файл будет обрабатываться на отдельном ядре в отдельном пуле. Нет смысла ставить 4 ядра для 2-ух файлов. Так только 2 ядра будет работать. В этом случае лучше использовать обычную сборку. Однако можно большой файл поделить на куски (например балаболкой). В именах файлов не должно быть пробелов.
Условно 10 кусков 1-ого большого файла завершаться быстрей, чем 1 большой на стандартной сборке с тем же кол-вом ядер.
Иногда это работает быстрей чем на обычной сборке. Особое внимание запуск на 1 пуле с 1 ядром занимает примерно 600-780MB ОЗУ! то есть 4(пула) х 780=3120MB (3.1Гб)
Сообщение отредактировал Pin240 - Суббота, 30.12.2023, 19:00
для обычного использованbя (запуcк через V6.2.6D_GR)
ЦПУ 1.5Гц 1 ядро ОЗУ 4Гб OS Win7x64 Разрешение экрана 1280х720
для V6.2D_CC_MultiPool ЦПУ 1.5Гц 2 физических ядра ОЗУ 4Гб OS Win7x64 Разрешение экрана 800х600
Часто бывает что физических ядер 4 или 8 , но потоков у них 8 и 16. 1 Пул - это процесс, но он может использовать несколько потоков. 1 пул съедает примерно 700-800МВ ОЗУ
Допустим у нас 4 ядра 8 потоков и 8 файлов. Можно сдедлать 1 пул 1 поток, но эффективней 1 пул 2 потока так как меньше задержек цпу - на 1 файл будет 1 физическое ядро.(1 пул 3 потока - не оптимально) Делаем 4пула (3.2Гб ОЗУ в пике) по 2 потока. Будет 4 одновременных операций на 2 потоках
Почти все настройки V6.2D_CC_MultiPool, кроме кол-во пулов и потоков, берутся из V6.2.6D_GR