Picobook TTS Offline
|
|
Pin240 | Дата: Вторник, 09.08.2022, 21:40 | Сообщение #31 |
Группа: Пользователи
Сообщений: 111
Статус: Offline
| И так портативная сборка слеплина https://cloud.mail.ru/public/7jkJ/Kw7HnWAmG python-3.8.10_portable.rar
Если вы раньше боялись что там есть майнеры, то вы ошибаетесь) В конце концов можете не пользоваться сборкой а самостоятельно собрать все зависимости. И так приступим к описанию:
У нас есть 5 BAT-файла чтобы каждый раз не вбивать руками особенно это касается Picobook_TTS_Offline_Console_V4.1_CC
1)Picobook_TTS_Offline_Console_V4.bat Код python.exe Picobook_TTS_Offline_Console_V4.py
2)Picobook_TTS_Offline_Console_V4.1_CC_HELP.bat
Код python.exe Picobook_TTS_Offline_Console_V4.1_CC.py -h @pause
Просто вызов справки всех команд
3)Picobook_TTS_Offline_Console_V4.1_CC.bat Код python.exe Picobook_TTS_Offline_Console_V4.1_CC.py -C 2 -T book.txt
Думаю отрыть текстовым редактором и подправить на нужные параметры смогут все)
4)cmd.bat Запуск в текущем каталоге
5)cmd _path.bat Просто забыл удалить, после эксперементов создание временных переменных для текущего пользователя.
Версию с инсталятором пока не выкладываю, так как там трабалы с запуском от локального пользователя.
Сообщение отредактировал Pin240 - Вторник, 09.08.2022, 21:43 |
|
| |
Pin240 | Дата: Четверг, 11.08.2022, 18:14 | Сообщение #32 |
Группа: Пользователи
Сообщений: 111
Статус: Offline
| И так вот и новая версия на подходе https://cloud.mail.ru/public/7jkJ/Kw7HnWAmG
Обращаю внимания что TTS_OffCon_V4.3.exe это УСТАНОВОЧНЫЙ пакет. Не используйте его если у Вас установлен python с которым вы работаете. Причина - смена ассоциаций файлов, однако для запуска не нужны будут батники. Собран программой Advanced Installe
INFO: Python: 3.8.10 portable INFO: Platform: Windows-7-6.1.7601-SP1 x64
V4.3
Добавлено: - Имя файла наследуется от источника (Не желательны пробелы в именах) - Готовые файлы перемещаются в указанный каталог. Команда -OD OUT_DIR, --out_dir OUT_DIR - Отдельный каталог для аудио. Открывается после завершения операции - Автоопределени между UTF-8 и CP1251
Оптимизировано: - Файлы можно указывать из любого места.
Изменения: - Подключение отдельного словаря. Не забудье тогда обьеденить славари иначе простоновка ударенний БУДЕТ РАБОТАТЬ НЕ КОРРЕКТНО и вызовет ошибку. - Разбиение текста. Увиличение паузы между предложениями. - Запуск через батники. - Звук оканчания можно выключить.
Исправленния: - SSML работает.
Сообщение отредактировал Pin240 - Четверг, 11.08.2022, 18:15 |
|
| |
Pin240 | Дата: Среда, 17.08.2022, 17:24 | Сообщение #33 |
Группа: Пользователи
Сообщений: 111
Статус: Offline
| kostia Для обучения и создание модели , для звука, требуется более 4 Гб ОЗУ и в некоторых случаях в разы больше( для модели 48000Гц требуется не менее 32Гб и видяху из серии rtx с 16Гб! ). По этому требуется x64 версии. Даже если пересобрать из исходников torch в след за ним придется еще кучу пакетов пересобирать, и даже после этого нет 100% гарантии работоспособности, так как некоторые функции могли быть заточены на х64. Но очень хочется по пробовать собрать :D
Сообщение отредактировал Pin240 - Среда, 17.08.2022, 17:28 |
|
| |
Pin240 | Дата: Воскресенье, 28.08.2022, 23:36 | Сообщение #34 |
Группа: Пользователи
Сообщений: 111
Статус: Offline
| Скрипт еще жив)) Работа потихоньку идет Вылез не приятный баг с большими текстами(более 1.5МВ размера), при расстановке ударения. Вылетает ошибка переполнения памяти. Поэтому снова лапатить деление + немного изменить структуру кода на более правильную и менее карявую. Со следующей версии можно будет пакетно обрабатывать файлы. 1) скопировать текстовые файлы txt (с любым именем ) в каталог. 2) запустить bat и указать ЛЮБОЙ путь. В указном каталоге будет создан подкаталог с именем книги и заветным содержимым  По умолчанию каталог откроется после завершения.
В новостях от разраба модели узнал что скоро свой модуль расстановки ударения можно будет удалить, так как в модели он будет уже встроен и до учен как полагается(с 4 версии модели ). Он и сейчас есть, но его эффективность хромает. До очередной версии осталось не долго 
Акцентирую я ставлю цель сделать не читалку в реальном времени, а инструмент перегона текста в аудио
Сообщение отредактировал Pin240 - Воскресенье, 28.08.2022, 23:37 |
|
| |
tonio_k | Дата: Понедельник, 29.08.2022, 09:42 | Сообщение #35 |
Группа: Пользователи
Сообщений: 178
Статус: Offline
| Цитата Pin240 (  ) при расстановке ударения.Вылетает ошибка переполнения памяти. Нужно словари применять не ко всему тексту, а к каждому отрезку, на которой текст разбирается. Оптимально будет разбить текст на куски размером примерно на страницу А4 по количеству символов. А если словарь создавать и пополнять с привязкой к ключевому слову, то скорость работы словаря можно увеличить в разы. И с памятью проблемы не будет... Ну, может, в отдалённом будущем, когда словарь разрастётся.
Цитата Pin240 (  ) скоро свой модуль расстановки ударения можно будет удалить, так как в модели он будет уже встроен может, и можно будет очистить сам словарь, если на практике выяснилось, что словарь чаще вносит ошибки в произношение, чем улучшает. А вот модуль и сам словарь удалять не стоит. Как бы разработчик не обучал свою модель, Русский язык такой многогранный предмет, что словарь, все равно будет нужен. В теории, может и можно обучить модель так, что произношение с субъективного "терпимо" перейдёт в категорию "приемлемо". Но даже тут для перфекционистов нужно оставить инструменты для творчества.
А вообще, когда произношение голосового движка качественно улучшается, для составителя словарей это головная боль. Столько своих наработок сделано, сидишь и думаешь, что проще: оставить свой словарь "как есть" и исправлять его только когда возникают ложные срабатывания, или удалить полностью все словари и добавлять правила по мере выявления косяков самого голосового движка. А если новый голосовой движок появится более качественный по звучанию, но хуже по расстановке ударений, и вообще как узнать, на сколько лучше теперь обучена модель? На какого рода книгах она обучалась? Столько нюансов...
|
|
| |
Pin240 | Дата: Понедельник, 29.08.2022, 20:36 | Сообщение #36 |
Группа: Пользователи
Сообщений: 111
Статус: Offline
| Цитата tonio_k Оптимально будет разбить текст на куски
90% это будет отдельная настройка, так как на каждом компе разное кол-во оперативы. Я уже провожу тесты на загруженность памяти исходя из кол-ва символов. Примерно 1гб на 100 000 символов. Заметил факт. даже если будет 500 символов время займет 3 минуты. 5000 слов ~ 6.8Гб (ОЗУ и подкачки вместе) кстати за 4-6 мин справляется. Опробовал сразу 2 млн символов итог 32Гб озу с подкачкой. Естественно из за скорости HDD ждать долго (у меня 8 гб оперативы). Цитата tonio_kс привязкой к ключевому слову
Так он и работает.
Цитата tonio_k теперь обучена модель?
Ее не обучают с 0 - ее ДОучивают. Теперь в моем словаре почти чисто. Там остались замены для ударений и некоторые спец символы. Поэтому я написал: Если делаете свой словарь скопируйте из моего замены их не много выглядят так
Код А́ = +А Е́ = +Е И́ = +И О́ = +О У́ = +У Э́ = +Э Ю́ = +Ю Я́ = +Я а́ = +а е́ = +е и́ = +и о́ = +о у́ = +у ы́ = +ы э́ = +э ю́ = +ю я́ = +я Лично я пользуюсь простанавкой ударений и иногда в словарь имена за нашу.
Сообщение отредактировал Pin240 - Понедельник, 29.08.2022, 20:40 |
|
| |
Pin240 | Дата: Суббота, 03.09.2022, 20:53 | Сообщение #37 |
Группа: Пользователи
Сообщений: 111
Статус: Offline
| Вот и новый релиз Picobook_TTS_Offline_Console_V4.5_CC_portable
Не пугайтесь! Запаковал в exe rar архив.
1)Закидываем txt файлы в каталог 2) Запускаем Picobook_TTS_Offline_Console_V4.5_CC_ALL_TXT.bat 3) Пару раз жмем пробел и указываем нужный путь. Чтобы не писать в ручную можно просто перенести нужный каталог в консоль. Она сама отобразит путь 4) Ждем процесс.
Справку по командам получаем через Picobook_TTS_Offline_Console_V4.5_CC_HELP.bat и в открыв Picobook_TTS_Offline_Console_V4.5_CC_ALL_TXT.bat в любом текстовом редакторе поменяйте на нужные вам.
Сейчас в Picobook_TTS_Offline_Console_V4.5_CC_ALL_TXT.bat такое содержимое: Код @chcp 1251::Запуск чисткиcall clear.bat echo Чистка закончилась Set /P $Input= Введите путь к каталогу для продолжения или перенесите каталог в консоль ^> FOR %%f IN (*.txt) DO (echo.echo %%fpython.exe Picobook_TTS_Offline_Console_V4.5_CC.py -C 6 -SM 2 -ATF 0.85 -SG 1 -ST 750 -R 1 -SP 4 -T "%%f" -OD %$Input% -OPD 1 -H 0 -S 1 -HT 0 ) ::Открыть текущий каталог::start %cd% @chcp 65001 pause
Появился флаг -ATF 0.85 Он усредняет скорость темпа. Скачки в скорости голоса становятся медленней так как используется среднеквадратичное значение. Сейчас постановка ударения отключена -HT 0. Параметр -C 6 - кол-во задействованных ядер. Даже если у вас их 2 - это не вызовет ошибку. Просто проц будет использовать все доступные ядра в плоть до 6 включительно, если их 8. Кому лень редачит bat, прикрепил Picobook_TTS_Offline_Console_V4.5_CC_ALL_TXT_C1_HT1.bat с таким кодом: Код @chcp 1251::Запуск чисткиcall clear.bat echo Чистка закончилась Set /P $Input= Введите путь к каталогу для продолжения или перенесите каталог в консоль ^> FOR %%f IN (*.txt) DO (echo.echo %%fpython.exe Picobook_TTS_Offline_Console_V4.5_CC.py -C 1 -SM 2 -ATF 0.85 -SG 1 -ST 750 -R 1 -SP 4 -T "%%f" -OD %$Input% -OPD 1 -H 0 -S 1 -HT 1 ) ::Открыть текущий каталог::start %cd% @chcp 65001 pause Тестим и пишем комменты а лучше финансово подержать,на электричество , писать в лс))
В общем-то я добился того функционала который хотел. Возможно пока отложу скрипт в сторонку на пару месяцев, А затем сделаю графический интерфейс и отойду от батников.
Сообщение отредактировал Pin240 - Суббота, 03.09.2022, 21:31 |
|
| |
Pin240 | Дата: Вторник, 13.09.2022, 18:29 | Сообщение #38 |
Группа: Пользователи
Сообщений: 111
Статус: Offline
| На выходных побадался с pyinstaller. Итог: снова полностью переносимая сборка без установки и вникания портативного питона 
Действия сведены к минимуму: Закидываем txt файлы, с любым именем ,в каталог и сразу можем запустить Picobook_TTS_Offline_Console_V4.5_CC.exe
Если мы просто запускаем Picobook_TTS_Offline_Console_V4.6_CC.exe то по умолчанию имеем следующие настройки Код
-C 1 -SM 2 -ATF 0.95 -SG 1 -ST 1500 -R 1 -SP 4 -D /dic/dic.txt -OD \AUDIO -OPD 1 -H 0 -S 1 -HT 1
Скрипт сам найдет все txt Задействовано:
-1 ядро процессора -Качество 2=24kHz -Скорость темпа аудио 95% -Собрать все мелкие фрагменты в более крупные 1=ДА -Параметр разбивки для ffmpeg от 100 до 3000. 1500~25мин -Удалить собранный файл Book_full.mp3 1=ДА (прежде чем разбить все собирается в 1 файл) -Выберите голос 4=xenia -D /dic/dic.txt путь к словарю -Путь сохранения. Открытие в конце операции.(Пример пути "C:\\test") AUDIO -OPD Открытие каталог в конце операции ДА=1 -H 0 Переход в гибернацию 0=НЕТ -S 1 Звуковой сигнал включен 1=ДА -HT 1 Постановка ударений 1=ДА
Для любителей отдельной настройки Picobook_TTS_Offline_Console_V4.5_CC.bat Код @chcp 1251 Set /P $Input= Введите путь к каталогу для продолжения или перенесите каталог в консоль ^> Picobook_TTS_Offline_Console_V4.6_CC.exe -C 2 -SM 2 -ATF 0.95 -SG 1 -ST 1500 -R 1 -SP 4 -OD %$Input% -OPD 1 -H 0 -S 1 -HT 1
@chcp 65001pause
Если забыли команды запустите Picobook TTS Offline Console V4.6 CC HELP.bat Запаковал в rar архив(300мв). Вес сборки вне архива ~2гб https://cloud.mail.ru/public/s1pk/Ecxp5XGLS
Возможно и нет смысла делать графический интерфейс.
Сообщение отредактировал Pin240 - Вторник, 13.09.2022, 18:32 |
|
| |
Filkoe | Дата: Понедельник, 03.10.2022, 18:07 | Сообщение #39 |
Группа: Пользователи
Сообщений: 1
Статус: Offline
| Из-за ; (точки с запятой) текст не правильно делит. и поэтому происходит переполнение RuntimeError: The size of tensor a (5484) must match the size of tensor b (5000) at non-singleton dimension 0
|
|
| |
Pin240 | Дата: Понедельник, 03.10.2022, 18:15 | Сообщение #40 |
Группа: Пользователи
Сообщений: 111
Статус: Offline
| в версии 4.6 замечен недочет со знаком ";" который не включен как разделительный символ. Этот словарик исправляет этот недуг 
Еще замечена проблема с антивирусам, при попытке открыть каталог. Достаточно добавить исполняемый файл в исключение или просто поставьте параметр -OPD 0 Каталог не будет открываться сам и антивир не будет ругаться
Все же открытие каталога с пробелами в пути - это баг. Скоро перезалью.
У нас есть Discord канал https://discord.gg/8yFTauF9 Но быстрей будет написать мне в ВК
Сообщение отредактировал Pin240 - Понедельник, 03.10.2022, 21:30 |
|
| |
Pin240 | Дата: Суббота, 08.10.2022, 07:37 | Сообщение #41 |
Группа: Пользователи
Сообщений: 111
Статус: Offline
| Телеграмм https://t.me/myttsinfo
|
|
| |
Pin240 | Дата: Суббота, 15.10.2022, 19:43 | Сообщение #42 |
Группа: Пользователи
Сообщений: 111
Статус: Offline
| Ну вот и новая версия 4.7.2 https://cloud.mail.ru/public/7jkJ/Kw7HnWAmG Переделана обработка словарем Теперь ПК, помимо перехода в гебирнацию, можно выключить автоматом Все доступные параметры можно просмотреть запустив программу через CMD с ключем -h Батник вне архива
Нашел ошибку при перегоне от 2 и более файлов созданные файлы переместятся в каталог с именем последнего файла
Сообщение отредактировал Pin240 - Суббота, 15.10.2022, 23:20 |
|
| |
Pin240 | Дата: Пятница, 21.10.2022, 21:29 | Сообщение #43 |
Группа: Пользователи
Сообщений: 111
Статус: Offline
| Пока что тестовая версия 4.8 с прогресс барам, на "пащупать", главное первый прогресс бар не дергать пака что. Потихоньку будет обрастать граф интерфейсом https://cloud.mail.ru/public/7jkJ/Kw7HnWAmG 2-ой будет дергаться - это нормально
Сообщение отредактировал Pin240 - Пятница, 21.10.2022, 21:30 |
|
| |
notnick | Дата: Вторник, 01.11.2022, 18:01 | Сообщение #44 |
Группа: Пользователи
Сообщений: 35
Статус: Offline
| А как её запускать? Просто распаковать и нажать на екзешник? В Винде-32бит работать может?
|
|
| |
tonio_k | Дата: Вторник, 01.11.2022, 18:35 | Сообщение #45 |
Группа: Пользователи
Сообщений: 178
Статус: Offline
| Цитата notnick (  ) В Винде-32бит работать может? Тут обсуждали. На данный момент на Win32бит Silero запустить нельзя.
|
|
| |