[ ]
Picobook TTS Offline
Pin240Дата: Вторник, 09.08.2022, 21:40 | Сообщение #31
Группа: Пользователи
Сообщений: 111
Статус: Offline
И так портативная сборка слеплина https://cloud.mail.ru/public/7jkJ/Kw7HnWAmG
python-3.8.10_portable.rar

Если вы раньше боялись что там есть майнеры, то вы ошибаетесь) В конце концов можете не пользоваться сборкой а самостоятельно собрать все зависимости. И так  приступим к описанию:

У нас есть 5 BAT-файла чтобы каждый раз не вбивать руками особенно это касается Picobook_TTS_Offline_Console_V4.1_CC

1)Picobook_TTS_Offline_Console_V4.bat

Код
python.exe Picobook_TTS_Offline_Console_V4.py


2)Picobook_TTS_Offline_Console_V4.1_CC_HELP.bat
Код
python.exe Picobook_TTS_Offline_Console_V4.1_CC.py -h
@pause

Просто вызов справки всех команд

3)Picobook_TTS_Offline_Console_V4.1_CC.bat

Код
python.exe Picobook_TTS_Offline_Console_V4.1_CC.py -C 2 -T book.txt
Думаю отрыть текстовым редактором и подправить на нужные параметры смогут все)

4)cmd.bat

Код
CMD.exe
Запуск в текущем каталоге

5)cmd _path.bat

Код
set PATH=%PATH%;%CD%

Просто забыл удалить, после эксперементов smile создание временных переменных для текущего пользователя.

Версию с инсталятором пока не выкладываю, так как там трабалы с запуском от локального пользователя.


Сообщение отредактировал Pin240 - Вторник, 09.08.2022, 21:43
 
Pin240Дата: Четверг, 11.08.2022, 18:14 | Сообщение #32
Группа: Пользователи
Сообщений: 111
Статус: Offline
И так вот и новая версия на подходе https://cloud.mail.ru/public/7jkJ/Kw7HnWAmG

Обращаю внимания что TTS_OffCon_V4.3.exe это УСТАНОВОЧНЫЙ пакет. Не используйте его если у Вас установлен python  с которым вы работаете. Причина - смена ассоциаций файлов, однако для запуска не нужны будут батники. Собран программой Advanced Installe

INFO: Python: 3.8.10 portable
INFO: Platform: Windows-7-6.1.7601-SP1 x64

V4.3

Добавлено:
- Имя файла наследуется от источника (Не желательны пробелы в именах)
- Готовые файлы перемещаются в указанный каталог. Команда -OD OUT_DIR, --out_dir OUT_DIR
- Отдельный каталог для аудио. Открывается после завершения операции
- Автоопределени между UTF-8 и CP1251

Оптимизировано:
- Файлы можно указывать из любого места.

Изменения:
- Подключение отдельного словаря.
Не забудье тогда обьеденить славари иначе простоновка ударенний БУДЕТ РАБОТАТЬ НЕ КОРРЕКТНО и вызовет ошибку.
- Разбиение текста. Увиличение паузы между предложениями.
- Запуск через батники.
- Звук оканчания можно выключить.

Исправленния:
- SSML работает.


Сообщение отредактировал Pin240 - Четверг, 11.08.2022, 18:15
 
Pin240Дата: Среда, 17.08.2022, 17:24 | Сообщение #33
Группа: Пользователи
Сообщений: 111
Статус: Offline
kostia Для обучения и создание модели , для звука, требуется более 4 Гб ОЗУ и в некоторых случаях в  разы больше( для модели 48000Гц требуется не менее 32Гб и видяху из серии rtx с 16Гб! ). По этому требуется x64 версии. Даже если пересобрать из исходников  torch в след за ним придется еще кучу пакетов пересобирать, и даже после этого нет 100% гарантии работоспособности, так как некоторые функции могли быть заточены на х64. Но очень хочется по пробовать собрать  :D

Сообщение отредактировал Pin240 - Среда, 17.08.2022, 17:28
 
Pin240Дата: Воскресенье, 28.08.2022, 23:36 | Сообщение #34
Группа: Пользователи
Сообщений: 111
Статус: Offline
Скрипт еще жив)) Работа потихоньку идет
Вылез не приятный баг с большими текстами(более 1.5МВ размера), при расстановке ударения.
Вылетает ошибка переполнения памяти.  Поэтому снова лапатить деление + немного изменить структуру кода на более правильную и менее карявую.
Со следующей версии можно будет пакетно обрабатывать файлы.
1) скопировать текстовые файлы txt (с любым именем )  в каталог.
2) запустить bat и указать ЛЮБОЙ путь.
В указном каталоге  будет создан подкаталог с именем книги и заветным содержимым happy
По умолчанию каталог откроется после завершения.

В новостях от разраба модели узнал что скоро свой модуль расстановки ударения можно будет удалить, так как в модели он будет уже встроен и до учен как полагается(с 4 версии модели ). Он и сейчас есть, но его эффективность хромает.
До очередной версии осталось не долго 

Акцентирую я ставлю цель сделать не читалку в реальном времени, а инструмент перегона текста в аудио


Сообщение отредактировал Pin240 - Воскресенье, 28.08.2022, 23:37
 
tonio_kДата: Понедельник, 29.08.2022, 09:42 | Сообщение #35
Группа: Пользователи
Сообщений: 178
Статус: Offline
Цитата Pin240 ()
при расстановке ударения.Вылетает ошибка переполнения памяти.
Нужно словари применять не ко всему тексту, а к каждому отрезку, на которой текст разбирается. Оптимально будет разбить текст на куски размером примерно на страницу А4 по количеству символов.
А если словарь создавать и пополнять с привязкой к ключевому слову, то скорость работы словаря можно увеличить в разы. И с памятью проблемы не будет... Ну, может, в отдалённом будущем, когда словарь разрастётся. 
Цитата Pin240 ()
скоро свой модуль расстановки ударения можно будет удалить, так как в модели он будет уже встроен
может, и можно будет очистить сам словарь, если на практике выяснилось, что словарь чаще вносит ошибки в произношение, чем улучшает. А вот модуль и сам словарь удалять не стоит. Как бы разработчик не обучал свою модель, Русский язык такой многогранный предмет, что словарь, все равно будет нужен. 
В теории, может и можно обучить модель так, что произношение с субъективного "терпимо" перейдёт в категорию "приемлемо". Но даже тут для перфекционистов нужно оставить инструменты для творчества. 

А вообще, когда произношение голосового движка качественно улучшается, для составителя словарей это головная боль. Столько своих наработок сделано, сидишь и думаешь, что проще: оставить свой словарь "как есть" и исправлять его только когда возникают ложные срабатывания, или удалить полностью все словари и добавлять правила по мере выявления косяков самого голосового движка. А если новый голосовой движок появится более качественный по звучанию, но хуже по расстановке ударений, и вообще как узнать, на сколько лучше теперь обучена модель? На какого рода книгах она обучалась? Столько нюансов...  tomato 
 
Pin240Дата: Понедельник, 29.08.2022, 20:36 | Сообщение #36
Группа: Пользователи
Сообщений: 111
Статус: Offline
Цитата tonio_k Оптимально будет разбить текст на куски

90% это будет отдельная настройка, так как на каждом компе разное кол-во оперативы. Я уже провожу тесты на загруженность памяти исходя из кол-ва символов. Примерно 1гб на 100 000 символов.
Заметил факт. даже если будет 500 символов время займет 3 минуты. 5000 слов ~ 6.8Гб (ОЗУ и подкачки вместе) кстати за 4-6 мин справляется. Опробовал сразу 2 млн символов итог 32Гб озу с подкачкой. Естественно из за скорости HDD ждать долго (у меня 8 гб оперативы).
Цитата tonio_kс  привязкой к ключевому слову

Так он и работает.

Цитата tonio_k теперь обучена модель?

Ее не обучают с 0 - ее ДОучивают.
Теперь в моем словаре почти чисто. Там остались замены для ударений и некоторые спец символы. Поэтому я написал: Если делаете свой словарь скопируйте из моего замены их не много выглядят так

Код
А́ = +А
Е́ = +Е
И́ = +И
О́ = +О
У́ = +У
Э́ = +Э
Ю́ = +Ю
Я́ = +Я
а́ = +а
е́ = +е
и́ = +и
о́ = +о
у́ = +у
ы́ = +ы
э́ = +э
ю́ = +ю
я́ = +я
Лично я пользуюсь простанавкой ударений и иногда в словарь имена за нашу.


Сообщение отредактировал Pin240 - Понедельник, 29.08.2022, 20:40
 
Pin240Дата: Суббота, 03.09.2022, 20:53 | Сообщение #37
Группа: Пользователи
Сообщений: 111
Статус: Offline
Вот и новый релиз Picobook_TTS_Offline_Console_V4.5_CC_portable

Не пугайтесь! Запаковал в exe rar  архив.

1)Закидываем txt файлы в каталог
2) Запускаем Picobook_TTS_Offline_Console_V4.5_CC_ALL_TXT.bat
3) Пару раз жмем пробел и указываем нужный путь. Чтобы не писать в ручную можно просто перенести нужный каталог в консоль. Она сама отобразит путь
4) Ждем процесс.

Справку по командам получаем через Picobook_TTS_Offline_Console_V4.5_CC_HELP.bat и в открыв Picobook_TTS_Offline_Console_V4.5_CC_ALL_TXT.bat в любом текстовом редакторе поменяйте на нужные вам.

Сейчас в Picobook_TTS_Offline_Console_V4.5_CC_ALL_TXT.bat такое содержимое:
Код
@chcp 1251::Запуск чисткиcall clear.bat
echo Чистка закончилась
Set /P $Input=  Введите путь к каталогу для продолжения или перенесите каталог в консоль ^>
FOR  %%f IN (*.txt) DO (echo.echo %%fpython.exe Picobook_TTS_Offline_Console_V4.5_CC.py -C 6 -SM 2 -ATF 0.85 -SG 1 -ST 750 -R 1 -SP 4 -T "%%f"  -OD %$Input% -OPD 1 -H 0 -S 1 -HT 0
)
::Открыть текущий каталог::start %cd%
@chcp 65001
pause

Появился флаг -ATF 0.85 Он усредняет скорость темпа. Скачки в скорости голоса становятся медленней так как используется среднеквадратичное значение.
Сейчас постановка ударения отключена -HT 0. Параметр -C 6 - кол-во задействованных  ядер. Даже если у вас их 2 - это не вызовет ошибку. Просто проц будет использовать все доступные ядра в плоть до 6 включительно, если их 8.
Кому лень редачит bat, прикрепил Picobook_TTS_Offline_Console_V4.5_CC_ALL_TXT_C1_HT1.bat с таким кодом:
Код
@chcp 1251::Запуск чисткиcall clear.bat
echo Чистка закончилась
Set /P $Input=  Введите путь к каталогу для продолжения или перенесите каталог в консоль ^>
FOR  %%f IN (*.txt) DO (echo.echo %%fpython.exe Picobook_TTS_Offline_Console_V4.5_CC.py -C 1 -SM 2 -ATF 0.85 -SG 1 -ST 750 -R 1 -SP 4 -T "%%f"  -OD %$Input% -OPD 1 -H 0 -S 1 -HT 1
)
::Открыть текущий каталог::start %cd%
@chcp 65001
pause
Тестим и пишем комменты а лучше финансово подержать,на электричество biggrin , писать в лс))

В общем-то я добился того функционала который хотел. Возможно пока отложу скрипт в сторонку на пару месяцев, А затем сделаю графический интерфейс и отойду от батников.
Прикрепления: Picobook_TTS_Of.bat (0.4 Kb)


Сообщение отредактировал Pin240 - Суббота, 03.09.2022, 21:31
 
Pin240Дата: Вторник, 13.09.2022, 18:29 | Сообщение #38
Группа: Пользователи
Сообщений: 111
Статус: Offline
На выходных побадался с pyinstaller. Итог:  снова полностью переносимая сборка без установки и вникания портативного питона yahoo

Действия сведены к минимуму:
Закидываем txt файлы,  с любым именем ,в каталог и сразу можем запустить Picobook_TTS_Offline_Console_V4.5_CC.exe

Если мы просто запускаем Picobook_TTS_Offline_Console_V4.6_CC.exe то по умолчанию имеем следующие настройки
Код

-C 1 -SM 2 -ATF 0.95 -SG 1 -ST 1500 -R 1 -SP 4  -D /dic/dic.txt  -OD \AUDIO -OPD 1 -H 0 -S 1 -HT 1

Скрипт сам найдет все txt
Задействовано:

-1 ядро процессора
-Качество 2=24kHz
-Скорость темпа аудио 95%
-Собрать все мелкие фрагменты в более крупные  1=ДА
-Параметр разбивки для  ffmpeg от 100 до 3000. 1500~25мин
-Удалить собранный файл Book_full.mp3 1=ДА (прежде чем разбить все собирается  в 1 файл)
-Выберите голос 4=xenia
-D /dic/dic.txt  путь к словарю
-Путь сохранения. Открытие в конце операции.(Пример пути "C:\\test") AUDIO
-OPD  Открытие каталог в конце операции ДА=1
-H 0 Переход в гибернацию 0=НЕТ
-S 1 Звуковой сигнал включен 1=ДА
-HT 1 Постановка ударений  1=ДА

Для любителей отдельной настройки Picobook_TTS_Offline_Console_V4.5_CC.bat
Код
@chcp 1251
Set /P $Input=  Введите путь к каталогу для продолжения или перенесите каталог в консоль ^>
Picobook_TTS_Offline_Console_V4.6_CC.exe -C 2 -SM 2 -ATF 0.95 -SG 1 -ST 1500 -R 1 -SP 4  -OD %$Input% -OPD 1 -H 0 -S 1 -HT 1

@chcp 65001pause

Если забыли команды запустите Picobook TTS Offline Console V4.6 CC HELP.bat
Запаковал  в rar архив(300мв). Вес сборки вне архива ~2гб
https://cloud.mail.ru/public/s1pk/Ecxp5XGLS

Возможно и нет смысла делать графический интерфейс.


Сообщение отредактировал Pin240 - Вторник, 13.09.2022, 18:32
 
FilkoeДата: Понедельник, 03.10.2022, 18:07 | Сообщение #39
Группа: Пользователи
Сообщений: 1
Статус: Offline
Из-за ; (точки с запятой) текст не правильно делит. и поэтому происходит переполнение 
RuntimeError: The size of tensor a (5484) must match the size of tensor b (5000) at non-singleton dimension 0
 
Pin240Дата: Понедельник, 03.10.2022, 18:15 | Сообщение #40
Группа: Пользователи
Сообщений: 111
Статус: Offline
в версии 4.6 замечен недочет со знаком ";" который не включен как разделительный символ.
Этот словарик исправляет этот недуг smile

Еще замечена проблема с антивирусам, при попытке открыть каталог. Достаточно добавить исполняемый файл в исключение или просто поставьте  параметр -OPD 0 Каталог не будет открываться сам и антивир не будет ругаться

Все же открытие каталога с пробелами в пути - это баг. Скоро перезалью.

У нас есть Discord канал https://discord.gg/8yFTauF9
Но быстрей будет написать мне в ВК
Прикрепления: dic.txt (5.1 Kb)


Сообщение отредактировал Pin240 - Понедельник, 03.10.2022, 21:30
 
Pin240Дата: Суббота, 08.10.2022, 07:37 | Сообщение #41
Группа: Пользователи
Сообщений: 111
Статус: Offline
Телеграмм 
https://t.me/myttsinfo
 
Pin240Дата: Суббота, 15.10.2022, 19:43 | Сообщение #42
Группа: Пользователи
Сообщений: 111
Статус: Offline
Ну вот и  новая версия 4.7.2 https://cloud.mail.ru/public/7jkJ/Kw7HnWAmG
Переделана обработка словарем
Теперь ПК, помимо перехода в гебирнацию, можно выключить автоматом
Все доступные параметры можно просмотреть  запустив программу через CMD  с ключем  -h

Батник вне архива

Нашел ошибку при перегоне от 2 и более файлов
созданные файлы переместятся в каталог  с именем последнего файла


Сообщение отредактировал Pin240 - Суббота, 15.10.2022, 23:20
 
Pin240Дата: Пятница, 21.10.2022, 21:29 | Сообщение #43
Группа: Пользователи
Сообщений: 111
Статус: Offline
Пока что  тестовая версия  4.8 с прогресс барам, на "пащупать", главное первый прогресс бар не дергать пака что. Потихоньку будет обрастать граф интерфейсом https://cloud.mail.ru/public/7jkJ/Kw7HnWAmG
2-ой будет дергаться - это нормально


Сообщение отредактировал Pin240 - Пятница, 21.10.2022, 21:30
 
notnickДата: Вторник, 01.11.2022, 18:01 | Сообщение #44
Группа: Пользователи
Сообщений: 35
Статус: Offline
А как её запускать? 
Просто распаковать и нажать на екзешник?
В Винде-32бит работать может?
 
tonio_kДата: Вторник, 01.11.2022, 18:35 | Сообщение #45
Группа: Пользователи
Сообщений: 178
Статус: Offline
Цитата notnick ()
В Винде-32бит работать может?
Тут обсуждали. На данный момент на Win32бит Silero запустить нельзя.
 
Поиск:

Общение