Demagog TTS - Страница 6

[ ]

Страница 6 из 12 « 1 2 … 4 5 6 7 8 … 11 12 »
Модератор форума: flegont

Demagog TTS

flegont

Дата: Четверг, 22.07.2021, 01:25 | Сообщение #1

V.I.P.

Группа: Модераторы

Сообщений: 141

Статус: Offline

Начало темы здесь (ссылка на архивную копию форума mytts.info)

(44,0 Mb) архивная копия начала текущей ветки с форума mytts.info - для офлайн просмотра и поиска по всем страницам

Домашняя страница

Скачать сохраненную копию:
Demagog 7.30.422
Demagog 7.30.422-x64

serjufa

Дата: Воскресенье, 19.03.2023, 17:47 | Сообщение #76

Группа: Пользователи

Сообщений: 18

Статус: Offline

здравствуйте.
подскажите, как после склейки mp3 (в виде почасовых файлов) автоматически удалить кучу мелких исходных mp3 и папки BOOK & SCRIPT с содержимым.
приходится вручную удалять.

PS
если кому интересно - сравнил 24 и 48 КГц по трем женским исполнителям. Разницы между КГц не просек. Размеры файлов не меняются. Хуже всех из женщин - Бая (ИМХО). Мужички подкачали уж очень сильно. Как древний вариант Балабола. Их не стал даже запоминать. Ссылка на яндекс: сравнение озвучки

Сообщение отредактировал serjufa - Воскресенье, 19.03.2023, 18:24

wasyaka

Дата: Воскресенье, 19.03.2023, 19:41 | Сообщение #77

Группа: Модераторы

Сообщений: 35

Статус: Offline

Цитата serjufa (

)

если кому интересно - сравнил

- Проект заточен под офлайн - и качество ждать... ИМХО - проще Ивону юзать.
а онлайн: Сравнение

Сообщение отредактировал wasyaka - Воскресенье, 19.03.2023, 19:41

serjufa

Дата: Четверг, 06.04.2023, 07:32 | Сообщение #78

Группа: Пользователи

Сообщений: 18

Статус: Offline

здравствуйте.
на ресурсе ссылка есть упоминание о новом спикере - Евгении.
нельзя ли его прикрутить к Демагогу?

Сообщение отредактировал serjufa - Четверг, 06.04.2023, 07:34

flegont

Дата: Четверг, 06.04.2023, 10:03 | Сообщение #79

V.I.P.

Группа: Модераторы

Сообщений: 141

Статус: Offline

В моей сборке: Demagog-x64-Silero, голос eugene изначально присутствует.
Его нет в сборке от tonio_k, но это - вопрос не ко мне

P.S. Мне Евгений нравится - энергичная, быстрая речь.

serjufa

Дата: Четверг, 06.04.2023, 10:23 | Сообщение #80

Группа: Пользователи

Сообщений: 18

Статус: Offline

тут только маленький файл на 5.2 Мб ссылка.
Наверное, не там смотрю?

flegont

Дата: Четверг, 06.04.2023, 11:08 | Сообщение #81

V.I.P.

Группа: Модераторы

Сообщений: 141

Статус: Offline

Как-то так:

Оф. сайт

Чуть ниже баннера с картой мира: "Введение", дальше таблица для скачивания всяко-разно, в ней 3я - строка

Demagog-x64-Silero

P.S. Мне кажется, что в сборке tonio_k просто нечаянно пропущен пункт меню для eugene, ведь все голоса находятся в одном файле - model.pt, и Евгений там тоже есть.

flegont

Дата: Четверг, 06.04.2023, 11:39 | Сообщение #82

V.I.P.

Группа: Модераторы

Сообщений: 141

Статус: Offline

P.P.S. В сборке tonio_k в папке lib есть файл UserForm2.lua
Надо найти в нем вот такой фрагмент и в нем поправить (выделено красным):
Тогда в меню голосов появится голос Евгений

::_dialog7::--" Голос: "..vo
-- a = Input('Полное или частичное названия голоса',{'Голос'..'='..UserForm.vo}
_shapka = "Выберите голос:"
_items={
"aidar",
"baya",
"kseniya",
"xenia",
"eugene",
"random",
}
if UserForm.vo == "aidar" then t = 1 end
if UserForm.vo == "baya" then t = 2 end
if UserForm.vo == "kseniya" then t = 3 end
if UserForm.vo == "xenia" then t = 4 end
if UserForm.vo == "random" then t = 5 end
dialog0 = Menu(_shapka,_items,t)
if dialog0 == 0 then goto HALT end
if dialog0 == 1 then UserForm.vo = "aidar" end
if dialog0 == 2 then UserForm.vo = "baya" end
if dialog0 == 3 then UserForm.vo ="kseniya" end
if dialog0 == 4 then UserForm.vo = "xenia" end
if dialog0 == 5 then UserForm.vo = "eugene" end
if dialog0 == 6 then UserForm.vo = "random" end
goto SLOV1

...

serjufa

Дата: Четверг, 06.04.2023, 13:08 | Сообщение #83

Группа: Пользователи

Сообщений: 18

Статус: Offline

спасибо.
для общего развития - не подскажите, в чем отличия сборок, ведь TTS один у всех?

flegont

Дата: Четверг, 06.04.2023, 15:41 | Сообщение #84

V.I.P.

Группа: Модераторы

Сообщений: 141

Статус: Offline

tonio_k использует обычную, 32-разрядную версию Demagog, с ее помощью делит текст на мелкие части - временные файлы и создает временный файл script.py - скрипт на питоне, в котором повторяются множество раз практически одинаковые фрагменты:
озвучить временный файл номер такой-то и записать во временный аудиофайл
Затем из Demagog вызывается питон как внешняя программа (версия 3.7 входит в состав сборки) с заданием: выполняй script.py
В завершение, опять же сам Демагог объединяет временные аудиофайлы в более крупные.
И задача - решена!
Достоинства: умеет работать под 64- разрядной Win 7, что важно для слабых компов, которые не тянут десятку или одиннадцатую.

А моя сборка использует 64-разрядную версию Demagog, которая содержит в себе питон версии 3.10, и выполняет всегда один и тот же питон-скрипт - напрямую, из Демагога. Потому что в 64х версии питон является как бы частью Демагога.
Скрипт Text to speech.py сам берет текст из активного окна Демагога, делит его на части и в цикле озвучивает, помещая результат в аудиофалы, которые тут же сам объединяет.
Достоинства: более удобный интерфейс, и можно озвучивать тексты на любом из 6 языков: английский, русский, французский, немецкий, испанский, украинский.
Недостаток: работает только под 64-разрядной Win 10, 11.

tonio_k

Дата: Пятница, 07.04.2023, 02:07 | Сообщение #85

Группа: Пользователи

Сообщений: 179

Статус: Offline

Цитата flegont (

)

Мне кажется, что в сборке tonio_k просто нечаянно пропущен пункт меню для eugene, ведь все голоса находятся в одном файле - model.pt, и Евгений там тоже есть.

Да да, так и было - пропустил. Только я уже пару-тройку месяцев назад поправил и обновил. Только как поправил: рандомный голос убрал (мне показалось его наличие непрактично) и вместо рандомного - Евгения прописал. Лень было его отдельными пунктом заводить. smile

Яндекс - точно ссылка обновлена на предмет Евгения, а вот Google ссылку мог и не обновить - не проверял.

Из самого последнего, ссылка на маленькое обновление в Телеграмме. Добавил пару скриптов что бы Демагог в Линукс под wine с Silero без ошибок работал. И добавил что бы ещё в аудио в ogg формате записать можно было.

Это прошлогодняя доработка.

UPD
В сборке есть поддержка продолжение записи с места прерывания в случае сбоя или, если, сами прервали запись (закрыли чёрное окошко записи). Для старых ПК, когда ставим запись на ночь - функция полезная.

Сообщение отредактировал tonio_k - Пятница, 07.04.2023, 02:16

serjufa

Дата: Пятница, 07.04.2023, 07:22 | Сообщение #86

Группа: Пользователи

Сообщений: 18

Статус: Offline

спасибо. просветили.
еще вопрос - все голоса озвучивают по одному алгоритму? вопрос связан с тем, что мужские голоса очень проигрывают женским в части произношения и ударения.
мне показалось или нет, что разные голоса по-разному работают с ударением, хотя и используют обшие словари

Сообщение отредактировал serjufa - Пятница, 07.04.2023, 07:43

flegont

Дата: Пятница, 07.04.2023, 09:04 | Сообщение #87

V.I.P.

Группа: Модераторы

Сообщений: 141

Статус: Offline

Я запускал озвучку коротких текстов, с отключенными словарями. При этом впечатление такое, что в ударениях все голоса Silero делают одинаковые ошибки на одних и тех же словах. А что до четкости и выразительности произношения, то наверное, дикторы-женщины, на которых обучали нейросетевую модель, просто читали тексты лучше дикторов-мужчин smile

Глава Silero А.Вейсов как-то признался, что все дикторы были НЕ профессионалы. Нанимать профессионалов было бы неподъемно дорого. Вдобавок, возникали проблемы с авторскими правами.

serjufa

Дата: Пятница, 07.04.2023, 10:04 | Сообщение #88

Группа: Пользователи

Сообщений: 18

Статус: Offline

понятно.
сравнил озвучку 2 версий Демогогов (tonio_k и flegont) на примере "Калинин. Лесные призраки".
В обоих случаях кодировка велась с подключением всех словарей от сборки. во второй сборке есть ошибка ударения в "Никита".
Время кодирования у flegont заняло меньше времени.
Вопрос - стоит ли прицепить к сборке flegont словари от tonio_k?
Можно ли добавить к сборке flegont к имени файлов имя книги, как это делается у tonio_k?

файлы прицепил. длинное название соответствует озвучке от tonio_k, короткое - от flegont
файлы

Сообщение отредактировал serjufa - Пятница, 07.04.2023, 10:16

flegont

Дата: Пятница, 07.04.2023, 13:22 | Сообщение #89

V.I.P.

Группа: Модераторы

Сообщений: 141

Статус: Offline

Цитата

стоит ли прицепить к сборке flegont словари от tonio_k?

Какие-то, наверняка, стОит. Какие-то, может, будут излишними. Тут только эксперимент покажет. Я ведь ограничился самым минимумом: большущий словарь ударений Орфоэпия.dic (взятый, кстати, из сборки tonio_k) + собственноручно разработанный numbers.rex + выжимка из разных словарей - Lat2Cyr.dic.

А нужны еще словари для распознания омографов - вечная и ужасная проблема. В Silero ее пытаются решить, дообучив модель, чтобы было 95% распознавание. Похоже, воз и ныне там... А ведь омографы - это не только существительные. Имена собственные тоже могут ими быть.
В гостиной появились его сиятельство, граф НикИта Иванов и его невеста - мадемуазель НикитА Лафорж biggrin

Цитата

Можно ли добавить к сборке flegont к имени файлов имя книги, как это делается у tonio_k?

Немножко доработаю сборку, и будет выбор: добавлять ли имя книги к имени аудио-файла.

flegont

Дата: Воскресенье, 16.04.2023, 14:03 | Сообщение #90

V.I.P.

Группа: Модераторы

Сообщений: 141

Статус: Offline

Demagog-x64-Silero (обновлено до v.419)
Скриншот

Demagog TTS

Страница 6 из 12
«
1
2
…
4
5
6
7
8
…
11
12
»