Demagog TTS - Страница 7

[ ]

Страница 7 из 12 « 1 2 … 5 6 7 8 9 … 11 12 »
Модератор форума: flegont

Demagog TTS

flegont

Дата: Четверг, 22.07.2021, 01:25 | Сообщение #1

V.I.P.

Группа: Модераторы

Сообщений: 141

Статус: Offline

Начало темы здесь (ссылка на архивную копию форума mytts.info)

(44,0 Mb) архивная копия начала текущей ветки с форума mytts.info - для офлайн просмотра и поиска по всем страницам

Домашняя страница

Скачать сохраненную копию:
Demagog 7.30.422
Demagog 7.30.422-x64

serjufa

Дата: Понедельник, 17.04.2023, 08:06 | Сообщение #91

Группа: Пользователи

Сообщений: 18

Статус: Offline

спасибо. запустил на тест.
в прошлой версии выходила постоянная ошибка в файле (см прицеп)
файл fb2

Сообщение отредактировал serjufa - Понедельник, 17.04.2023, 08:07

serjufa

Дата: Понедельник, 17.04.2023, 11:44 | Сообщение #92

Группа: Пользователи

Сообщений: 18

Статус: Offline

спасибо. новая сборка отлично работает.

flegont

Дата: Вторник, 18.04.2023, 22:13 | Сообщение #93

V.I.P.

Группа: Модераторы

Сообщений: 141

Статус: Offline

И вам спасибо, за тестирование.

P.S. Кстати. У скрипта Text to Speech.py, в обеих версиях, обнаружился еще один недостаток. Скрипт позволяет пользователю в настройках выбрать свой временный выходной каталог для готовых аудиофайлов. НО... не следует назначать каталог, уже содержащий какие-то нужные mp3-файлы.
Ибо, если озвучивается текст, просто скопированный в окно Демагога, то у него нет имени файла, и отдельный подкаталог для него не создается. И в ходе генерации аудио будут удалены все "посторонние" mp3 в корне выходного каталога, а вместо них туда же лягут сгенерированные аудиофайлы.
Так что, придется еще подправить скрипт.

flegont

Дата: Среда, 19.04.2023, 14:38 | Сообщение #94

V.I.P.

Группа: Модераторы

Сообщений: 141

Статус: Offline

Если кому понадобится, вот

Скрипт Text to Speech.py теперь при озвучке текста, не загруженного из файла, а помещенного в окно Демагога через Copy/Paste (или набранного вручную, и не сохраненного), и потому не имеющего имени, создает в выходном каталоге подкаталог с именем из 8 случайных латинских букв. И вся работа по генерации и сохранению готового аудио происходит в этом подкаталоге.

flegont

Дата: Среда, 26.04.2023, 15:07 | Сообщение #95

V.I.P.

Группа: Модераторы

Сообщений: 141

Статус: Offline

Новости от Silero

"У нас всё не доходят руки обновить наши публичные модели синтеза на самые супер-быстрые. Но в этом году, скорее всего, мы и до этого доберемся, если случится ряд благоприятных событий".

Иван

Дата: Вторник, 13.06.2023, 18:07 | Сообщение #96

Группа: Пользователи

Сообщений: 1

Статус: Offline

tonio_k, здравствуйте.
Не подскажите, как в вашей сборке, если это возможно, изменить время паузы и после чего она срабатывает?
Насколько я понял, пауза сейчас срабатывает на конец абзаца (0,6 сек) и на многоточие (1 сек).
Я же хочу чтобы на многоточие пауза вообще не срабатывала (т.е. чтобы многоточие читалось, как точка или любой другой знак препинания), но срабатывала на конец абзаца (например, 2 сек) и на определенный символ (например, на ~~~ - 15 сек).
Если вообще это возможно, то что и где нужно прописать?

Пробовал в файле 99.ПАУЗЫ@(phoneme).dic удалить строчки:

Код

*уникальвставкамноготоч уникальнвставкаабзаца*=<break time="1000ms"/>
*...*=.<break time="1000ms"/>.
*уникальвставкамноготоч*=<break time="600ms"/>

и оставить только строчку отвечающую за абзацы + добавить строчку отвечающую за паузу на символ ~~~, итого строчка такого вида:

Код

*уникальнвставкаабзаца*=<break time="2000ms"/>
*~~~*=<break time="15000ms"/>

Текст (без записи) обрабатывался раставляя паузы как надо, но при записи в mp3 выходила ошибка.

tonio_k

Дата: Вторник, 13.06.2023, 19:21 | Сообщение #97

Группа: Пользователи

Сообщений: 185

Статус: Offline

Цитата Иван (

)

Пробовал в файле 99.ПАУЗЫ@(phoneme).dic удалить строчки:

удалять не надо! Надо менять цифры в миллисекундах, например ="100ms"
Вместо "~~~" использовать какое нибудь уникальное слово типа: "ратлпиллрамлшр". т.к. есть вероятность, что этот символ вообще удаляется при чистке текста.
Если нужно удлинить паузы, то тут есть некоторые ограничения от самого силеро (вроде 2000ms и есть предел? - надо уточнить). Лучше используйте двойную/тройную вставку слова: "уникальнвставкаабзаца"
Есть ещё один момент: Длина текста уникальнвставкаабзаца равна длине тега <break time="2000ms"/> и при нарезке текста на куски разрезание происходит с учётом этого слова, если длина заменяемого текста на тэг будет короче длины самого тэга, то можно получить текстовый кусок, который, за счёт переизбытков тэгов, станет слишком длинный и силеро откажется озвучить этот отрезок, так как он по длине на много привысит 1000 символов. Силеро и 1000 символов не всегда проглатывает.

Vasya968

Дата: Четверг, 15.06.2023, 16:26 | Сообщение #98

Группа: Пользователи

Сообщений: 2

Статус: Offline

что приятней слушать сейчас, озвучку Силеро или ЯндексТТС?

flegont

Дата: Понедельник, 19.06.2023, 15:05 | Сообщение #99

V.I.P.

Группа: Модераторы

Сообщений: 141

Статус: Offline

Из голосов Яндекса мне очень нравился Филипп, еще в те времена, когда бесплатный демо был доступен без регистрации, и позволял за раз озвучивать 5000 символов. Потом это аттракцион неслыханной щедрости прикрыли. А платить (в модели v3) 16 коп за один запрос, при том что обрабатывает не более 250 символов за запрос, и не дольше 24 сек - да ну нафиг wacko

Мне интересно, сдержат ли Силеро свое обещание, выложить в свободный доступ некоторые свои усовершенствованные, (и более скоростные) модели синтеза речи? Или они уже считают свои рекламные цели достигнутыми?

Vasya968

Дата: Вторник, 20.06.2023, 14:06 | Сообщение #100

Группа: Пользователи

Сообщений: 2

Статус: Offline

хм, на днях озвучивал через яндекс книгу, проблем вроде не было, отработало как и 3 года назад

alyuev

Дата: Вторник, 01.08.2023, 20:26 | Сообщение #101

Группа: Пользователи

Сообщений: 7

Статус: Offline

Здравствуйте.
Подскажите, есть ли возможность изменять для Силеро произношение буквы Е? Например, иногда слово "все" озвучивает как "всё": вот тут "хотя не всЕ его могут видеть" - читает как "Е", а в таком порядке "хотя его могут видеть не всЁ" - как "Ё".

Можно ли принудительно сказать движку, что здесь нужно именно "Е", а не "Ё"?

Так, например, слово "темы" было озвучено, как "тЁмы"... А в фразе "личность, совершенная и изначальная" - получилось "совершЁнная"...

Сообщение отредактировал alyuev - Среда, 02.08.2023, 00:38

tonio_k

Дата: Вторник, 01.08.2023, 21:16 | Сообщение #102

Группа: Пользователи

Сообщений: 185

Статус: Offline

Цитата alyuev (

)

"Е", а не "Ё"?

тут возможны два варианта:
1) ложное срабатывание словаря или необходимо добавить новое правило в словарь
2) сама Силеро импровизирует исходя из внутренних не известных нам нейроправил (что тоже, скорее всего, можно откорректировать добавлением нового правила в словарь)
И на всякий случай, уточните, какой сборкой вы пользуетесь? Сборки могут немного отличается друг от друга набором правил и порядком применения правил в словарях

Сообщение отредактировал tonio_k - Вторник, 01.08.2023, 21:16

alyuev

Дата: Среда, 02.08.2023, 00:37 | Сообщение #103

Группа: Пользователи

Сообщений: 7

Статус: Offline

Пользуюсь сборкой 7.30.419 (64 bit).

flegont

Дата: Среда, 02.08.2023, 08:35 | Сообщение #104

V.I.P.

Группа: Модераторы

Сообщений: 141

Статус: Offline

Это Силеро чудит.
Со словом "темы" воспроизвести не удалось, читает нормально: тЕмы. Наверное фраза некая специфическая должна быть.
А вот "личность, совершенная и изначальная" - тут труба полнейшая. Хоть ставь ударение соверш+енная, хоть не ставь, читает: совершЁнная. У Силеро есть опции автоматического проставления ударений и буквы Ё - я попробовал в скрипте их отключить. Эксперимент не помог - все равно ставит автоматом букву Ё surprised

Так что, словарями это дело не поправить.
Победил, только убрав двойную "нн": совершеная - прочлось: совершЕнная - даже двойная "нн" слышна cry

Так модель обучена... не совсем корректно, получается.

Силеровцы недавно похвастались, что их модели уже усовершенствованы, стали очень скоростными и вообще... НО, дескать, нет времени выложить их в открытый доступ. Лукавят, похоже.

alyuev

Дата: Среда, 02.08.2023, 10:49 | Сообщение #105

Группа: Пользователи

Сообщений: 7

Статус: Offline

Александр Вейсов подсказал, что чтобы произнесло "Е", можно попробовать поставить "ьэ".

Demagog TTS

Страница 7 из 12
«
1
2
…
5
6
7
8
9
…
11
12
»