WavNet - MyTTS (форум)

[ ]

Страница 1 из 1
1

MyTTS (форум) » Online TTS (облачные технологии) » Google TTS » WavNet

WavNet

Admin

Дата: Среда, 21.07.2021, 12:56 | Сообщение #1

Группа: Администраторы

Сообщений: 140

Статус: Offline

Преобразование текста в речь создает необработанные аудиоданные естественной человеческой речи. То есть он создает звук, похожий на говорящего человека. Когда вы отправляете запрос синтеза для преобразования текста в речь, вы должны указать голос, который «произносит» слова.Для преобразования текста в речь вам доступен широкий выбор голосов. Голоса различаются по языку, полу и акценту (для некоторых языков). В некоторых языках есть выбор из нескольких голосов.

Примеры русских голосов:
ru-RU-Standard-A
ru-RU-Standard-B
ru-RU-Standard-C
ru-RU-Standard-D
ru-RU-Standard-E
ru-RU-Wavenet-A
ru-RU-Wavenet-B
ru-RU-Wavenet-C
ru-RU-Wavenet-D
ru-RU-Wavenet-E

dlr56686681

Дата: Пятница, 01.10.2021, 04:58 | Сообщение #2

Группа: Пользователи

Сообщений: 2

Статус: Offline

Если кому интересно у eReader prestigo есть подписка за 500р в месяц на wavenet голоса. Не совсем халява, но дешевле чем платить гуглу

Okey

Дата: Воскресенье, 12.05.2024, 11:46 | Сообщение #3

Группа: Пользователи

Сообщений: 5

Статус: Offline

Добрый день.
В программе Балаболка раньше (2000 г.) получал англ. аудиофайлы, загружая STR, взятые с Ютуба
Клал на монтажку, получал видео с англ. озвучкой.
Все работало.
Потом все закладки стали платные.
Сейчас осталась одна Google TTS, где можно брать бесплатно голос.
Но его длина на монтажке значительно больше видео-исходника, соотв. синхрон не совпадает, разъезжается
Как это лечится?

Сообщение отредактировал Okey - Воскресенье, 12.05.2024, 11:48

balabolka

Дата: Понедельник, 13.05.2024, 16:55 | Сообщение #4

V.I.P.

Группа: Модераторы

Сообщений: 143

Статус: Offline

Чтобы реплики укладывались в интервалы времени, надо разрешить ускорять скорость речи для таких ситуаций. Рекомендую использовать голоса SAPI 5: в окне "Преобразовать субтитры в звуковые файлы" можно использовать настройку Автоматически увеличивать скорость речи.

При использовании онлайн-сервисов также происходит увеличение скорости речи, но программа делает это лишь несколько раз. Потому что каждая попытка ускорить речь для одной реплики - это еще один запрос к серверу; а серверы не любят, когда с одного IP-адреса идет слишком много запросов. Какие-то бесплатные онлайн-сервисы вообще не поддерживают изменение скорости речи.

Okey

Дата: Вторник, 14.05.2024, 12:07 | Сообщение #5

Группа: Пользователи

Сообщений: 5

Статус: Offline

Спасибо!
Написал большой ответ, но не заметил и не поставил галу на "Я не робот", сразу нажал "Добавить ответ"...
Пост пропал.
Или где-то в "Черновиках" лежит?
----------------------------
Все, о чем вы писали, делал. Не помогает.
Наверно, в платных сервисах этой проблемы нет.
Есть несколько бесплатных закладкок с русским диктором: Youdao, Baidu, Naver, Google (1) и (2).

Сообщение отредактировал Okey - Вторник, 14.05.2024, 14:01

balabolka

Дата: Среда, 15.05.2024, 02:15 | Сообщение #6

V.I.P.

Группа: Модераторы

Сообщений: 143

Статус: Offline

Okey
Чтобы голос успевал произнести фразу за указанный интервал времени, надо увеличивать скорость речь. Это единственный способ, другого тут нет. Увеличивайте исходное значение скорости речи (не "1.00", а "1.05" или "1.10", например).

Если нет API-ключа, то некоторые коммерческие онлайн-сервисы можно использовать и без него, в режиме демо. Но в этом режиме много запросов выполнить не получится: например, сервера Microsoft или Yandex через некоторое время начинают выдавать ошибку, так что придется подождать час или два (или подключиться через VPN, чтобы не ждать).

Okey

Дата: Среда, 15.05.2024, 11:48 | Сообщение #7

Группа: Пользователи

Сообщений: 5

Статус: Offline

Цитата balabolka (

)

Чтобы голос успевал произнести фразу за указанный интервал времени, надо увеличивать скорость речь. Это единственный способ, другого тут нет. Увеличивайте исходное значение скорости речи (не "1.00", а "1.05" или "1.10", например).

Пробовал. Поставил 1.2... Голос непривычно ускоряется, но паузы сохраняются, поэтому хоть голос и быстрее, а общая длина аудио-файла остается прежней - длиннее видео проценов на 20.

Yandex - ну, получше, покороче.... он сам предложил скорость 1.1 (оставил), поставил галу для ускорения, чтоб совпадало.... НО там интересная фишка - он ускоряет речь не в каждом отрезке видео (как вы писали, проге нужно было бы тогда каждый раз обращаться к сервису), а последнюю одну треть видео целиком как погнал диктор ))) Не ахти!

Сообщение отредактировал Okey - Среда, 15.05.2024, 13:10

Okey

Дата: Пятница, 17.05.2024, 03:28 | Сообщение #8

Группа: Пользователи

Сообщений: 5

Статус: Offline

Получше результат, когда на Ютубе создаешь единый текстовый файл и вставляешь текст целиком, а не STR - в этом случае диктор читает вообще без пауз и аудио почти укладывается по длине на видео.

Интересно, почему в 2000 г. когда озвучил англ. диктором несколько фильмов, тупо вставлял SRT и не было этой проблемы?

Сообщение отредактировал Okey - Пятница, 17.05.2024, 03:29

balabolka

Дата: Пятница, 17.05.2024, 09:41 | Сообщение #9

V.I.P.

Группа: Модераторы

Сообщений: 143

Статус: Offline

Цитата Okey (

)

Интересно, почему в 2000 г. когда озвучил англ. диктором несколько фильмов, тупо вставлял SRT и не было этой проблемы?

Про какой 2000 год Вы говорите? Преобразование субтитров в аудиофайлы с помощью онлайн-сервисов было добавлено в 2019 году.

Я не понимаю суть Ваших претензий. "Балаболка" всё делает правильно: начинает чтение фраз точно в соответствии с метками времени в SRT-файле. Чтобы уложиться в интервалы времени, надо задать более высокую скорость речи; другого способа нет. Иначе голос не будет успевать произнести фразу за указанный промежуток времени, из-за чего сместится чтение следующей фразы, и так далее. Из-за всего этого и получается так, что аудиофайл больше по продолжительности видеоряда.

Открывайте SRT-файл в редакторе и правьте метки времени, увеличивайте интервалы. Также, увеличивайте скорость чтения, чтобы речь уместилась в видеофайле. Всё, я более не стану повторять свои советы.

Lecron

Дата: Пятница, 17.05.2024, 17:39 | Сообщение #10

Группа: Пользователи

Сообщений: 19

Статус: Offline

Цитата balabolka (

)

Чтобы уложиться в интервалы времени, надо задать более высокую скорость речи; другого способа нет.

Есть вариант ускорять фрагменты локально, после получения от сервиса. Причем скорость вычислять для каждого индивидуально. В целом, ускорять умеют ffmpeg и soundstretch, а также почти любой плеер видео и аудиокниг. Рискну предположить, что это сравнительно не сложно и можно реализовать в Балаболке. Но также понимаю, что кейс достаточно редкий.

Okey

Дата: Суббота, Вчера, 03:12 | Сообщение #11

Группа: Пользователи

Сообщений: 5

Статус: Offline

Цитата balabolka (

)

Про какой 2000 год Вы говорите?

Пардон. 2020 г.
Так понимаю, наверно, слишком многословный этот англ. фильм, и на русском слова не умещаются во временной промежуток между меток, метки сдвигаются, происходит накопление сдвига.
Огромное вам спасибо за сервис Балаболка, столько уже сделал благодаря Вам.

Сообщение отредактировал Okey - Суббота, 18.05.2024, 03:18

MyTTS (форум) » Online TTS (облачные технологии) » Google TTS » WavNet

Страница 1 из 1
1