[ ]
  • Страница 1 из 1
  • 1
MyTTS (форум) » Online TTS (облачные технологии) » Google TTS » WavNet
WavNet
AdminДата: Среда, 21.07.2021, 12:56 | Сообщение #1
Группа: Администраторы
Сообщений: 140
Статус: Offline
Преобразование текста в речь создает необработанные аудиоданные естественной человеческой речи. То есть он создает звук, похожий на говорящего человека. Когда вы отправляете запрос синтеза для преобразования текста в речь, вы должны указать голос, который «произносит» слова.Для преобразования текста в речь вам доступен широкий выбор голосов. Голоса различаются по языку, полу и акценту (для некоторых языков). В некоторых языках есть выбор из нескольких голосов.

Примеры русских голосов:
ru-RU-Standard-A
ru-RU-Standard-B
ru-RU-Standard-C
ru-RU-Standard-D
ru-RU-Standard-E
ru-RU-Wavenet-A
ru-RU-Wavenet-B
ru-RU-Wavenet-C
ru-RU-Wavenet-D
ru-RU-Wavenet-E
 
dlr56686681Дата: Пятница, 01.10.2021, 04:58 | Сообщение #2
Группа: Пользователи
Сообщений: 2
Статус: Offline
Если кому интересно у eReader prestigo есть подписка за 500р в месяц на wavenet голоса. Не совсем халява, но дешевле чем платить гуглу
 
OkeyДата: Воскресенье, 12.05.2024, 11:46 | Сообщение #3
Группа: Пользователи
Сообщений: 5
Статус: Offline
Добрый день.
В программе Балаболка раньше (2000 г.) получал англ. аудиофайлы, загружая STR, взятые с Ютуба
Клал на монтажку, получал видео с англ. озвучкой.
Все работало.
Потом все закладки стали платные.
Сейчас осталась одна Google TTS, где можно брать бесплатно голос.
Но его длина на монтажке значительно больше видео-исходника, соотв. синхрон не совпадает, разъезжается
Как это лечится?


Сообщение отредактировал Okey - Воскресенье, 12.05.2024, 11:48
 
balabolkaДата: Понедельник, 13.05.2024, 16:55 | Сообщение #4
V.I.P.
Группа: Модераторы
Сообщений: 143
Статус: Offline
Чтобы реплики укладывались в интервалы времени, надо разрешить ускорять скорость речи для таких ситуаций. Рекомендую использовать голоса SAPI 5: в окне "Преобразовать субтитры в звуковые файлы" можно использовать настройку Автоматически увеличивать скорость речи.

При использовании онлайн-сервисов также происходит увеличение скорости речи, но программа делает это лишь несколько раз. Потому что каждая попытка ускорить речь для одной реплики - это еще один запрос к серверу; а серверы не любят, когда с одного IP-адреса идет слишком много запросов. Какие-то бесплатные онлайн-сервисы вообще не поддерживают изменение скорости речи.
 
OkeyДата: Вторник, 14.05.2024, 12:07 | Сообщение #5
Группа: Пользователи
Сообщений: 5
Статус: Offline
Спасибо!
Написал большой ответ, но не заметил и не поставил галу на "Я не робот", сразу нажал "Добавить ответ"...
Пост пропал.
Или где-то в "Черновиках" лежит?
----------------------------
Все, о чем вы писали, делал. Не помогает.
Наверно, в платных сервисах этой проблемы нет.
Есть несколько бесплатных закладкок с русским диктором: Youdao, Baidu, Naver, Google (1) и (2).


Сообщение отредактировал Okey - Вторник, 14.05.2024, 14:01
 
balabolkaДата: Среда, 15.05.2024, 02:15 | Сообщение #6
V.I.P.
Группа: Модераторы
Сообщений: 143
Статус: Offline
Okey
Чтобы голос успевал произнести фразу за указанный интервал времени, надо увеличивать скорость речь. Это единственный способ, другого тут нет. Увеличивайте исходное значение скорости речи (не "1.00", а "1.05" или "1.10", например).

Если нет API-ключа, то некоторые коммерческие онлайн-сервисы можно использовать и без него, в режиме демо. Но в этом режиме много запросов выполнить не получится: например, сервера Microsoft или Yandex через некоторое время начинают выдавать ошибку, так что придется подождать час или два (или подключиться через VPN, чтобы не ждать).
 
OkeyДата: Среда, 15.05.2024, 11:48 | Сообщение #7
Группа: Пользователи
Сообщений: 5
Статус: Offline
Цитата balabolka ()
Чтобы голос успевал произнести фразу за указанный интервал времени, надо увеличивать скорость речь. Это единственный способ, другого тут нет. Увеличивайте исходное значение скорости речи (не "1.00", а "1.05" или "1.10", например).

Пробовал. Поставил 1.2... Голос непривычно ускоряется, но паузы сохраняются, поэтому хоть голос и быстрее, а общая длина аудио-файла остается прежней - длиннее видео проценов на 20.

Yandex - ну, получше, покороче....  он сам предложил скорость 1.1 (оставил), поставил галу для ускорения, чтоб совпадало.... НО там интересная фишка - он ускоряет речь не в каждом отрезке видео (как вы писали, проге нужно было бы тогда каждый раз обращаться к сервису), а последнюю одну треть видео целиком как погнал диктор ))) Не ахти!


Сообщение отредактировал Okey - Среда, 15.05.2024, 13:10
 
OkeyДата: Пятница, 17.05.2024, 03:28 | Сообщение #8
Группа: Пользователи
Сообщений: 5
Статус: Offline
Получше результат, когда на Ютубе создаешь единый текстовый файл и вставляешь текст целиком, а не STR - в этом случае диктор читает вообще без пауз и аудио почти укладывается по длине на видео.

Интересно, почему в 2000 г. когда озвучил англ. диктором несколько фильмов, тупо вставлял SRT и не было этой проблемы?


Сообщение отредактировал Okey - Пятница, 17.05.2024, 03:29
 
balabolkaДата: Пятница, 17.05.2024, 09:41 | Сообщение #9
V.I.P.
Группа: Модераторы
Сообщений: 143
Статус: Offline
Цитата Okey ()
Интересно, почему в 2000 г. когда озвучил англ. диктором несколько фильмов, тупо вставлял SRT и не было этой проблемы?

Про какой 2000 год Вы говорите? Преобразование субтитров в аудиофайлы с помощью онлайн-сервисов было добавлено в 2019 году.

Я не понимаю суть Ваших претензий. "Балаболка" всё делает правильно: начинает чтение фраз точно в соответствии с метками времени в SRT-файле. Чтобы уложиться в интервалы времени, надо задать более высокую скорость речи; другого способа нет. Иначе голос не будет успевать произнести фразу за указанный промежуток времени, из-за чего сместится чтение следующей фразы, и так далее. Из-за всего этого и получается так, что аудиофайл больше по продолжительности видеоряда.

Открывайте SRT-файл в редакторе и правьте метки времени, увеличивайте интервалы. Также, увеличивайте скорость чтения, чтобы речь уместилась в видеофайле. Всё, я более не стану повторять свои советы.
 
LecronДата: Пятница, 17.05.2024, 17:39 | Сообщение #10
Группа: Пользователи
Сообщений: 19
Статус: Offline
Цитата balabolka ()
Чтобы уложиться в интервалы времени, надо задать более высокую скорость речи; другого способа нет.
Есть вариант ускорять фрагменты локально, после получения от сервиса. Причем скорость вычислять для каждого индивидуально. В целом, ускорять умеют ffmpeg и soundstretch, а также почти любой плеер видео и аудиокниг. Рискну предположить, что это сравнительно не сложно и можно реализовать в Балаболке. Но также понимаю, что кейс достаточно редкий.
 
OkeyДата: Суббота, Вчера, 03:12 | Сообщение #11
Группа: Пользователи
Сообщений: 5
Статус: Offline
Цитата balabolka ()
Про какой 2000 год Вы говорите?

Пардон. 2020 г.
Так понимаю, наверно, слишком многословный этот англ. фильм, и на русском слова не умещаются во временной промежуток между меток, метки сдвигаются, происходит накопление сдвига.
Огромное вам спасибо за сервис Балаболка, столько уже сделал благодаря Вам.


Сообщение отредактировал Okey - Суббота, 18.05.2024, 03:18
 
MyTTS (форум) » Online TTS (облачные технологии) » Google TTS » WavNet
  • Страница 1 из 1
  • 1
Поиск:

Общение