Балаболка TTS - Страница 2

[ ]

Страница 2 из 6 « 1 2 3 4 5 6 »
Модератор форума: balabolka

Балаболка TTS

balabolka

Дата: Суббота, 24.07.2021, 00:53 | Сообщение #1

V.I.P.

Группа: Модераторы

Сообщений: 220

Статус: Offline

Начало темы здесь (ссылка на архивную копию форума mytts.info)

(5,1 Mb) архивная копия начала текущей ветки с форума mytts.info - для офлайн просмотра и поиска по всем страницам

Балаболка TTS (авт. Илья Морозов)

Сайт программы "Балаболка"

Установочная версия

Portable-версия

DmitryV

Дата: Суббота, 05.08.2023, 16:37 | Сообщение #16

Группа: Пользователи

Сообщений: 2

Статус: Offline

Здравствуйте, а tts на пайтоне типа silero, Bark можете добавить в программу? С субтитрами хорошо было бы работать, да и для текстов не лишнее.

Tocad

Дата: Среда, 27.09.2023, 23:57 | Сообщение #17

Группа: Пользователи

Сообщений: 1

Статус: Offline

Здравствуйте вопрос такой. Хочу начать стримить, решил что голос у меня будет как у робота. Скачал балаболку и вот пытаюсь разобраться в программе. Подскажите пж 1) Как сделать так чтобы на определенную кнопку на клавиатуре читался определенный текс. То есть например на клавишу del чтобы говорилось слово "привет" 2) Для понимания ситуация. Я хочу чтобы когда я говорил в микрофон голос переделывался в текст и этот текст вставлялся в балаболку, где я его прочитав, если что смог бы поправить и уже запустить его голосом Робота. Если кто то сможет помочь, буду презнатилен

balabolka

Дата: Четверг, 28.09.2023, 15:10 | Сообщение #18

V.I.P.

Группа: Модераторы

Сообщений: 220

Статус: Offline

Цитата Tocad (

)

Как сделать так чтобы на определенную кнопку на клавиатуре читался определенный текс. То есть например на клавишу del чтобы говорилось слово "привет"

Вам поможет функция Эхо в "Балаболке": программа будет автоматически читать текст, который Вы печатаете в главном окне. В окне "Общие настройки" (пункт главного меню "Настройки|Общие настройки") найдите пункт "Произносить набираемый на клавиатуре текст". Поставьте "галочку" в пункте "Абзацы". Теперь, если Вы напечатаете текст и нажмете клавишу Enter, программа сразу же прочтёт напечатанную строку.

Для заранее заготовленных фраз можно использовать словарь замен в "Балаболке". Выберите пункт главного меню "Вид|Показывать|Панель словарей". На панели словарей щелкните правой кнопкой мыши, создайте новый словарь (формата BXD). Откройте словарь для редактирование и добавьте новое правило замены.

Произносить
#1
как
Привет!

Сохраните результаты редактирования и "галочкой" активируйте словарь. После этого, если Вы напечатаете #1 и нажмете клавишу Enter, "Балаболка" произнесёт "Привет!"
Добавьте правила замены для других фраз (#2, #3, ...). Поэкспериментируйте со словарями замен самостоятельно: можно использовать регулярные выражения для сложных замен.

Цитата Tocad (

)

Я хочу чтобы когда я говорил в микрофон голос переделывался в текст и этот текст вставлялся в балаболку, где я его прочитав, если что смог бы поправить и уже запустить его голосом Робота.

В программе "Балаболка" нет поддержки автоматического распознавания речи. Сейчас есть много программ для автоматического распознавания, платных и бесплатных: какие-то используют движки, устанавливаемые на компьютере пользователя; другие программные продукты работают с онлайн-сервисами распознавания речи. В основном, поддерживается английский язык, в меньшей степени - другие западноевропейские языки, китайский, японский. С русским языком работают российские онлайн-сервисы ("Яндекс", "SaluteSpeech"), но это платные решения: тариф примерно равен 1 копейке за 1 секунду распознанной речи. Ищите программу, которая может использовать такой сервис.

Если найдете подходящее приложение для распознавания русской речи, его можно использовать параллельно с "Балаболкой". Одна программа распознает, Вы копируете текст в буфер обмена, а "Балаболке" сразу же читает текст вслух. В программе должна быть активирована опция Слежение за буфером обмена (пункт главного меню "Настройки|Слежение за буфером обмена"). Настроить работу опции можно в окне "Общие настройки", вкладка "Буфер обмена": например, можно разрешить чтение буфера обмена, только если текст был скопирован в конкретной программе. Переключаться на "Балаболку" нет необходимости: она может сидеть свёрнутой в трее, а управлять можно с помощью глобальных сочетаний клавиш.

Я бы не советовал рассчитывать на быструю работу программ для распознавания речи. Пока они могут мгновенно распознать лишь короткие предложения. По моему мнению, сейчас быстрее (и дешевле) самому напечатать текст на клавиатуре. Если Вы будете использовать приложение для работы с онлайн-сервисами, значение будет иметь скорость доступа к серверу с Вашего компьютера.

Ajaja

Дата: Пятница, 17.11.2023, 00:07 | Сообщение #19

Группа: Пользователи

Сообщений: 2

Статус: Offline

Цитата DmitryV (

)

С python много зависимостей тянется.
А вот поддержку piper tts, возможно, имело бы смысл добавить. Он недавно доработан для Windows и работает отдельно без python. При этом, по-моему, по параметру скорость/качество это сейчас лучший опенсорсный оффлайновый TTS на нейросетях.
При небольшом размер голосовых моделей (20-130Мб), вменяемой скорости работы даже на CPU и смешных по нынешним временам требованиях к памяти, качество заметно лучше, чем у старых не-neural движков. Что особенно по английским голосам слышно.
Русские голоса, которые идут в комплекте, пока не так хорошо натренированы, но тоже звучат пристойно. И учитывая, что там возможно самому тренировать голосовую модель, надеюсь, скоро появятся и более высококачественные русские голоса.

Сообщение отредактировал Ajaja - Пятница, 17.11.2023, 00:16

faorekh

Дата: Понедельник, 01.04.2024, 12:42 | Сообщение #20

Группа: Пользователи

Сообщений: 31

Статус: Offline

Почему-то уже несколько дней не работает озвучка премиум голосами Яндекса.
Жаль, что в версии 866 сервис SpeechPro Text-To-Speech больше не используется. У меня в версии 865 он отлично работает, да и голос "Владимир" весьма не плох.
Запустил версию 866 и премиум Яндекс заработал!
Ан нет sad

Индикатор получения данных с сервера идет до конца, но не происходит сохранения аудиофайла и вылетает с ошибкой, как ошибка сервера. Жаль.

Сообщение отредактировал faorekh - Понедельник, 01.04.2024, 12:54

balabolka

Дата: Понедельник, 01.04.2024, 22:45 | Сообщение #21

V.I.P.

Группа: Модераторы

Сообщений: 220

Статус: Offline

faorekh
Скачайте версию 867, сервисы Yandex и SpeechPro должны работать нормально.

Сервис Yandex SpeechKit переехал на другой домен. А вот что происходило с сервисом SpeechPro, не совсем понятно: он не работал несколько дней, разработчики починили в понедельник.

Напомню, что для Yandex SpeechKit надо использовать Ваш сервисный API-ключ. Иначе сервис работает в режиме демо, и в любой момент сервер Яндекса может решить, что с Вашего IP-адреса идет слишком много запросов (сервер вернет ошибку вместо аудиоданных).

faorekh

Дата: Вторник, 02.04.2024, 12:15 | Сообщение #22

Группа: Пользователи

Сообщений: 31

Статус: Offline

Цитата balabolka (

)

Сервис Yandex SpeechKit переехал на другой домен. А вот что происходило с сервисом SpeechPro, не совсем понятно: он не работал несколько дней, разработчики починили в понедельник.

Спасибо большое за Вашу работу! И Яндекс-премиум и SpeechPro в версии 867 отлично работают.

Цитата balabolka (

)

Напомню, что для Yandex SpeechKit надо использовать Ваш сервисный API-ключ. Иначе сервис работает в режиме демо, и в любой момент сервер Яндекса может решить, что с Вашего IP-адреса идет слишком много запросов (сервер вернет ошибку вместо аудиоданных).

Действительно, если работать без ключа, то после обработки 5-8 блоков текста по 10000 символов возвращается ошибка. Но я с помощью простенького ВПН меняю страну локализации и опять могу озвучить еще несколько блоков. Это приемлемо.

Сообщение отредактировал faorekh - Вторник, 02.04.2024, 12:15

faorekh

Дата: Понедельник, 27.05.2024, 15:44 | Сообщение #23

Группа: Пользователи

Сообщений: 31

Статус: Offline

Спасибо за новую 870 версию. Как Вы и указали, список голосов Microsoft Azure обновлён. В нем теперь есть многоязычные голоса английский (американский), французский и немецкий. С помощью таких голосов замечательно озвучиваются книги на русском. И очень удобно, что можно настраивать тональность, скорость и громкость голоса. Есть возможность отлично подобрать настройки для себя.

Lecron

Дата: Среда, 29.05.2024, 21:32 | Сообщение #24

Группа: Пользователи

Сообщений: 32

Статус: Offline

Прочел, что вы добавили программное ускорение речи. Отчего возникла идея ускорять и обычный синтезированный текст. В дополнение к скорости SAPI, для тех, кому этого диапазона не хватает. В том числе в консольной версии.

По моей прикидке, +10 это всего лишь скорость 1.2х (с 29 сек до 24). По крайней мере на Loquendo Olga. Но думаю и в остальных будет сопоставимо.

Поэтому вариант реализации — увеличить диапазон ползунка до +50, что будет давать 2х скорости. В диапазоне до +10, использовать SAPI версию ускорения, а при бо́льших значения сбрасывать SAPI на 0 и включать программную. А при желании, можно вообще отказаться от SAPI версии. Предположу, она работает на абсолютно идентичных принципах — синтезируется голос на default, а потом ускоряется. В таком случае, ползунок отконфигурировать в реальных, а не абстрактных значениях — 0.9х, 1х, 1.2х, 1.5х, 2х

Такая версия заиграет на онлайн-голосах, где с регулировками разброд и шатание. А у пользователя будет последовательный опыт. Заодно можно отказаться и от "тембр", также переложив его на локальную обработку.

Сообщение отредактировал Lecron - Среда, 29.05.2024, 21:52

faorekh

Дата: Суббота, 13.07.2024, 14:17 | Сообщение #25

Группа: Пользователи

Сообщений: 31

Статус: Offline

Интересное дело: вчера столкнулся с тем, что программа отказывается озвучивать премиум голосом Яндекса Ермил. Через ВПН тоже не хочет. Сегодня та же история.
Но, голосом премиум Кирилл озвучивает без проблем. Неужели, что-то может случиться с доступом к конкретному премиум-голосу?

balabolka

Дата: Суббота, 13.07.2024, 23:50 | Сообщение #26

V.I.P.

Группа: Модераторы

Сообщений: 220

Статус: Offline

Цитата faorekh (

)

Неужели, что-то может случиться с доступом к конкретному премиум-голосу?

Спасибо за информацию, исправлю использование голосов "Яндекса" в программе в ближайшие дни. Yandex SpeechKit обновился 11 июля: изменения небольшие, но каждый раз после обновления синтеза речи мне приходится вносить правки в свою программу.

faorekh

Дата: Понедельник, 15.07.2024, 14:38 | Сообщение #27

Группа: Пользователи

Сообщений: 31

Статус: Offline

Цитата balabolka (

)

исправлю использование голосов "Яндекса"

Спасибо большое, Ермил заговорил!

Burinis

Дата: Воскресенье, 21.07.2024, 21:40 | Сообщение #28

Группа: Пользователи

Сообщений: 10

Статус: Offline

у меня к вам вопрос: где мне скачать словари для максима?

faorekh

Дата: Понедельник, 22.07.2024, 13:04 | Сообщение #29

Группа: Пользователи

Сообщений: 31

Статус: Offline

Спасибо за обновление 2.15.0.875
Обрадовался, когда во вкладке Google Cloud увидел, что можно пользоваться "Балаболкой" без API Google Cloud решив капчу.

Однако, после нажатия "Открыть демо и решить капчу" я оказался на странице, где не было никакой капчи. Предлагалось вставить текст, выбрать язык, голос и, после синтеза, прослушать получившееся. Т.е. "Балаболка" уже не участвует в процессе и нет возможности сохранить аудиофайл.

Прикрепления: 81179810.jpg (121.5 Kb) · 38252715.jpg (116.2 Kb)

Сообщение отредактировал faorekh - Понедельник, 22.07.2024, 13:06

balabolka

Дата: Понедельник, 22.07.2024, 18:34 | Сообщение #30

V.I.P.

Группа: Модераторы

Сообщений: 220

Статус: Offline

faorekh
Нажмите кнопку "SPEAK IT", и появится капча. Решите капчу, и можно сразу закрывать окно браузера: сервер Google запомнит, что Ваш IP-адрес прошел тест (доказал, что "он не робот"), поэтому любая программа, посылающая запросы к серверу, получит в ответ аудиоданные. Но примерно через час процедуру решения капчи придется повторить.

Балаболка TTS

Страница 2 из 6
«
1
2
3
4
5
6
»