Балаболка TTS
|
|
balabolka | Дата: Суббота, 24.07.2021, 00:53 | Сообщение #1 |
 V.I.P.
Группа: Модераторы
Сообщений: 180
Статус: Offline
| Начало темы здесь (ссылка на архивную копию форума mytts.info)
(5,1 Mb) архивная копия начала текущей ветки с форума mytts.info - для офлайн просмотра и поиска по всем страницам
Балаболка TTS (авт. Илья Морозов)
Сайт программы "Балаболка"
Установочная версия
Portable-версия
|
|
| |
DmitryV | Дата: Суббота, 05.08.2023, 16:37 | Сообщение #16 |
Группа: Пользователи
Сообщений: 2
Статус: Offline
| Здравствуйте, а tts на пайтоне типа silero, Bark можете добавить в программу? С субтитрами хорошо было бы работать, да и для текстов не лишнее.
|
|
| |
Tocad | Дата: Среда, 27.09.2023, 23:57 | Сообщение #17 |
Группа: Пользователи
Сообщений: 1
Статус: Offline
| Здравствуйте вопрос такой. Хочу начать стримить, решил что голос у меня будет как у робота. Скачал балаболку и вот пытаюсь разобраться в программе. Подскажите пж 1) Как сделать так чтобы на определенную кнопку на клавиатуре читался определенный текс. То есть например на клавишу del чтобы говорилось слово "привет" 2) Для понимания ситуация. Я хочу чтобы когда я говорил в микрофон голос переделывался в текст и этот текст вставлялся в балаболку, где я его прочитав, если что смог бы поправить и уже запустить его голосом Робота. Если кто то сможет помочь, буду презнатилен
|
|
| |
balabolka | Дата: Четверг, 28.09.2023, 15:10 | Сообщение #18 |
 V.I.P.
Группа: Модераторы
Сообщений: 180
Статус: Offline
| Цитата Tocad (  ) Как сделать так чтобы на определенную кнопку на клавиатуре читался определенный текс. То есть например на клавишу del чтобы говорилось слово "привет" Вам поможет функция Эхо в "Балаболке": программа будет автоматически читать текст, который Вы печатаете в главном окне. В окне "Общие настройки" (пункт главного меню "Настройки|Общие настройки") найдите пункт "Произносить набираемый на клавиатуре текст". Поставьте "галочку" в пункте "Абзацы". Теперь, если Вы напечатаете текст и нажмете клавишу Enter, программа сразу же прочтёт напечатанную строку.
Для заранее заготовленных фраз можно использовать словарь замен в "Балаболке". Выберите пункт главного меню "Вид|Показывать|Панель словарей". На панели словарей щелкните правой кнопкой мыши, создайте новый словарь (формата BXD). Откройте словарь для редактирование и добавьте новое правило замены.
Произносить #1 как Привет!
Сохраните результаты редактирования и "галочкой" активируйте словарь. После этого, если Вы напечатаете #1 и нажмете клавишу Enter, "Балаболка" произнесёт "Привет!" Добавьте правила замены для других фраз (#2, #3, ...). Поэкспериментируйте со словарями замен самостоятельно: можно использовать регулярные выражения для сложных замен.
Цитата Tocad (  ) Я хочу чтобы когда я говорил в микрофон голос переделывался в текст и этот текст вставлялся в балаболку, где я его прочитав, если что смог бы поправить и уже запустить его голосом Робота. В программе "Балаболка" нет поддержки автоматического распознавания речи. Сейчас есть много программ для автоматического распознавания, платных и бесплатных: какие-то используют движки, устанавливаемые на компьютере пользователя; другие программные продукты работают с онлайн-сервисами распознавания речи. В основном, поддерживается английский язык, в меньшей степени - другие западноевропейские языки, китайский, японский. С русским языком работают российские онлайн-сервисы ("Яндекс", "SaluteSpeech"), но это платные решения: тариф примерно равен 1 копейке за 1 секунду распознанной речи. Ищите программу, которая может использовать такой сервис.
Если найдете подходящее приложение для распознавания русской речи, его можно использовать параллельно с "Балаболкой". Одна программа распознает, Вы копируете текст в буфер обмена, а "Балаболке" сразу же читает текст вслух. В программе должна быть активирована опция Слежение за буфером обмена (пункт главного меню "Настройки|Слежение за буфером обмена"). Настроить работу опции можно в окне "Общие настройки", вкладка "Буфер обмена": например, можно разрешить чтение буфера обмена, только если текст был скопирован в конкретной программе. Переключаться на "Балаболку" нет необходимости: она может сидеть свёрнутой в трее, а управлять можно с помощью глобальных сочетаний клавиш.
Я бы не советовал рассчитывать на быструю работу программ для распознавания речи. Пока они могут мгновенно распознать лишь короткие предложения. По моему мнению, сейчас быстрее (и дешевле) самому напечатать текст на клавиатуре. Если Вы будете использовать приложение для работы с онлайн-сервисами, значение будет иметь скорость доступа к серверу с Вашего компьютера.
|
|
| |
Ajaja | Дата: Пятница, 17.11.2023, 00:07 | Сообщение #19 |
Группа: Пользователи
Сообщений: 2
Статус: Offline
| Цитата DmitryV (  ) Здравствуйте, а tts на пайтоне типа silero, Bark можете добавить в программу? С субтитрами хорошо было бы работать, да и для текстов не лишнее. С python много зависимостей тянется. А вот поддержку piper tts, возможно, имело бы смысл добавить. Он недавно доработан для Windows и работает отдельно без python. При этом, по-моему, по параметру скорость/качество это сейчас лучший опенсорсный оффлайновый TTS на нейросетях. При небольшом размер голосовых моделей (20-130Мб), вменяемой скорости работы даже на CPU и смешных по нынешним временам требованиях к памяти, качество заметно лучше, чем у старых не-neural движков. Что особенно по английским голосам слышно. Русские голоса, которые идут в комплекте, пока не так хорошо натренированы, но тоже звучат пристойно. И учитывая, что там возможно самому тренировать голосовую модель, надеюсь, скоро появятся и более высококачественные русские голоса.
Сообщение отредактировал Ajaja - Пятница, 17.11.2023, 00:16 |
|
| |
faorekh | Дата: Понедельник, 01.04.2024, 12:42 | Сообщение #20 |
Группа: Пользователи
Сообщений: 29
Статус: Offline
| Почему-то уже несколько дней не работает озвучка премиум голосами Яндекса. Жаль, что в версии 866 сервис SpeechPro Text-To-Speech больше не используется. У меня в версии 865 он отлично работает, да и голос "Владимир" весьма не плох. Запустил версию 866 и премиум Яндекс заработал! Ан нет Индикатор получения данных с сервера идет до конца, но не происходит сохранения аудиофайла и вылетает с ошибкой, как ошибка сервера. Жаль.
Сообщение отредактировал faorekh - Понедельник, 01.04.2024, 12:54 |
|
| |
balabolka | Дата: Понедельник, 01.04.2024, 22:45 | Сообщение #21 |
 V.I.P.
Группа: Модераторы
Сообщений: 180
Статус: Offline
| faorekh Скачайте версию 867, сервисы Yandex и SpeechPro должны работать нормально.
Сервис Yandex SpeechKit переехал на другой домен. А вот что происходило с сервисом SpeechPro, не совсем понятно: он не работал несколько дней, разработчики починили в понедельник.
Напомню, что для Yandex SpeechKit надо использовать Ваш сервисный API-ключ. Иначе сервис работает в режиме демо, и в любой момент сервер Яндекса может решить, что с Вашего IP-адреса идет слишком много запросов (сервер вернет ошибку вместо аудиоданных).
|
|
| |
faorekh | Дата: Вторник, 02.04.2024, 12:15 | Сообщение #22 |
Группа: Пользователи
Сообщений: 29
Статус: Offline
| Цитата balabolka (  ) Сервис Yandex SpeechKit переехал на другой домен. А вот что происходило с сервисом SpeechPro, не совсем понятно: он не работал несколько дней, разработчики починили в понедельник. Спасибо большое за Вашу работу! И Яндекс-премиум и SpeechPro в версии 867 отлично работают.
Цитата balabolka (  ) Напомню, что для Yandex SpeechKit надо использовать Ваш сервисный API-ключ. Иначе сервис работает в режиме демо, и в любой момент сервер Яндекса может решить, что с Вашего IP-адреса идет слишком много запросов (сервер вернет ошибку вместо аудиоданных). Действительно, если работать без ключа, то после обработки 5-8 блоков текста по 10000 символов возвращается ошибка. Но я с помощью простенького ВПН меняю страну локализации и опять могу озвучить еще несколько блоков. Это приемлемо.
Сообщение отредактировал faorekh - Вторник, 02.04.2024, 12:15 |
|
| |
faorekh | Дата: Понедельник, 27.05.2024, 15:44 | Сообщение #23 |
Группа: Пользователи
Сообщений: 29
Статус: Offline
| Спасибо за новую 870 версию. Как Вы и указали, список голосов Microsoft Azure обновлён. В нем теперь есть многоязычные голоса английский (американский), французский и немецкий. С помощью таких голосов замечательно озвучиваются книги на русском. И очень удобно, что можно настраивать тональность, скорость и громкость голоса. Есть возможность отлично подобрать настройки для себя.
|
|
| |
Lecron | Дата: Среда, 29.05.2024, 21:32 | Сообщение #24 |
Группа: Пользователи
Сообщений: 26
Статус: Offline
| Прочел, что вы добавили программное ускорение речи. Отчего возникла идея ускорять и обычный синтезированный текст. В дополнение к скорости SAPI, для тех, кому этого диапазона не хватает. В том числе в консольной версии.
По моей прикидке, +10 это всего лишь скорость 1.2х (с 29 сек до 24). По крайней мере на Loquendo Olga. Но думаю и в остальных будет сопоставимо.
Поэтому вариант реализации — увеличить диапазон ползунка до +50, что будет давать 2х скорости. В диапазоне до +10, использовать SAPI версию ускорения, а при бо́льших значения сбрасывать SAPI на 0 и включать программную. А при желании, можно вообще отказаться от SAPI версии. Предположу, она работает на абсолютно идентичных принципах — синтезируется голос на default, а потом ускоряется. В таком случае, ползунок отконфигурировать в реальных, а не абстрактных значениях — 0.9х, 1х, 1.2х, 1.5х, 2х
Такая версия заиграет на онлайн-голосах, где с регулировками разброд и шатание. А у пользователя будет последовательный опыт. Заодно можно отказаться и от "тембр", также переложив его на локальную обработку.
Сообщение отредактировал Lecron - Среда, 29.05.2024, 21:52 |
|
| |
faorekh | Дата: Суббота, 13.07.2024, 14:17 | Сообщение #25 |
Группа: Пользователи
Сообщений: 29
Статус: Offline
| Интересное дело: вчера столкнулся с тем, что программа отказывается озвучивать премиум голосом Яндекса Ермил. Через ВПН тоже не хочет. Сегодня та же история. Но, голосом премиум Кирилл озвучивает без проблем. Неужели, что-то может случиться с доступом к конкретному премиум-голосу?
|
|
| |
balabolka | Дата: Суббота, 13.07.2024, 23:50 | Сообщение #26 |
 V.I.P.
Группа: Модераторы
Сообщений: 180
Статус: Offline
| Цитата faorekh (  ) Неужели, что-то может случиться с доступом к конкретному премиум-голосу? Спасибо за информацию, исправлю использование голосов "Яндекса" в программе в ближайшие дни. Yandex SpeechKit обновился 11 июля: изменения небольшие, но каждый раз после обновления синтеза речи мне приходится вносить правки в свою программу.
|
|
| |
faorekh | Дата: Понедельник, 15.07.2024, 14:38 | Сообщение #27 |
Группа: Пользователи
Сообщений: 29
Статус: Offline
| Цитата balabolka (  ) исправлю использование голосов "Яндекса" Спасибо большое, Ермил заговорил!
|
|
| |
Burinis | Дата: Воскресенье, 21.07.2024, 21:40 | Сообщение #28 |
Группа: Пользователи
Сообщений: 10
Статус: Offline
| у меня к вам вопрос: где мне скачать словари для максима?
|
|
| |
faorekh | Дата: Понедельник, 22.07.2024, 13:04 | Сообщение #29 |
Группа: Пользователи
Сообщений: 29
Статус: Offline
| Спасибо за обновление 2.15.0.875 Обрадовался, когда во вкладке Google Cloud увидел, что можно пользоваться "Балаболкой" без API Google Cloud решив капчу.
 Однако, после нажатия "Открыть демо и решить капчу" я оказался на странице, где не было никакой капчи. Предлагалось вставить текст, выбрать язык, голос и, после синтеза, прослушать получившееся. Т.е. "Балаболка" уже не участвует в процессе и нет возможности сохранить аудиофайл.
Сообщение отредактировал faorekh - Понедельник, 22.07.2024, 13:06 |
|
| |
balabolka | Дата: Понедельник, 22.07.2024, 18:34 | Сообщение #30 |
 V.I.P.
Группа: Модераторы
Сообщений: 180
Статус: Offline
| faorekh Нажмите кнопку "SPEAK IT", и появится капча. Решите капчу, и можно сразу закрывать окно браузера: сервер Google запомнит, что Ваш IP-адрес прошел тест (доказал, что "он не робот"), поэтому любая программа, посылающая запросы к серверу, получит в ответ аудиоданные. Но примерно через час процедуру решения капчи придется повторить.
|
|
| |