[ ]
  • Страница 1 из 2
  • 1
  • 2
  • »
Модератор форума: balabolka  
MyTTS (форум) » Программы, использующие синтез речи в Windows » Балаболка » Балаболка TTS
Балаболка TTS
balabolkaДата: Суббота, 24.07.2021, 00:53 | Сообщение #1
V.I.P.
Группа: Модераторы
Сообщений: 139
Статус: Offline
Начало темы здесь (ссылка на архивную копию форума mytts.info)
 (5,1 Mb) архивная копия начала текущей ветки с форума mytts.info - для офлайн просмотра и поиска по всем страницам

Балаболка TTS  (авт. Илья Морозов)

Сайт программы "Балаболка"

 Установочная версия
 Portable-версия
 
wasyakaДата: Понедельник, 06.09.2021, 07:57 | Сообщение #2
Группа: Модераторы
Сообщений: 35
Статус: Offline
Цитата balabolka ()
"Яндекс" начинает потихоньку отключать опции старого онлайн-демо

Левитан

Ермил

Коля
Прикрепления: _0003.mp3 (319.3 Kb) · _0001.mp3 (243.1 Kb) · _0002.mp3 (296.2 Kb)


Сообщение отредактировал wasyaka - Понедельник, 06.09.2021, 08:04
 
Pin240Дата: Среда, 07.12.2022, 19:50 | Сообщение #3
Группа: Пользователи
Сообщений: 104
Статус: Offline
Добрый вечер.
Не подскажете как в консольной версии можно сохранить обработанный текст в новый текстовый файл?
 
balabolkaДата: Четверг, 08.12.2022, 11:54 | Сообщение #4
V.I.P.
Группа: Модераторы
Сообщений: 139
Статус: Offline
Цитата Pin240 ()
Не подскажете как в консольной версии можно сохранить обработанный текст в новый текстовый файл?

Есть утилита для извлечения текста, ее следует использовать для сохранения обработанных текстов:
Код
blb2txt -f "d:\Docs\book.doc" -out "d:\Text\book.txt" -d "d:\Dict\rules.dic"
 
tonio_kДата: Четверг, 08.12.2022, 12:15 | Сообщение #5
Группа: Пользователи
Сообщений: 139
Статус: Offline
А есть у вас функционал разбить текстовый файл на файлы "строго" в пределах указанного лимита символов, даже если длина абзаца в тексте превосхдит указанный лимит?
Т.е. происходит автоматическое редактирование слишком длинного абзаца (нарезка на предложения или ещё по каким либо способом), что бы в итоге полученный маленький файл был непременно меньше или равно указанному лимиту? Например текст в приложении. Там огромные абзацы практически нет знаков препинания
Прикрепления: __18.zip (60.7 Kb)
 
balabolkaДата: Четверг, 08.12.2022, 19:22 | Сообщение #6
V.I.P.
Группа: Модераторы
Сообщений: 139
Статус: Offline
Цитата tonio_k ()
А есть у вас функционал разбить текстовый файл на файлы "строго" в пределах указанного лимита символов

Нет, текст без знаков препинания и с огромными абзацами моя программа не сможет нормально поделить. "Балаболка" старается поделить текст именно по границам абзацев, а также с учетом границ предложений, ориентируясь на знаки препинания.
 
alsupДата: Понедельник, 19.06.2023, 18:51 | Сообщение #7
Группа: Пользователи
Сообщений: 4
Статус: Offline
Оговорюсь, что последнюю версию использовать невозможно в моих условиях: при установке в виртуальную машину Win XP 64 бит программа через пару секунд после старта делает экран чёрным с цветными чёрточками по всей верхней половине. Видимо это какой-то вариант БСОДа. Приходится пользоваться 2,10,0,568. Если есть какое-то решение этой проблемы, буду рад применить.

Из всех голосов устраивает только Microsoft Server Speech Text To Speech Voice (ru-RU Elena). Словари подключал Russian Katerina, Russian Nikolai в любых комбинациях.

Искал, читал, пытался исправлять неправильные ударения, но единственный способ, который заработал - это добавление слов в словарь с заменой ударной буквы на заглавную. Никакие ^ или <, > не работают - произносятся как есть.

1. Слова с Ы: невозможно сменить ударение на правильное: произношение становится неправильным, искажаются гласные.
2. "Искорок" произносится с ударением на 1м о. как поставить ударение на первую букву И?
3. Проглатывание 3-4 буквенных слов ("мир", "шее") в конце предложения (исправляется паузой или : ). Почему слова проглатываются?
4. Замена гомографа "пирог<а" приводит к произношению "пирогциркумфлекса". Почему символ произносится вместо выбора гомографа?

Возможности расставлять паузы после всех коротких слов в конце предложения у меня нет. На это уйдёт вся жизнь, проще самому голосом сидеть и озвучивать.


Сообщение отредактировал alsup - Понедельник, 19.06.2023, 18:52
 
balabolkaДата: Вторник, 20.06.2023, 17:05 | Сообщение #8
V.I.P.
Группа: Модераторы
Сообщений: 139
Статус: Offline
Цитата alsup ()
при установке в виртуальную машину Win XP 64 бит программа через пару секунд после старта делает экран чёрным с цветными чёрточками по всей верхней половине.

По поводу проблем с запуском программы в WinXP ничем помочь не могу: у меня остался только один компьютер с 32-битной версией WinXP, и программа там работает нормально. Пользователи сообщали о проблемах, но они были связаны с попытками установить новые версии голосов на старую операционную систему (например, новые версии голосов RHVoice). После деинсталляции сбойных голосов программа работала нормально.

Что касается изменения произношения слов, то для Microsoft Speech Platform действуют те же теги XML, что и для SAPI 5. Разработчики Microsoft предлагают использовать тег PRON, записывая транскрипцию слова с помощью фонетического алфавита UPS (Universal Phone Set):
Код
<pron sym="S1 Z A M AX K">замок</pron>

https://learn.microsoft.com/en-us....5)#pron

Способ этот довольно неудобный, но программа "Балаболка" частично пытается облегчить процесс перевода букв в фонемы для записи тегов. Выделите слово в главном окне и выберите пункт главного меню "Текст|Вставить тег XML". В появившемся окне надо поставить "галочку" в пункте PRON и нажать кнопку "Вставить фонемы". Откроется окно редактора фонетической транскрипции. В поле "Текст" будет вставлено слово, выделенное в главном окне. Если требуется изменить ударение в слове, надо указать его с помощью большой буквы: например, "замОк". Нажмите кнопку "Преобразовать текст в UPS", и программа вставит в поле "Фонемы" фонетическую транскрипцию: "Z AEX S1 M O K". Используйте эту строку для тега PRON, который будет вставлен в главное окно.

Существуют разные фонетические алфавиты: кроме UPS, который был придуман в Microsoft и никем больше не используется, есть IPA и X-SAMPA. Транскрипции слов, записанные с помощью этих алфавитов, можно найти в интернете (например, в "Викисловаре"). Можно скопировать транскрипцию IPA, вставить ее в "Балаболку" и нажать кнопку "Преобразовать символы IPA в UPS".

Слово: замок
IPA: [ˈzamək]
UPS: "S1 Z A M AX K"

В файле справки "Балаболки" есть информация о тегах XML и фонетических транскрипциях. Как я уже отметил, этот способ неудобный и сложный; но другого решения нет. Рекомендую обратить внимание на другие русские голоса: "Татьяна" и "Максим" от фирмы IVONA, "Катя", "Милена" и "Юрий" от фирмы Nuance, "Алёна" от фирмы Acapela Group.
Прикрепления: 1564906.jpg (114.5 Kb)
 
alsupДата: Вторник, 20.06.2023, 17:32 | Сообщение #9
Группа: Пользователи
Сообщений: 4
Статус: Offline
Спасибо за советы!

О тэгах XML мне известно. К сожалению, редактирование текста не может быть использовано из-за его объёма. У меня где-то 300 часов лекций. Жизни не хватит выслушивать, править, выслушивать опять.

Голос Акапела Алёна я пробовал: он говорит как-то натужно, как будто сквозь сжатые губы, и подквакивает, в точности как Николай и другие. Слушать это невозможно, иначе как по приговору суда.

СканСофт Катерина хрипит в конце предложения.

Только Елена произносит всё наиболее естественно, но с вышеуказанными ошибками. Если бы можно было хотя бы заставить её произносить короткие слова в конце предложений, то с неправильными ударениями можно было бы жить. Почему программа проглатывает их в наибольшей степени с Еленой, но также и с Катериной в меньшей степени и совсем не проглатывает с Алёной?

Что касается ударений, то почему в добавленное в словарь "искорок" произносится как "искОрок" даже если в произношении я напишу "Искорок", хотя если я сделаю "искорОк", то так и будет произнесено? Почему ударением игнорируется заглавная буква в начале слова "Искорок"?


Сообщение отредактировал alsup - Вторник, 20.06.2023, 18:06
 
balabolkaДата: Вторник, 20.06.2023, 18:10 | Сообщение #10
V.I.P.
Группа: Модераторы
Сообщений: 139
Статус: Offline
Цитата alsup ()
Почему программа проглатывает их

Моя программа сама ничего не "проглатывает": она посылает текст голосу, и именно голос читает предложения вслух. Если голос работает неправильно, обращайтесь с жалобой к его разработчикам, в поддержку компании Microsoft. Но шансов на решение проблемы мало, так как Microsoft уже записал Speech Platform в "устаревшие технологии" и потихоньку убирает информацию в архив.

Если нужны паузы после предложений, в "Балаболке" есть настройка для этого: пункт главного меню "Настройки|Общие настройки", вкладка "Паузы".

Кроме голосов SAPI 5, есть еще онлайн-сервисы, попробуйте использовать их: пункт главного меню "Сервис|Онлайн-сервис для синтеза речи". Почти у всех онлайн-сервисов есть русские голоса.
 
alsupДата: Вторник, 20.06.2023, 19:08 | Сообщение #11
Группа: Пользователи
Сообщений: 4
Статус: Offline
Да, Вы правы. Построил ВМ на 7 и в ней не проглатывается. Видимо особенность ХР вообще или под VirtualBox.
Паузы с вкладки паузы проблему не решали, только тэгом в тексте.

Вам не приходила в голову мысль создать облако для хранения исправлений произношения? Эдакий центральный .dic? Ведь без него каждый пользователь горбатится над этим индивидуально, а толку ноль: каждому следующему приходится снова исправлять процентов 20% русского языка. Я бы с радостью заплатил за Вашу программу рублей этак 4000, но по результатам тестирования бесплатной версии вижу, что гораздо лучшая инвестиция - это микрофон с Али и УСБ звуковая карта с линейным входом, потому что трудоёмкость обучения голосов русскому языку превысит трудоёмкость живой озвучки.

По замене гомографов кстати посоветуйте что-нибудь, а то каждый раз выбирается неправильный, а замена вставляет произношение символа, а не выбирает гомограф.

Слово "эй" произносится как "эикраткое". Почему?


Сообщение отредактировал alsup - Вторник, 20.06.2023, 19:48
 
tonio_kДата: Среда, 21.06.2023, 22:17 | Сообщение #12
Группа: Пользователи
Сообщений: 139
Статус: Offline
Цитата alsup ()
мысль создать облако для хранения исправлений произношения?
практика показывает, что из за особенностейдля разных голосовых движков применяются разные словари. Более менее общее и для всех пригодное это словари замен омографов. В остальном, что хорошо для Николая - очень плохо для Максима.
Цитата alsup ()
Голос Акапела Алёна
ну, это примеры уж очень устаревших голосов
Тут варианты послушайте
http://i91650e3.beget.tech/viewtopic.php@f=15&t=3.html
Сборки попробуйте (внимание, словари в сборке только для корректного голоса! Смешивать настоятельно не рекомендуется)


Сообщение отредактировал tonio_k - Среда, 21.06.2023, 22:20
 
alsupДата: Среда, 21.06.2023, 23:14 | Сообщение #13
Группа: Пользователи
Сообщений: 4
Статус: Offline
Весь процесс всё больше напоминает ремонт тормозов на жиге или замену сцепления на козле. Мне кажется, что создатели бесплатного софта убеждены, будто пользователи спят и видят, как бы научиться ещё дюжине-другой языков программирования в свободное от работы время. Когда подбиваешь бухгалтерию использования Балаболки, выходит дороже, чем нанять чтеца с audio-production.
 
minko95Дата: Вторник, 11.07.2023, 03:15 | Сообщение #14
Группа: Пользователи
Сообщений: 1
Статус: Offline
как можно сделать, чтобы таблицы в тексте отображались и текст не был разбросан?
 
LecronДата: Среда, 12.07.2023, 08:33 | Сообщение #15
Группа: Пользователи
Сообщений: 17
Статус: Offline
Цитата tonio_k ()
практика показывает, что из за особенностейдля разных голосовых движков применяются разные словари.
Практика показывает, что 95+% коррекций, это ударения и только 5-% псевдофонемная коррекция произношения. Причем среди них, очень много общих купе=купэ, что=што.
Так что вариант обобщения вполне имел смысл. Но не сейчас, когда наблюдается падение интереса к теме предобработки.
Несколько лет назад предлагал идею создания собственного движка ударения в программе озвучки и корректирование словарем именно его. Что позволит сравнительно безболезненно сменить движок. Понадобится только псвдофонемная движково-зависимая коррекция следующим этапом.
 
MyTTS (форум) » Программы, использующие синтез речи в Windows » Балаболка » Балаболка TTS
  • Страница 1 из 2
  • 1
  • 2
  • »
Поиск:

Общение