mytts_omograph_1.pls ... mytts_omograph_4.pls - Словарь омографов с проставленными ударениями.
mytts_omo_auto.pls - Частотный словарь омографов для автоматической обработки омографов в тексте с учетом их частоты встречаемости, составленный на основе Корпуса русского литературного языка объемом 1 млн словоупотреблений. Служит для автоматической обработки "пропущенных" при разметке омографов.
mytts_yoyo_1.pls ... mytts_yoyo_12.pls - "Ё"-лексикон. Словарь со словами с буквой "Ё" с около 233 тысяч словоформ. Лексикон содержит почти все литературные, разговорные и уменьшительные формы во всех склонениях и спряжениях, а также сленг, слова иностранного происхождения, обсценную лексику.
clitics.pls - Словарь клитик (determiners). Словарь содержит правила замен для клитик - слов, безударных в речевом потоке и фонетически примыкающих к предыдущему или последующему слову: зАугол Излесу нЕначем
Рекомендуется не пополнять указанные словари, а только редактировать/удалять записи в них.
Словари для подключения в программах "Balabolka" и "Demagog"
Как-то можно туда словари подключить, чтобы улучшить произношение?
Только если прикрутить pls словари к самому голосовому движку ivona, но это даст лишь небольшое улучшение в произношении некоторых слов. Ошибки в омографах этот способ особо не лечит, а именно они больше всего и режут слух
как я понял, Блаболка умеет преобразовывать субтитры в аудио. Предполагаю, что нужно предварительно "скормить" Балаболке субтитры, и полученное (после прогона всеми словарями) аудио воспроизводить вместе в видео. Как и и что нужно для этого - ищите или спрашивайте в ветке Балаболки.