Дата: Воскресенье, 19.03.2023, 17:47 | Сообщение #76
Группа: Пользователи
Сообщений: 14
Статус: Offline
здравствуйте. подскажите, как после склейки mp3 (в виде почасовых файлов) автоматически удалить кучу мелких исходных mp3 и папки BOOK & SCRIPT с содержимым. приходится вручную удалять.
PS если кому интересно - сравнил 24 и 48 КГц по трем женским исполнителям. Разницы между КГц не просек. Размеры файлов не меняются. Хуже всех из женщин - Бая (ИМХО). Мужички подкачали уж очень сильно. Как древний вариант Балабола. Их не стал даже запоминать. Ссылка на яндекс: сравнение озвучки
Сообщение отредактировал serjufa - Воскресенье, 19.03.2023, 18:24
здравствуйте. на ресурсе ссылка есть упоминание о новом спикере - Евгении. нельзя ли его прикрутить к Демагогу?
Models and SpeakersAll of the provided models are listed in themodels.ymlfile. Any metadata and newer versions will be added there. V3V3 models supportSSML. Also see Colab examples for main SSML tag usage. IDSpeakersAuto-stressLanguageSRColabv3_1_ruaidar, baya, kseniya, xenia,eugene, randomyesru (Russian)8000, 24000, 48000
Сообщение отредактировал serjufa - Четверг, 06.04.2023, 07:34
P.S. Мне кажется, что в сборке tonio_k просто нечаянно пропущен пункт меню для eugene, ведь все голоса находятся в одном файле - model.pt, и Евгений там тоже есть.
P.P.S. В сборке tonio_k в папке lib есть файл UserForm2.lua Надо найти в нем вот такой фрагмент и в нем поправить (выделено красным): Тогда в меню голосов появится голос Евгений
::_dialog7::--" Голос: "..vo -- a = Input('Полное или частичное названия голоса',{'Голос'..'='..UserForm.vo} _shapka = "Выберите голос:" _items={ "aidar", "baya", "kseniya", "xenia", "eugene", "random", } if UserForm.vo == "aidar" then t = 1 end if UserForm.vo == "baya" then t = 2 end if UserForm.vo == "kseniya" then t = 3 end if UserForm.vo == "xenia" then t = 4 end if UserForm.vo == "random" then t = 5 end dialog0 = Menu(_shapka,_items,t) if dialog0 == 0 then goto HALT end if dialog0 == 1 then UserForm.vo = "aidar" end if dialog0 == 2 then UserForm.vo = "baya" end if dialog0 == 3 then UserForm.vo ="kseniya" end if dialog0 == 4 then UserForm.vo = "xenia" end if dialog0 == 5 then UserForm.vo = "eugene" end if dialog0 == 6 then UserForm.vo = "random" end goto SLOV1
tonio_k использует обычную, 32-разрядную версию Demagog, с ее помощью делит текст на мелкие части - временные файлы и создает временный файл script.py - скрипт на питоне, в котором повторяются множество раз практически одинаковые фрагменты: озвучить временный файл номер такой-то и записать во временный аудиофайл Затем из Demagog вызывается питон как внешняя программа (версия 3.7 входит в состав сборки) с заданием: выполняй script.py В завершение, опять же сам Демагог объединяет временные аудиофайлы в более крупные. И задача - решена! Достоинства: умеет работать под 64- разрядной Win 7, что важно для слабых компов, которые не тянут десятку или одиннадцатую.
А моя сборка использует 64-разрядную версию Demagog, которая содержит в себе питон версии 3.10, и выполняет всегда один и тот же питон-скрипт - напрямую, из Демагога. Потому что в 64х версии питон является как бы частью Демагога. Скрипт Text to speech.py сам берет текст из активного окна Демагога, делит его на части и в цикле озвучивает, помещая результат в аудиофалы, которые тут же сам объединяет. Достоинства: более удобный интерфейс, и можно озвучивать тексты на любом из 6 языков: английский, русский, французский, немецкий, испанский, украинский. Недостаток: работает только под 64-разрядной Win 10, 11.
Мне кажется, что в сборке tonio_k просто нечаянно пропущен пункт меню для eugene, ведь все голоса находятся в одном файле - model.pt, и Евгений там тоже есть.
Да да, так и было - пропустил. Только я уже пару-тройку месяцев назад поправил и обновил. Только как поправил: рандомный голос убрал (мне показалось его наличие непрактично) и вместо рандомного - Евгения прописал. Лень было его отдельными пунктом заводить.
Яндекс - точно ссылка обновлена на предмет Евгения, а вот Google ссылку мог и не обновить - не проверял.
Из самого последнего, ссылка на маленькое обновление в Телеграмме. Добавил пару скриптов что бы Демагог в Линукс под wine с Silero без ошибок работал. И добавил что бы ещё в аудио в ogg формате записать можно было.
в файле:
#UserForm.txt
Если поменяем строку
Код
["ffmpeg_out"] = "mp3",
на:
Код
["ffmpeg_out"] = "ogg",
Тогда выходные файлы будут в формате *.ogg
Это прошлогодняя доработка.
UPD В сборке есть поддержка продолжение записи с места прерывания в случае сбоя или, если, сами прервали запись (закрыли чёрное окошко записи). Для старых ПК, когда ставим запись на ночь - функция полезная.
Сообщение отредактировал tonio_k - Пятница, 07.04.2023, 02:16
спасибо. просветили. еще вопрос - все голоса озвучивают по одному алгоритму? вопрос связан с тем, что мужские голоса очень проигрывают женским в части произношения и ударения. мне показалось или нет, что разные голоса по-разному работают с ударением, хотя и используют обшие словари
Сообщение отредактировал serjufa - Пятница, 07.04.2023, 07:43
Я запускал озвучку коротких текстов, с отключенными словарями. При этом впечатление такое, что в ударениях все голоса Silero делают одинаковые ошибки на одних и тех же словах. А что до четкости и выразительности произношения, то наверное, дикторы-женщины, на которых обучали нейросетевую модель, просто читали тексты лучше дикторов-мужчин Глава Silero А.Вейсов как-то признался, что все дикторы были НЕ профессионалы. Нанимать профессионалов было бы неподъемно дорого. Вдобавок, возникали проблемы с авторскими правами.
понятно. сравнил озвучку 2 версий Демогогов (tonio_k и flegont) на примере "Калинин. Лесные призраки". В обоих случаях кодировка велась с подключением всех словарей от сборки. во второй сборке есть ошибка ударения в "Никита". Время кодирования у flegont заняло меньше времени. Вопрос - стоит ли прицепить к сборке flegont словари от tonio_k? Можно ли добавить к сборке flegont к имени файлов имя книги, как это делается у tonio_k?
Он был добровольцем в рядах франкистов. Он был французским офицером и диверсантом абвера. Но всё это в прошлом. Попав в Советский Союз, потомок белых эмигрантов Никита Мещеряков развернул своё оружие против немцев и уже не сходит с выбранного пути.
файлы прицепил. длинное название соответствует озвучке от tonio_k, короткое - от flegont файлы
Сообщение отредактировал serjufa - Пятница, 07.04.2023, 10:16
стоит ли прицепить к сборке flegont словари от tonio_k?
Какие-то, наверняка, стОит. Какие-то, может, будут излишними. Тут только эксперимент покажет. Я ведь ограничился самым минимумом: большущий словарь ударений Орфоэпия.dic (взятый, кстати, из сборки tonio_k) + собственноручно разработанный numbers.rex + выжимка из разных словарей - Lat2Cyr.dic.
А нужны еще словари для распознания омографов - вечная и ужасная проблема. В Silero ее пытаются решить, дообучив модель, чтобы было 95% распознавание. Похоже, воз и ныне там... А ведь омографы - это не только существительные. Имена собственные тоже могут ими быть. В гостиной появились его сиятельство, граф НикИта Иванов и его невеста - мадемуазель НикитА Лафорж
Цитата
Можно ли добавить к сборке flegont к имени файлов имя книги, как это делается у tonio_k?
Немножко доработаю сборку, и будет выбор: добавлять ли имя книги к имени аудио-файла.