[ ]
Модератор форума: flegont  
MyTTS (форум) » Программы, использующие синтез речи в Windows » Demagog » Demagog TTS
Demagog TTS
flegontДата: Четверг, 22.07.2021, 01:25 | Сообщение #1
V.I.P.
Группа: Модераторы
Сообщений: 141
Статус: Offline
Начало темы здесь (ссылка на архивную копию форума mytts.info)

 (44,0 Mb) архивная копия начала текущей ветки с форума mytts.info - для офлайн просмотра и поиска по всем страницам


 Скачать Demagog.zip

Домашняя страница
 
flegontДата: Суббота, 19.08.2023, 08:05 | Сообщение #121
V.I.P.
Группа: Модераторы
Сообщений: 141
Статус: Offline
Тестирование голосов V4 с ускоренной в 2-3 раза записью аудио.
Результат записи аудио в прежней (V3) и новой версии голосов. И там и там - голос kseniya. Есть разница в звучании?
Аудиофайлы
 
LecronДата: Суббота, 19.08.2023, 11:49 | Сообщение #122
Группа: Пользователи
Сообщений: 17
Статус: Offline
Цитата flegont ()
качество аудио стало несколько хуже.
В комментариях этот момент тоже отметили. Ответ разработчика:
Цитата
Мы столкнулись с некоторым количеством случаев нарушения лицензии наших моделей, в том числе жуликами оппортунистически настроенными людьми.

По этой причине было принято решение опубликовать кратно более быструю модель, но с некоторым лимитом по качеству, чтобы точно было понятно, что это синтез.
 
flegontДата: Суббота, 19.08.2023, 12:21 | Сообщение #123
V.I.P.
Группа: Модераторы
Сообщений: 141
Статус: Offline
Да, тоже прочел этот ответ.
Имхо, это деланье хорошей мины при плохой игре, когда замах был на рубль, а удар вышел на копейку. Есть предположение, что всё "ускорение" генерации аудио как раз и получено за счет урезания его качества. Выигрыш по скорости, кстати, не заявленные 3-4 раза, а 2-2.6. Ну, мне без разницы, 12 мин запись книжки шла или 5 мин.
P.S. Голос eugene V4 вообще стал дребезжаще-хрипатым, почти, как старичок ELAN Nicolai wink
 
alyuevДата: Суббота, 19.08.2023, 23:46 | Сообщение #124
Группа: Пользователи
Сообщений: 7
Статус: Offline
Цитата flegont ()
А пока, результат записи аудио в прежней и новой версии голосов. И там и там - голос kseniya. Есть разница в звучании?
Да, разница есть. Не в пользу V4. Для меня - заметно не в пользу... Так что буду продолжать использовать предыдущие голоса.
 
flegontДата: Воскресенье, 20.08.2023, 06:44 | Сообщение #125
V.I.P.
Группа: Модераторы
Сообщений: 141
Статус: Offline

Цитата
Да, разница есть. Не в пользу V4.

Вот и я о том же. И тоже по-прежнему использую голоса V3.1.
 
flegontДата: Воскресенье, 24.09.2023, 12:19 | Сообщение #126
V.I.P.
Группа: Модераторы
Сообщений: 141
Статус: Offline
v. 7.30.422 (32/64 bit)
небольшие поправки
Оф. сайт
 
ilogДата: Четверг, 12.10.2023, 22:34 | Сообщение #127
Группа: Пользователи
Сообщений: 10
Статус: Offline
Моё почтение, господа и дамы! У меня дошли руки попробовать Silero TTS, и я тоже удостоверился, что v4 просто ужасны - голоса звучат как из бочки. Ну а v3.1 в самом деле неплохи.

Возник у меня вопрос, может кто-нибудь здесь хорошо знает PyTorch... Пробовал ли кто-нибудь сконвертировать TTS модель в ONNX? Вроде там веса для Tacotron-а просто бинарники, и такое должно быть возможно.
 
flegontДата: Пятница, 13.10.2023, 09:07 | Сообщение #128
V.I.P.
Группа: Модераторы
Сообщений: 141
Статус: Offline
Серьезеый вопрос... навскидку просто нечего сказать. А мировой гугло-разум на "pytorch model to onnx" выкатывает в первой строчке прямо от разработчиков торча: EXPORTING A MODEL FROM PYTORCH TO ONNX
 
ilogДата: Пятница, 13.10.2023, 16:48 | Сообщение #129
Группа: Пользователи
Сообщений: 10
Статус: Offline
Спасибо, я уже взывал к мировому гугло-разуму и даже чатился с его GPT братьями. Но понял, что универсального способа для произвольной модели не существует. К тому же PyTorch использует pickle сериализацию, которую больше никто не применяет. Поэтому, надо понимать внутренности модели, и именно этих знаний мне и недостает.
 
flegontДата: Суббота, 14.10.2023, 19:43 | Сообщение #130
V.I.P.
Группа: Модераторы
Сообщений: 141
Статус: Offline
Да уж... Нейросетевые модели так быстро начали развиаться, что это уже проблема - угнаться за новыми знаниями.
Кстати, о Silero V4 - вот еще в Инете жалуются, а глава Silero неуклюже оправдывается...
 
ilogДата: Воскресенье, 15.10.2023, 18:16 | Сообщение #131
Группа: Пользователи
Сообщений: 10
Статус: Offline
Спасибо за информацию. Интересно, что же там за нарушения Creative Common такие? Ссылку на лицензию не указали? Выдали модель за свою? Не понятно...

Ну а с форматом попробую сам разобраться. Там речь не о тренировке, а просто о том, что класс модели определен не совсем по "пайторчковому"  wacko  и соответственно экспорт не работает.
 
tonio_kДата: Воскресенье, 15.10.2023, 18:36 | Сообщение #132
Группа: Пользователи
Сообщений: 139
Статус: Offline
Цитата ilog ()
Ссылку на лицензию не указали? Выдали модель за свою? Не понятно...
например, такое есть упоминание. Вроде, об этом примере ранее тут на форуме уже упоминали.


Сообщение отредактировал tonio_k - Воскресенье, 15.10.2023, 18:37
 
ilogДата: Воскресенье, 15.10.2023, 21:11 | Сообщение #133
Группа: Пользователи
Сообщений: 10
Статус: Offline
Спасибо! И вправду некрасивая история. Я не подумал о вокодере, он-то ведь тоже сабжект лицензии. Жалко, что теперь мы качественных оффлайновых моделей для личного пользования не увидим. Может, хоть за разумные деньги предложат.
 
wasyakaДата: Воскресенье, 15.10.2023, 21:36 | Сообщение #134
Группа: Модераторы
Сообщений: 35
Статус: Offline
Цитата ilog ()
Жалко, что теперь мы качественных оффлайновых моделей для личного пользования не увидим.
При работающей Яндекс - халяве, оффлайновые модели при интернете в каждом утюге, ну почти, вызывает недоумение...- зачем мучить ...? Голоса... для меня, лучше прочитать.... или Макс Ивоновский
И для справки Демагог 32-й работает со словарями шустрей 64-ого.
и при включеном ВПН перестал записывать Яндекс...
По странам не шерстил


Сообщение отредактировал wasyaka - Воскресенье, 15.10.2023, 22:22
 
ilogДата: Воскресенье, 15.10.2023, 23:29 | Сообщение #135
Группа: Пользователи
Сообщений: 10
Статус: Offline
Я не пользовался Демагогом с Silero, я просто написал в эту тему, поскольку тут обсуждали их модели. И я не знаю другие оффлайновые модели с качественными русскоязычными голосами. Буду признателен, если подскажете. Но именно оффлайновые.
 
MyTTS (форум) » Программы, использующие синтез речи в Windows » Demagog » Demagog TTS
Поиск:

Общение