Demagog TTS
|
|
flegont | Дата: Четверг, 22.07.2021, 01:25 | Сообщение #1 |
![flegont](/avatar/00/00/00615151.gif) V.I.P.
Группа: Модераторы
Сообщений: 141
Статус: Offline
| Начало темы здесь (ссылка на архивную копию форума mytts.info)
(44,0 Mb) архивная копия начала текущей ветки с форума mytts.info - для офлайн просмотра и поиска по всем страницам
Скачать Demagog.zip
Домашняя страница
|
|
| |
flegont | Дата: Суббота, 19.08.2023, 08:05 | Сообщение #121 |
![flegont](/avatar/00/00/00615151.gif) V.I.P.
Группа: Модераторы
Сообщений: 141
Статус: Offline
| Тестирование голосов V4 с ускоренной в 2-3 раза записью аудио. Результат записи аудио в прежней (V3) и новой версии голосов. И там и там - голос kseniya. Есть разница в звучании? Аудиофайлы
|
|
| |
Lecron | Дата: Суббота, 19.08.2023, 11:49 | Сообщение #122 |
Группа: Пользователи
Сообщений: 24
Статус: Offline
| Цитата flegont ( ![Ссылка на цитируемый текст](/.s/img/fr/ic/2/lastpost.gif) ) качество аудио стало несколько хуже. В комментариях этот момент тоже отметили. Ответ разработчика:
Цитата Мы столкнулись с некоторым количеством случаев нарушения лицензии наших моделей, в том числе жуликами оппортунистически настроенными людьми.
По этой причине было принято решение опубликовать кратно более быструю модель, но с некоторым лимитом по качеству, чтобы точно было понятно, что это синтез.
|
|
| |
flegont | Дата: Суббота, 19.08.2023, 12:21 | Сообщение #123 |
![flegont](/avatar/00/00/00615151.gif) V.I.P.
Группа: Модераторы
Сообщений: 141
Статус: Offline
| Да, тоже прочел этот ответ. Имхо, это деланье хорошей мины при плохой игре, когда замах был на рубль, а удар вышел на копейку. Есть предположение, что всё "ускорение" генерации аудио как раз и получено за счет урезания его качества. Выигрыш по скорости, кстати, не заявленные 3-4 раза, а 2-2.6. Ну, мне без разницы, 12 мин запись книжки шла или 5 мин. P.S. Голос eugene V4 вообще стал дребезжаще-хрипатым, почти, как старичок ELAN Nicolai
|
|
| |
alyuev | Дата: Суббота, 19.08.2023, 23:46 | Сообщение #124 |
Группа: Пользователи
Сообщений: 7
Статус: Offline
| Цитата flegont ( ![Ссылка на цитируемый текст](/.s/img/fr/ic/2/lastpost.gif) ) А пока, результат записи аудио в прежней и новой версии голосов. И там и там - голос kseniya. Есть разница в звучании? Да, разница есть. Не в пользу V4. Для меня - заметно не в пользу... Так что буду продолжать использовать предыдущие голоса.
|
|
| |
flegont | Дата: Воскресенье, 20.08.2023, 06:44 | Сообщение #125 |
![flegont](/avatar/00/00/00615151.gif) V.I.P.
Группа: Модераторы
Сообщений: 141
Статус: Offline
| Цитата Да, разница есть. Не в пользу V4. Вот и я о том же. И тоже по-прежнему использую голоса V3.1.
|
|
| |
flegont | Дата: Воскресенье, 24.09.2023, 12:19 | Сообщение #126 |
![flegont](/avatar/00/00/00615151.gif) V.I.P.
Группа: Модераторы
Сообщений: 141
Статус: Offline
| v. 7.30.422 (32/64 bit) небольшие поправки Оф. сайт
|
|
| |
ilog | Дата: Четверг, 12.10.2023, 22:34 | Сообщение #127 |
Группа: Пользователи
Сообщений: 10
Статус: Offline
| Моё почтение, господа и дамы! У меня дошли руки попробовать Silero TTS, и я тоже удостоверился, что v4 просто ужасны - голоса звучат как из бочки. Ну а v3.1 в самом деле неплохи.
Возник у меня вопрос, может кто-нибудь здесь хорошо знает PyTorch... Пробовал ли кто-нибудь сконвертировать TTS модель в ONNX? Вроде там веса для Tacotron-а просто бинарники, и такое должно быть возможно.
|
|
| |
flegont | Дата: Пятница, 13.10.2023, 09:07 | Сообщение #128 |
![flegont](/avatar/00/00/00615151.gif) V.I.P.
Группа: Модераторы
Сообщений: 141
Статус: Offline
| Серьезеый вопрос... навскидку просто нечего сказать. А мировой гугло-разум на "pytorch model to onnx" выкатывает в первой строчке прямо от разработчиков торча: EXPORTING A MODEL FROM PYTORCH TO ONNX
|
|
| |
ilog | Дата: Пятница, 13.10.2023, 16:48 | Сообщение #129 |
Группа: Пользователи
Сообщений: 10
Статус: Offline
| Спасибо, я уже взывал к мировому гугло-разуму и даже чатился с его GPT братьями. Но понял, что универсального способа для произвольной модели не существует. К тому же PyTorch использует pickle сериализацию, которую больше никто не применяет. Поэтому, надо понимать внутренности модели, и именно этих знаний мне и недостает.
|
|
| |
flegont | Дата: Суббота, 14.10.2023, 19:43 | Сообщение #130 |
![flegont](/avatar/00/00/00615151.gif) V.I.P.
Группа: Модераторы
Сообщений: 141
Статус: Offline
| Да уж... Нейросетевые модели так быстро начали развиаться, что это уже проблема - угнаться за новыми знаниями. Кстати, о Silero V4 - вот еще в Инете жалуются, а глава Silero неуклюже оправдывается...
|
|
| |
ilog | Дата: Воскресенье, 15.10.2023, 18:16 | Сообщение #131 |
Группа: Пользователи
Сообщений: 10
Статус: Offline
| Спасибо за информацию. Интересно, что же там за нарушения Creative Common такие? Ссылку на лицензию не указали? Выдали модель за свою? Не понятно...
Ну а с форматом попробую сам разобраться. Там речь не о тренировке, а просто о том, что класс модели определен не совсем по "пайторчковому" и соответственно экспорт не работает.
|
|
| |
tonio_k | Дата: Воскресенье, 15.10.2023, 18:36 | Сообщение #132 |
Группа: Пользователи
Сообщений: 162
Статус: Offline
| Цитата ilog ( ![Ссылка на цитируемый текст](/.s/img/fr/ic/2/lastpost.gif) ) Ссылку на лицензию не указали? Выдали модель за свою? Не понятно... например, такое есть упоминание. Вроде, об этом примере ранее тут на форуме уже упоминали.
Сообщение отредактировал tonio_k - Воскресенье, 15.10.2023, 18:37 |
|
| |
ilog | Дата: Воскресенье, 15.10.2023, 21:11 | Сообщение #133 |
Группа: Пользователи
Сообщений: 10
Статус: Offline
| Спасибо! И вправду некрасивая история. Я не подумал о вокодере, он-то ведь тоже сабжект лицензии. Жалко, что теперь мы качественных оффлайновых моделей для личного пользования не увидим. Может, хоть за разумные деньги предложат.
|
|
| |
wasyaka | Дата: Воскресенье, 15.10.2023, 21:36 | Сообщение #134 |
Группа: Модераторы
Сообщений: 35
Статус: Offline
| Цитата ilog ( ![Ссылка на цитируемый текст](/.s/img/fr/ic/2/lastpost.gif) ) Жалко, что теперь мы качественных оффлайновых моделей для личного пользования не увидим. При работающей Яндекс - халяве, оффлайновые модели при интернете в каждом утюге, ну почти, вызывает недоумение...- зачем мучить ...? Голоса... для меня, лучше прочитать.... или Макс Ивоновский И для справки Демагог 32-й работает со словарями шустрей 64-ого. и при включеном ВПН перестал записывать Яндекс... По странам не шерстил
Сообщение отредактировал wasyaka - Воскресенье, 15.10.2023, 22:22 |
|
| |
ilog | Дата: Воскресенье, 15.10.2023, 23:29 | Сообщение #135 |
Группа: Пользователи
Сообщений: 10
Статус: Offline
| Я не пользовался Демагогом с Silero, я просто написал в эту тему, поскольку тут обсуждали их модели. И я не знаю другие оффлайновые модели с качественными русскоязычными голосами. Буду признателен, если подскажете. Но именно оффлайновые.
|
|
| |