29 ноября 2022 года «Сбер» открыл публичный доступ к платформе синтеза и распознавания речи SaluteSpeech для реализации некоммерческих проектов и для разработчиков-физлиц. Ранее получить доступ к платформе SaluteSpeech могли только юридические лица и индивидуальные предприниматели. Для некоммерческого использования речевых технологий платформы потребуется только регистрация на портале сервиса Studio. Детали использования сервиса описаны в документации.
Лимиты для физических лиц (бесплатно для некоммерческих проектов):
синтез речи: 200000 символов в месяц;
распознавание речи: 100 минут аудио в месяц.
При превышении лимитов доступ к сервису может быть заблокирован.
Доступны 6 русских голосов и 1 английский голос (24 КГц и 8 КГц). Есть поддержка тегов SSML. Можно указывать ударение в слове с помощью апострофа; символ должен стоять после ударной гласной:
Дата: Воскресенье, 04.12.2022, 14:15 | Сообщение #2
Группа: Пользователи
Сообщений: 35
Статус: Offline
Цитатаbalabolka ()
речи SaluteSpeech для реализации некоммерческих проектов и для разработчиков-физлиц. Ранее получить доступ к платформе SaluteSpeech могли только юридические лица и индивидуальные предприниматели.
Спасибо за инфо, и вот теперь всё ясно: голос "Olga prem" (V5) на Api-Host это Сберовская "Наталья"!
Сообщение отредактировал notnick - Воскресенье, 04.12.2022, 14:16
"Сбер" выпустил приложение для Windows и macOS, которое позволяет использовать сервисы для распознавания речи и озвучивания текста. Для работы с приложением нужен токен SaluteSpeech; для его получения нужно зарегистрироваться в облачном сервисе. Бесплатный тариф для физических лиц позволяет преобразовать в речь до 200000 символов в месяц.