Начало темы здесь (ссылка на архивную копию форума mytts.info)
#1 Сообщениеbalabolka » 04 авг 2018 18:18 Фирма Voice Information Associates, Inc., специализирующаяся на новостях из мира синтеза и распознавания речи, опубликовала результаты ежегодного тестирования синтезаторов речи. В исследовании участвовали английские коммерческие голоса, доступные на момент тестирования (март 2018 года). Были проверены голоса следующих фирм:
AT&T
Acapela Group
Amazon (видимо, это голоса IVONA)
Cepstral
CereProc
Google
Nuance
Microsoft
NeoSpeech
rSpeak Technologies
SelvasAI
Для тестирования использовался список из 1588 английских слов/фраз по следующим темам:
Числительные
Омографы
Слова иностранного происхождения
Акронимы и аббревиатуры
Имена собственные
Почтовые адреса
Все голоса справились с чтением текста в среднем успешно на 80%. Итоговые результаты:
rSpeak Technologies (98,6% правильно прочитанных слов и фраз)
Amazon (97,7%)
NeoSpeech (95,6%)
SelvasAI (95,4%)
Acapela Group (94,7%)
CereProc (90,4%)
Microsoft (77,1%)
Cepstral (72,2%)
Nuance (71,0%)
AT&T (64,5%)
Google (60,7%) Победители тестирования 2018 года - английские голоса от фирмы rSpeak Technologies.
#2 СообщениеLecron » 05 авг 2018 12:14 Неожиданно. Хваленый Гугл, со своими неройсетями и прочим машин-лёрнинг, на последнем месте. Да и лишь немного менее хваленый Нюанс, не далеко ушел. Если не обращать внимания на 6-ю позицию, хорошо заметны две группы — молодцы (около 95% и выше) и резкое отставание остальных. Любопытно, какая этому причина?
#3 Сообщениеbalabolka » 05 авг 2018 17:37 Справедливости ради надо сказать, что Google использует нейронные сети и искусственные интеллект, чтобы улучшить звучание синтезаторов речи (для изменения темпа речи, определения пауз между словами, изменения высоты голоса и т.п.). Здесь же оценивалась лишь правильность чтения английских слов, то есть знание английской грамматики. Видимо, в Google много хороших программистов, но мало хороших филологов.
Тут интересно другое. Победитель rSpeak - это голландская компания, а голоса, занявшие второе место (Amazon/IVONA), созданы командой разработчиков из Польши. Как говорил профессор Хиггинс в "Моей прекрасной леди": "Почему англичане не умеют правильно говорить по-английски?"