Microsoft побила рекорд в распознавании речи. Теперь доля ошибок составляет лишь 5,1%. Предыдущий рекорд принадлежит IBM — 5,5% ошибок.
Microsoft объявила о том, что ей удалось добиться нового рекорда в распознавании речи — 5,1% ошибок, пишет TechCrunch. Прежний рекорд алгоритма от Microsoft составлял 5,9% ошибок.
Для тестирования системы был использован Switchboard corpus — сборник из 2400 телефонных разговоров. Он применяется для аналогичных задач с начала 1990-х годов. Исследователи хотели добиться такой же точности распознавания, как у людей, делающих распечатку аудиозаписи.
Доля ошибок алгоритма компании в прошлый раз составляла 5,9%. Теперь исследователям Microsoft удалось улучшить результаты до рекордных 5,1%. Кроме того, они позволили системе использовать целые разговоры, чтобы дать ей возможность адаптировать свои расшифровки к контексту и предсказывать, какие слова или фразы, скорее всего, последуют дальше.
Предыдущий рекорд в технологиях распознавания речи принадлежит IBM. Компании соревнуются, то и дело обгоняя друг друга. Весной IBM удалось снизить долю ошибок в компьютерном распознавании речи с 6,9% до 5,5%, а до этого рекорд принадлежал Microsoft.