luckyea77 (luckyea77) wrote,
luckyea77
luckyea77

Алгоритм распознавания речи от Microsoft сравнялся с человеком



Исследователи ИИ-подразделения Microsoft объявили, что созданная ими система распознавания речи практически сравнялась с человеком. Вероятность ошибки в кодовом слове (WER) составила 5,9% — столько же, сколько у профессиональных транскрибаторов.

Добиться таких показателей ученым помогли глубокие нейронные сети, способные хранить значительные объемы информации, — так называемые наборы обучающих данных. С их помощью система научилась распознавать паттерны в речи человека. Исследователи применили нейронные языковые модели для формирования ассоциативных облаков слов.

Система научилась понимать, что слово fast по смыслу ближе к quick, но никак не к slow. Благодаря этому алгоритм лучше ориентируется в речи и лучше понимает контекст. В процессе разработки был использован набор инструментов глубокого обучения Computational Network Toolkit от Microsoft.

Напомним, в сентябре разработчики Microsoft достигли самого высокого в мире уровня распознавания речи на тот период — процент ошибок алгоритма составил всего 6,3%. На этот раз компания побила собственный рекорд на 0,4%. Такой процент ошибок считается самым низким в индустрии. Показатель WER у профессиональных транскрибаторов так же составляет 5,9%, отмечает Microsoft в тексте исследования.

Главный эксперт компании по изучению речи Сюэдун Хуанг заявил, что равенство ИИ и человека в этой сфере следует считать историческим достижением. Однако авторы исследования подчеркивают, что алгоритм, как и человек, пока далек от совершенства. Исследователи будут испытывать систему в шумной среде — на улицах, в ресторанах и на открытых площадках в ветреную погоду. Следующим поворотным моментом должно стать не только распознавание речи, но и ее понимание, считают в компании.

Установленный рекорд позволит усовершенствовать системы распознавания речи в Xbox, Cortana и других продуктах Microsoft.

Алгоритмы учатся не только понимать речь, но и синтезировать ее. Так нейросеть WaveNet от DeepMind говорит по-английски и по-китайски более естественно, чем новейшие системы TTS Google. Хотя пока что спутать робота с человеком нельзя, система все равно превосходит большинство существующих аналогов.

Tags: искусственный интеллект
Subscribe

Posts from This Journal “искусственный интеллект” Tag

promo luckyea77 june 21, 2015 20:04 29
Buy for 10 tokens
В этой записи я буду давать ссылки на посты с лекциями и уроками в этом блоге: Учебные материалы и тесты: 11 ресурсов для бесплатного образования Проект "Лучшие кадры лучшей страны" Онлайн-курсы по высоким технологиям и инновациям Дистанционное образование в России (среднее профессиональное…
  • Post a new comment

    Error

    default userpic

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 2 comments