Исследователи из лаборатории армии США и Техасского университета в Остине разработали алгоритм, призванный научить роботов выполнять задания, взаимодействуя с инструктором-человеком. Алгоритм получил название Deep TAMER, пишет Science Daily.Американские военные инженеры создали алгоритм Deep TAMER, который с помощью глубокого обучения позволяет роботу учиться выполнять задания, просматривая видео в ускоренном режиме с помощью человека-тренера. По словам ведущего автора исследования доктора Гарретта Уорнелла, новый алгоритм позволяет человеку учить робота, наблюдая за ним и давая обратную связь, например, произнося слова «хорошая работа» или «плохая работа» — подобно тому, как тренируют собак.
Уорнелл сказал, что новый тип обучения сделает прорыв в скорости приспособления роботов, которые в настоящее время видят мир только через компьютерные изображения. По его словам, это является важным первым шагом в разработке полноценных автономных устройств, способных выполнять реальные задачи в реальном мире.
«Многие современные методы обучения требуют, чтобы роботы взаимодействовали со средой в течение длительных периодов времени, чтобы узнать, как оптимально выполнить задачу, — говорит он. — Во время этого процесса робот может выполнять действия, которые могут быть не только неправильными, но и катастрофическими, например, он может упасть со скалы во время учений в горах. Помощь людей ускорит обучение и поможет избежать потенциальных ловушек».
Результаты исследования будут представлены на заседании Ассоциации содействия развитию искусственного интеллекта.