luckyea77 (luckyea77) wrote,
luckyea77
luckyea77

Categories:

DeepMind: для достижения универсального ИИ достаточно обучения с подкреплением



Десятки лет преследуя мечту о создании «настоящего искусственного интеллекта», ученые разработали технологии, имитирующие зрение, языковые и моторные навыки, способность к рассуждению и прочие способности, входящие в понятие интеллекта. Их усилия привели к появлению систем, умеющих неплохо решать узкоспециальные задачи, но им еще далеко до универсального интеллекта животных и тем более людей. Специалисты из лаборатории DeepMind утверждают, что это не так, и они знаю, как может развиться такой ИИ на базе сегодняшних технологий.

Статья Reward is Enough («Вознаграждения достаточно»), вышедшая в журнале Artificial Intelligence, появилась под влиянием изучения эволюции естественного интеллекта, а также анализа последних достижений в искусственном. Идея авторов заключается в том, что метода максимизации вознаграждения и опыта проб и ошибок достаточно, чтобы машина начала вести себя так, чтобы ее можно было принять за разумную, пишет Venture Beat. Отсюда они делают вывод, что обучение с подкреплением, разновидность машинного обучения, основанная на максимизации вознаграждения, может привести к появлению универсального ИИ.

Один из самых распространенных методов создания ИИ — воспроизведение элементов интеллектуального поведения. Например, биология зрения млекопитающих породила системы, распознающие изображения, определяющие границы между предметами и так далее. Аналогичным образом, достижения в лингвистике привели к созданию систем обработки естественного языка. Все это примеры узкого ИИ, созданного для выполнения определенных задач.

Другой путь, который предлагает DeepMind — имитация простого, но эффективного правила, которое породило интеллект естественный. «Мы предлагаем альтернативную гипотезу: что обобщенной цели максимизации вознаграждения достаточно для того, чтобы стимулировать поведение, которое проявляет большую часть, если не все способности естественного и искусственного интеллекта», — пишут авторы.

Фактически, они предлагают повторить естественный отбор для машин. Те, кто приспособится лучше, выживут, остальные будут уничтожены. Успех в таком случае будет означать увеличение награды и потребует развития различных интеллектуальных навыков. В такой среде любое поведение, которое повышает вероятность вознаграждения, будет проявлять черты интеллекта.

В завершении авторы утверждают, что наиболее «универсальный и масштабируемый» способ максимизировать вознаграждение — позволить агенту учиться в процессе взаимодействия с окружающей средой. Постепенно эффективный ИИ сможет научиться восприятию, языку, социальному интеллекту и другим аспектам универсального интеллекта.

Tags: искусственный интеллект
Subscribe

Posts from This Journal “искусственный интеллект” Tag

promo luckyea77 december 30, 15:00 8
Buy for 10 tokens
По этой ссылке можно скачать информационную базу для программы "1С:Предприятие". С помощью данной базы можно готовиться и сдавать экзамены по темам: - Электробезопасность - Основы промышленной безопасности А.1 - Специальные требования промышленной безопасности: Б 9.31. Эксплуатация опасных…
  • Post a new comment

    Error

    default userpic

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 1 comment