Category:

DeepMind: для достижения универсального ИИ достаточно обучения с подкреплением



Десятки лет преследуя мечту о создании «настоящего искусственного интеллекта», ученые разработали технологии, имитирующие зрение, языковые и моторные навыки, способность к рассуждению и прочие способности, входящие в понятие интеллекта. Их усилия привели к появлению систем, умеющих неплохо решать узкоспециальные задачи, но им еще далеко до универсального интеллекта животных и тем более людей. Специалисты из лаборатории DeepMind утверждают, что это не так, и они знаю, как может развиться такой ИИ на базе сегодняшних технологий.

Статья Reward is Enough («Вознаграждения достаточно»), вышедшая в журнале Artificial Intelligence, появилась под влиянием изучения эволюции естественного интеллекта, а также анализа последних достижений в искусственном. Идея авторов заключается в том, что метода максимизации вознаграждения и опыта проб и ошибок достаточно, чтобы машина начала вести себя так, чтобы ее можно было принять за разумную, пишет Venture Beat. Отсюда они делают вывод, что обучение с подкреплением, разновидность машинного обучения, основанная на максимизации вознаграждения, может привести к появлению универсального ИИ.

Один из самых распространенных методов создания ИИ — воспроизведение элементов интеллектуального поведения. Например, биология зрения млекопитающих породила системы, распознающие изображения, определяющие границы между предметами и так далее. Аналогичным образом, достижения в лингвистике привели к созданию систем обработки естественного языка. Все это примеры узкого ИИ, созданного для выполнения определенных задач.

Другой путь, который предлагает DeepMind — имитация простого, но эффективного правила, которое породило интеллект естественный. «Мы предлагаем альтернативную гипотезу: что обобщенной цели максимизации вознаграждения достаточно для того, чтобы стимулировать поведение, которое проявляет большую часть, если не все способности естественного и искусственного интеллекта», — пишут авторы.

Фактически, они предлагают повторить естественный отбор для машин. Те, кто приспособится лучше, выживут, остальные будут уничтожены. Успех в таком случае будет означать увеличение награды и потребует развития различных интеллектуальных навыков. В такой среде любое поведение, которое повышает вероятность вознаграждения, будет проявлять черты интеллекта.

В завершении авторы утверждают, что наиболее «универсальный и масштабируемый» способ максимизировать вознаграждение — позволить агенту учиться в процессе взаимодействия с окружающей средой. Постепенно эффективный ИИ сможет научиться восприятию, языку, социальному интеллекту и другим аспектам универсального интеллекта.

promo luckyea77 十一月 4, 2024 21:52 5
Buy for 10 tokens
В прошлом посте " Эпоха интеллекта" я публиковал эссе генерального директора OpenAI Сэма Альтмана. В нем Альтман пишет, что мы можем представить себе возможности создавать любое программное обеспечение, которое только можно представить, и многое другое. Недавно я с помощью нейросети создал…