luckyea77 (luckyea77) wrote,
luckyea77
luckyea77

Categories:

Выпущена ИИ-система, которая выделяет из книг их краткое содержание

В конце сентября 2021 года компания OpenAI представила модель искусственного интеллекта (ИИ), способную резюмировать книги любюой длины. Являясь усовершенствованной версией GPT-3, разработанной в исследовательской лаборатории, технология работает таким образом, что сначала обобщает небольшие разделы книги, а затем суммирует эти обобщения в более высокого уровня текст, следуя парадигме, которую OpenAI называет рекурсивной декомпозицией задач.

Обобщение документов длиной с книгу может оказаться полезным на компаниях, особенно в таких отраслях, где много документации, как разработка программного обеспечения. По данным исследования SearchYourCloud, работникам требуется до восьми поисков, чтобы найти нужный документ, а аналитики McKinsey сообщают, что сотрудники тратят 1,8 часа в день на поиск и сбор информации, связанной с работой.


Выпущена ИИ-система, которая выделяет из книг их краткое содержание

В OpenAI считают, что это эффективный рецепт, который можно использовать, чтобы помочь человеку заняться многими другими задачами. Масштабируемое решение проблемы выравнивания должно работать над задачами, которые трудно или долго оценивать самому человеку.

Новая модель компании основана на предыдущем исследовании, которое показало, что обучение модели с подкреплением на основе обратной связи от людей, помогает согласовать сводки модели с предпочтениями людей в отношении коротких сообщений и статей. Обучение с подкреплением подразумевает собой активное изучение системы выполнению задачи, например обобщению текста.

Для создания модели OpenAI объединил обучение с подкреплением с рекурсивной декомпозицией задачи, которая процедурно разбивает сложную задачу, к примеру, обобщение длинного куска текста на более простые и отдельные задачи, например, обобщение нескольких более коротких кусков. Такая декомпозиция позволяет людям быстро оценивать результат модели, используя текст небольших объемов. Более того, это позволяет модели резюмировать книги любой длины, от десятков страниц до сотен или даже тысяч.

OpenAI обучил модель на подмножестве книг из обучающей базы данных GPT-3, которые в основном относятся к жанру художественной литературы и содержат в среднем более 100 тыс. слов. Чтобы оценить модель, исследователи лаборатории взяли 40 самых популярных книг, опубликованных в 2020 году и поручили двум людям прочитать каждую книгу и написать краткое содержание, а затем оценить краткое содержание, как модели, так и друг друга.

«Эта работа является частью наших текущих исследований по согласованию передовых систем ИИ, что является ключом к нашей миссии. Наш прогресс в обобщении книг - это первая крупномасштабная эмпирическая работа по масштабированию методов выравнивания, - написали в блоге исследователи OpenAI Джеффри Ву, Райан Лоу и Ян Лейке.»

Хотя модель успешно генерировала резюме на уровне книги, содержащие большую часть важной информации, она также иногда генерировала неточные утверждения из-за отсутствия контекста, признает компания OpenAI в своем документе. Декомпозиция задачи предполагает, что отдельные части задачи могут быть выполнены независимо друг от друга, а это правило может оказаться неверным при составлении краткого содержания книги. Например, может быть трудно уловить случаи, когда ранние детали в книге становятся важными только позже, как это бывает в книгах о тайнах.

Tags: искусственный интеллект
Subscribe

Posts from This Journal “искусственный интеллект” Tag

promo luckyea77 december 30, 15:00 8
Buy for 10 tokens
По этой ссылке (или этой) можно скачать информационную базу для программы "1С:Предприятие". С помощью данной базы можно готовиться и сдавать экзамены по темам: - Электробезопасность - Основы промышленной безопасности А.1 - Специальные требования промышленной безопасности: Б 9.31.…
  • Post a new comment

    Error

    default userpic

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 2 comments