OpenAI представляет ChatGPT Agent: от исследований к реальной автоматизации
17 июля 2025 года OpenAI запустила ChatGPT Agent, который преобразовал ChatGPT из простого разговорного помощника в универсального ИИ-агента, способного самостоятельно выполнять сложные многошаговые задачи — от веб-серфинга до выполнения кода — в виртуальной компьютерной среде.
Объединение предыдущих возможностей
ChatGPT Agent основывается на двух ранее разработанных инструментах:
- Оператор, который позволял ограниченные веб-взаимодействия — кликать, прокручивать и заполнять формы с помощью браузерного агента.
- Глубокие исследования, которые обеспечивали автономный просмотр и синтез отчетов на протяжении более длительных периодов.
Каждый из этих инструментов имел свои ограничения: Оператор мог взаимодействовать, но не мог проводить глубокий анализ; Глубокие исследования могли анализировать, но не взаимодействовали динамически с сайтами. ChatGPT Agent объединяет сильные стороны обоих, создавая единую архитектуру, которая сочетает в себе просмотр, использование инструментов и рассуждения.
Внутренняя архитектура и рабочий процесс
В основе ChatGPT Agent лежит виртуальная компьютерная среда, которая сочетает:
- Визуальный браузер для взаимодействия с человеческими интерфейсами;
- Текстовый браузер, оптимизированный для структурированного анализа;
- Консоль/терминал для выполнения кода;
- Интегрированные API-коннекторы для таких сервисов, как Gmail или GitHub.
Агент постоянно адаптируется, принимая решения о том, нужно ли нажимать кнопки, запускать скрипты или анализировать содержимое, при этом сохраняя состояние между инструментами. Все действия происходят в контролируемом контексте агента, что обеспечивает отслеживаемость и гибкость.
Примеры задач: от планирования до выполнения
ChatGPT Agent может справляться с такими задачами, как:
- Календарное планирование: сканирование вашего календаря, поиск связанных новостей и подведение итогов предстоящих встреч.
- Заказ продуктов: поиск ингредиентов, сравнение цен, размещение заказов.
- Конкурентный анализ: сбор данных с сайтов конкурентов, создание слайдов или таблиц.
- Финансовое моделирование: загрузка данных, обновление таблиц, сохранение форматирования.
Эти рабочие процессы включают многофункциональное использование инструментов: вход в сайты, выполнение скриптов в терминале, а затем упаковка результатов в редактируемые документы — и все это под вашим контролем.
Эффективность: показатели и сравнение с людьми
OpenAI сообщает о значительных успехах по нескольким показателям:
- Последний экзамен человечества: уровень успешности 41,6% (лучший результат среди агентов); до 44,4% при параллельных испытаниях.
- FrontierMath: 27,4% точности с использованием терминала и поддержки кода, что превосходит предыдущие модели.
- SpreadsheetBench: 45,5% общий балл с редактированием XLSX, по сравнению с 20% у Copilot в Excel и около 71% у людей.
- Внутренний бенчмарк знаний: инструменты агента достигают или превосходят экспертные показатели примерно в 50% случаев.
- BrowseComp и WebArena: новые рекорды с 68,9% по задачам на основе просмотра.
Эти оценки демонстрируют заметное улучшение как в автономии, так и в сложности задач.
Безопасность и снижение рисков
Автономия агента вводит новые риски. OpenAI внедрила несколько мер безопасности:
- Явное подтверждение перед любым значимым действием (например, покупки, публикации).
- Режим наблюдения: некоторые чувствительные задачи требуют активного контроля.
- Надежные защиты от инъекций запросов, включая обучение для обнаружения аномальных веб-запросов и мониторинг вывода инструментов.
- Механизмы конфиденциальности: режим захвата, специфичный для сессии, без сохранения чувствительных вводов, таких как пароли.
- Меры против биологических угроз: классификация как высокорисковая для биологических агентов с активным моделированием угроз, отказным обучением, живым мониторингом и системами поощрения за нахождение ошибок.
Эти уровни направлены на снижение злоупотреблений — от утечек данных до захвата задач.
Как начать
ChatGPT Agent уже доступен для пользователей ChatGPT Pro, Plus и Team:
- Пользователи Pro получают доступ сегодня с 400 сообщениями в режиме агента в месяц.
- Пользователи Plus и Team получат постепенный доступ в ближайшие дни (40 сообщений в месяц).
- Корпоративные и образовательные уровни последуют в ближайшие недели.
Запуск происходит за пределами США (ЕЭЗ, Швейцария).
Вы можете переключиться в «Режим агента» через меню инструментов в любом разговоре и описать желаемый рабочий процесс. Прогресс будет озвучиваться в реальном времени, и вы можете приостановить, взять под контроль или остановить процесс в любой момент.
Значение для рабочих процессов с поддержкой ИИ
ChatGPT Agent представляет собой скачок от пассивных систем запросов и ответов к проактивным цифровым работникам. Объединив:
- Языковое рассуждение (через модели класса GPT-4);
- Оркестрацию инструментов (браузеры, терминалы);
- Контекстно-сохраняющие среды выполнения,
OpenAI позволяет использовать более автономные, надежные и ориентированные на действия сценарии. Хотя контроль необходим для защиты от злоупотреблений, этот релиз расширяет возможности того, что могут делать ИИ-помощники, а не только говорить.
Для разработчиков и специалистов по данным ChatGPT Agent становится платформой: программируемым, наблюдаемым агентом, способным собирать, анализировать, синтезировать и экспортировать по запросу. Это открывает возможности для рабочих процессов следующего поколения в исследованиях, автоматизации бизнеса и личной продуктивности.
Заключение
ChatGPT Agent — это не просто улучшение разговорного интерфейса, а стратегический поворот к обобщенным, автономным рабочим процессам ИИ. Его дебют знаменует переход LLM от пассивных советчиков к активным агентам, выполняющим исследования, создание и реальные действия в единой, контролируемой среде. Ожидайте, что это станет основополагающей возможностью в областях, дополненных ИИ.