Запуск ChatGPT Agent: Новый уровень автоматизации для бизнеса

OpenAI представляет ChatGPT Agent: от исследований к реальной автоматизации

17 июля 2025 года OpenAI запустила ChatGPT Agent, который преобразовал ChatGPT из простого разговорного помощника в универсального ИИ-агента, способного самостоятельно выполнять сложные многошаговые задачи — от веб-серфинга до выполнения кода — в виртуальной компьютерной среде.

Объединение предыдущих возможностей

ChatGPT Agent основывается на двух ранее разработанных инструментах:

Оператор, который позволял ограниченные веб-взаимодействия — кликать, прокручивать и заполнять формы с помощью браузерного агента.
Глубокие исследования, которые обеспечивали автономный просмотр и синтез отчетов на протяжении более длительных периодов.

Каждый из этих инструментов имел свои ограничения: Оператор мог взаимодействовать, но не мог проводить глубокий анализ; Глубокие исследования могли анализировать, но не взаимодействовали динамически с сайтами. ChatGPT Agent объединяет сильные стороны обоих, создавая единую архитектуру, которая сочетает в себе просмотр, использование инструментов и рассуждения.

Внутренняя архитектура и рабочий процесс

В основе ChatGPT Agent лежит виртуальная компьютерная среда, которая сочетает:

Визуальный браузер для взаимодействия с человеческими интерфейсами;
Текстовый браузер, оптимизированный для структурированного анализа;
Консоль/терминал для выполнения кода;
Интегрированные API-коннекторы для таких сервисов, как Gmail или GitHub.

Агент постоянно адаптируется, принимая решения о том, нужно ли нажимать кнопки, запускать скрипты или анализировать содержимое, при этом сохраняя состояние между инструментами. Все действия происходят в контролируемом контексте агента, что обеспечивает отслеживаемость и гибкость.

Примеры задач: от планирования до выполнения

ChatGPT Agent может справляться с такими задачами, как:

Календарное планирование: сканирование вашего календаря, поиск связанных новостей и подведение итогов предстоящих встреч.
Заказ продуктов: поиск ингредиентов, сравнение цен, размещение заказов.
Конкурентный анализ: сбор данных с сайтов конкурентов, создание слайдов или таблиц.
Финансовое моделирование: загрузка данных, обновление таблиц, сохранение форматирования.

Эти рабочие процессы включают многофункциональное использование инструментов: вход в сайты, выполнение скриптов в терминале, а затем упаковка результатов в редактируемые документы — и все это под вашим контролем.

Эффективность: показатели и сравнение с людьми

OpenAI сообщает о значительных успехах по нескольким показателям:

Последний экзамен человечества: уровень успешности 41,6% (лучший результат среди агентов); до 44,4% при параллельных испытаниях.
FrontierMath: 27,4% точности с использованием терминала и поддержки кода, что превосходит предыдущие модели.
SpreadsheetBench: 45,5% общий балл с редактированием XLSX, по сравнению с 20% у Copilot в Excel и около 71% у людей.
Внутренний бенчмарк знаний: инструменты агента достигают или превосходят экспертные показатели примерно в 50% случаев.
BrowseComp и WebArena: новые рекорды с 68,9% по задачам на основе просмотра.

Эти оценки демонстрируют заметное улучшение как в автономии, так и в сложности задач.

Безопасность и снижение рисков

Автономия агента вводит новые риски. OpenAI внедрила несколько мер безопасности:

Явное подтверждение перед любым значимым действием (например, покупки, публикации).
Режим наблюдения: некоторые чувствительные задачи требуют активного контроля.
Надежные защиты от инъекций запросов, включая обучение для обнаружения аномальных веб-запросов и мониторинг вывода инструментов.
Механизмы конфиденциальности: режим захвата, специфичный для сессии, без сохранения чувствительных вводов, таких как пароли.
Меры против биологических угроз: классификация как высокорисковая для биологических агентов с активным моделированием угроз, отказным обучением, живым мониторингом и системами поощрения за нахождение ошибок.

Эти уровни направлены на снижение злоупотреблений — от утечек данных до захвата задач.

Как начать

ChatGPT Agent уже доступен для пользователей ChatGPT Pro, Plus и Team:

Пользователи Pro получают доступ сегодня с 400 сообщениями в режиме агента в месяц.
Пользователи Plus и Team получат постепенный доступ в ближайшие дни (40 сообщений в месяц).
Корпоративные и образовательные уровни последуют в ближайшие недели.

Запуск происходит за пределами США (ЕЭЗ, Швейцария).

Вы можете переключиться в «Режим агента» через меню инструментов в любом разговоре и описать желаемый рабочий процесс. Прогресс будет озвучиваться в реальном времени, и вы можете приостановить, взять под контроль или остановить процесс в любой момент.

Значение для рабочих процессов с поддержкой ИИ

ChatGPT Agent представляет собой скачок от пассивных систем запросов и ответов к проактивным цифровым работникам. Объединив:

Языковое рассуждение (через модели класса GPT-4);
Оркестрацию инструментов (браузеры, терминалы);
Контекстно-сохраняющие среды выполнения,

OpenAI позволяет использовать более автономные, надежные и ориентированные на действия сценарии. Хотя контроль необходим для защиты от злоупотреблений, этот релиз расширяет возможности того, что могут делать ИИ-помощники, а не только говорить.

Для разработчиков и специалистов по данным ChatGPT Agent становится платформой: программируемым, наблюдаемым агентом, способным собирать, анализировать, синтезировать и экспортировать по запросу. Это открывает возможности для рабочих процессов следующего поколения в исследованиях, автоматизации бизнеса и личной продуктивности.

Заключение

ChatGPT Agent — это не просто улучшение разговорного интерфейса, а стратегический поворот к обобщенным, автономным рабочим процессам ИИ. Его дебют знаменует переход LLM от пассивных советчиков к активным агентам, выполняющим исследования, создание и реальные действия в единой, контролируемой среде. Ожидайте, что это станет основополагающей возможностью в областях, дополненных ИИ.