Microsoft Releases POML (Prompt Orchestration Markup Language): Модульность и Масштабируемость в LLM Запросах
Что такое POML?
POML (Prompt Orchestration Markup Language) — это открытый фреймворк, разработанный для улучшения инженерии запросов в больших языковых моделях (LLM). Он предлагает структурированный подход к созданию сложных, поддерживаемых и повторно используемых AI-запросов, что решает проблемы, связанные с использованием неструктурированного текста.
Ключевые особенности POML
1. Структурированная разметка запросов
POML использует семантические элементы, такие как <role>, <task> и <example>, чтобы определить разделы запросов. Этот модульный дизайн способствует читаемости и поддерживаемости.
<poml>
<role>Вы — учитель естественных наук.</role>
<task>Объясните гравитацию, используя изображение ниже.</task>
<img src="gravity_diagram.png" alt="Схема гравитации" decoding="async"/>
<output-format>Используйте простой язык и ограничьте ответ 50 словами.</output-format>
</poml>
2. Всеобъемлющая обработка данных
POML позволяет интегрировать различные внешние типы данных, включая текстовые документы, электронные таблицы и изображения, что упрощает использование образовательных материалов.
3. Отдельное оформление представления
Вдохновленный CSS, POML поддерживает систему стилей, отделяющую содержимое от форматирования. Это минимизирует риски нестабильного вывода и упрощает A/B тестирование.
<output-format style="verbose">
Пожалуйста, предоставьте подробное пошаговое объяснение, подходящее для взрослых.
</output-format>
4. Интегрированный движок шаблонов
POML включает движок шаблонов, который поддерживает переменные, циклы, условные конструкции и определения, что позволяет программно генерировать запросы и управлять сложными вариациями.
5. Обширная экосистема инструментов
POML поддерживается набором инструментов для разработчиков, включая расширение для VS Code с подсветкой синтаксиса и автозаполнением, а также SDK для Node.js и Python, что упрощает интеграцию с популярными LLM фреймворками.
Пример: Запрос с Ссылкой на Изображение
Пример запроса для обучения фотосинтезу может быть структурирован следующим образом:
<poml>
<role>Вы — терпеливый учитель, объясняющий концепции 10-летнему ребенку.</role>
<task>Объясните концепцию фотосинтеза, используя предоставленное изображение.</task>
<img src="photosynthesis_diagram.png" alt="Схема фотосинтеза" decoding="async"/>
<output-format>Начните с "Привет, будущий ученый!" и ограничьте объяснение 100 словами.</output-format>
</poml>
Техническая архитектура и философия
POML воплощает концепцию «слоя представления» из традиционной фронтенд-разработки, обеспечивая четкое разделение представления на бизнес-логику. Эта архитектура облегчает рефакторинг запросов, тестирование вариаций и поддержание согласованности в рабочих процессах.
Установка и начало работы
POML является открытым программным обеспечением (лицензия MIT) и доступен на GitHub. Пользователи могут установить расширение для VS Code, использовать SDK для Node.js или Python и ознакомиться с подробной документацией POML для руководств по синтаксису и интеграции.
Заключение
POML приносит необходимую структуру и масштабируемость в разработку запросов для AI-разработчиков. Его модульный синтаксис, всесторонняя обработка данных и богатая экосистема интеграции делают его многообещающим стандартом для оркестрации продвинутых LLM приложений.
Для дальнейшего изучения загляните на страницу GitHub, где представлены руководства и ресурсы.