Встречайте DeepFleet: Новый набор ИИ-моделей от Amazon, который предсказывает будущие трафиковые паттерны для флотов мобильных роботов
Amazon достигла важной вехи, развернув своего миллионного робота в глобальных центрах выполнения и сортировки, что укрепило её позицию как крупнейшего оператора промышленных мобильных роботов в мире. Это событие совпало с запуском DeepFleet, набора базовых моделей, предназначенных для улучшения координации между огромными флотами мобильных роботов. Обученные на миллиардах часов реальных операционных данных, эти модели обещают оптимизировать движения роботов, сократить заторы и повысить общую эффективность до 10%.
Рост базовых моделей в робототехнике
Базовые модели, популяризированные в языковом и визуальном ИИ, полагаются на огромные наборы данных для изучения общих паттернов, которые можно адаптировать к различным задачам. Amazon применяет этот подход к робототехнике, где координация тысяч роботов в динамичных складских условиях требует предсказательной интеллекции, выходящей за рамки традиционных симуляций.
В центрах выполнения роботы переносят полки с инвентарем к человеческим работникам, а в сортировочных помещениях они обрабатывают пакеты для доставки. С флотами, насчитывающими сотни тысяч единиц, проблемы, такие как пробки и заторы, могут замедлить операции. DeepFleet решает эти задачи, прогнозируя траектории и взаимодействия роботов, что позволяет заранее планировать действия.
Изучение архитектур DeepFleet
DeepFleet состоит из четырех различных архитектур/моделей, каждая из которых имеет уникальные индуктивные предвзятости для моделирования динамики много роботов:
- Модель, ориентированная на робота (RC): Эта авторегрессивная трансформерная модель сосредоточена на отдельных роботах, используя данные о соседних объектах для прогнозирования следующих действий. Она обрабатывает асинхронные обновления и сочетает их с детерминированным симулятором окружающей среды для эволюции состояния. С 97 миллионами параметров она показала лучшие результаты в оценках, достигнув наименьших ошибок в прогнозах положения и состояния.
- Модель, ориентированная на пол (RF): Используя кросс-внимание, эта модель интегрирует состояния роботов с глобальными характеристиками пола, такими как вершины и грани. Она декодирует действия синхронно, балансируя локальные взаимодействия и контекст всего склада. С 840 миллионами параметров она продемонстрировала высокие результаты в прогнозах времени.
- Модель, основанная на изображении (IF): Рассматривая склад как многоканальное изображение, эта модель использует сверточное кодирование для пространственных характеристик и трансформеры для временных последовательностей. Однако она показала худшие результаты, вероятно, из-за трудностей в захвате взаимодействий роботов на уровне пикселей в больших масштабах.
- Графовая модель (GF): Объединяя графовые нейронные сети с трансформерами, эта модель представляет пол как пространственно-временной граф. Она эффективно обрабатывает глобальные отношения, прогнозируя действия и состояния всего с 13 миллионами параметров, что делает её вычислительно легкой, но конкурентоспособной.
Показатели производительности и потенциал масштабирования
Оценки на отложенных данных склада использовали метрики, такие как динамическое временное выравнивание (DTW) для точности траектории и ошибка задержки затора (CDE) для операционной реалистичности. Модель RC лидировала во всех показателях, с DTW 8.68 для положения и 0.11% CDE, в то время как GF показала сильные результаты при меньшей сложности.
Эксперименты по масштабированию подтвердили, что большие модели и наборы данных уменьшают потери предсказания, следуя паттернам, наблюдаемым в других базовых моделях. Для GF экстраполяции предполагают, что версия с 1 миллиардом параметров, обученная на 6.6 миллионах эпизодов, могла бы эффективно оптимизировать вычисления.
Это масштабируемость является ключевой, поскольку огромный флот роботов Amazon предоставляет непревзойденное преимущество в данных. Первые приложения включают прогнозирование заторов и адаптивную маршрутизацию, с потенциалом для назначения задач и предотвращения заторов.
Влияние на реальные операции
DeepFleet уже улучшает сеть Amazon, которая охватывает более 300 объектов по всему миру, включая недавнее развертывание в Японии. Улучшая эффективность передвижения роботов, она позволяет ускорить обработку пакетов и снизить затраты, что непосредственно выгодно клиентам.
Помимо повышения эффективности, Amazon акцентирует внимание на развитии рабочей силы, повысив квалификацию более 700,000 сотрудников с 2019 года в области робототехники и ИИ. Эта интеграция создает более безопасные рабочие места, разгружая людей от тяжелых задач.
Взгляд в будущее
По мере того как Amazon продолжает совершенствовать DeepFleet, сосредоточиваясь на вариантах RC, RF и GF, технология может переопределить системы много роботов в логистике. Используя ИИ для предсказания поведения флота, она движется за пределы реактивного управления, прокладывая путь к более автономным и масштабируемым операциям. Эта инновация подчеркивает, как базовые модели расширяются из цифровых сфер в физическую автоматизацию, потенциально трансформируя отрасли, зависящие от координированной робототехники.
Не забудьте ознакомиться с научной статьей и техническим блогом. Также вы можете посетить нашу страницу на GitHub для учебных материалов, кодов и блокнотов. Подписывайтесь на нас в Twitter и не забудьте присоединиться к нашему сообществу из более чем 100,000 участников на ML SubReddit и подписаться на нашу рассылку.
Сотрудничайте с Marktechpost для продвижения.