Qwen Releases Qwen3-Coder-480B-A35B-Instruct: Его Самая Мощная Открытая Кодовая Модель
Введение
Компания Qwen представила Qwen3-Coder-480B-A35B-Instruct — свою самую мощную открытую кодовую модель на сегодняшний день. Эта модель с уникальной архитектурой Mixture-of-Experts (MoE) и обширными возможностями агентного кодирования устанавливает новый стандарт для открытых кодовых моделей и переопределяет возможности автономной помощи разработчикам.
Архитектура и Характеристики Модели
Ключевые особенности
- Размер модели: 480 миллиардов параметров (Mixture-of-Experts), с 35 миллиардами активных параметров во времяInference.
- Архитектура: 160 экспертов, из которых активируется 8 за одно обращение, что обеспечивает как эффективность, так и масштабируемость.
- Слои: 62
- Головы внимания: 96 (Q), 8 (KV)
- Длина контекста: Изначально поддерживает 256,000 токенов; масштабируется до 1,000,000 токенов с использованием методов экстраполяции контекста.
- Поддерживаемые языки: 358 языков программирования и разметки, включая Python, JavaScript, Java, C++, Go, Rust и другие.
Дизайн Mixture-of-Experts
Подход MoE активирует только часть параметров модели для каждого конкретного обращения, обеспечивая выдающуюся производительность при значительно сниженном вычислительном воздействии и позволяя беспрецедентную масштабируемость.
Долгий контекст и масштабируемость
Qwen3-Coder-480B-A35B-Instruct выделяется своей нативной длиной контекста в 256К токенов, что позволяет непосредственно работать с крайне крупными файлами и репозиториями. Благодаря экстраполяции контекста (с использованием таких методов, как Yarn) модель может масштабироваться до 1 миллиона токенов, что делает её подходящей даже для самых больших кодовых баз и наборов документации.
Производительность по Бенчмаркам
Агентное Кодирование
Qwen3-Coder оптимизирован для рабочей схемы агентного кодирования — модель не только генерирует код, но и автономно взаимодействует с инструментами и средами разработчиков.
Бенчмарки
- SWE-bench-Verified: Достигает выдающихся результатов среди открытых моделей на этом сложном наборе задач кодирования из реальной жизни, превосходя или соответствуя закрытым моделям по производительности.
- Дополнительные агентные задачи: Отлично справляется с агентным кодированием, использованием браузера и инструментами, сравнимыми с моделями высшего класса, такими как Claude Sonnet-4.
- Ширина: Демонстрирует высокую квалификацию в конкурентном программировании, автоматическом тестировании, рефакторинге кода и отладке.
Основная Модель для Экосистем Разработчиков
Qwen3-Coder-480B-A35B-Instruct создана как основная модель — предназначена для универсальной поддержки понимания и генерации кода, а также агентных рабочих процессов в цифровом мире:
- Сохраняет сильные стороны в математике и логике, унаследованные от базовой модели Qwen3.
- Легко адаптируется к различным рабочим процессам разработчиков, CI/CD пайплайнам и системам обзора кода.
Qwen Code: Открытый Агентный Инструмент Командной Строки
Обзор
Вместе с моделью Qwen открывает Qwen Code, инструмент командной строки для агентного кодирования, разработанный для полного использования возможностей новой модели.
Ключевые особенности
- Происхождение: Форкнут из Gemini Code (gemini-cli), обеспечивая соблюдение норм и доступность с открытым исходным кодом.
- Пользовательские подсказки и протоколы: Улучшены с помощью пользовательских подсказок и продвинутых протоколов вызова функций, адаптированных для Qwen3-Coder, открывая агентные сценарии использования.
- Интеграция для разработчиков: Разработан для бесшовной работы с лучшими инструментами сообщества, редакторами и системами CI. Поддерживает динамические взаимодействия с кодом и задачи на уровне репозиториев.
Использование и Расширяемость
Qwen3-Coder-480B-A35B-Instruct доступен по открытой лицензии и интегрируется с более широкой экосистемой открытого ИИ и разработки. Его можно запускать с помощью стандартных пайплайнов трансформеров или через специальный интерфейс командной строки Qwen Code, совместим с современными стекерами разработчиков.
Заключение
Qwen3-Coder-480B-A35B-Instruct представляет собой важный этап в области открытой кодовой интеллигенции. Сочетание масштабируемости, передовых возможностей агентного кодирования и инструментов, ориентированных на разработчиков, предоставляет надежную основную модель для будущего автономной разработки программного обеспечения. Обязательство Qwen к открытости — как показано в релизе модели, так и в Qwen Code — сигнализирует о новой эре для программирования с помощью ИИ в глобальном сообществе разработчиков.
Часто задаваемые вопросы
Каковы основные преимущества Qwen3-Coder-480B-A35B-Instruct по сравнению с другими открытыми кодовыми моделями?
Qwen3-Coder-480B-A35B-Instruct выделяется своей масштабируемостью — архитектурой Mixture-of-Experts с 480B параметрами и 35B активными параметрами — и способностью работать с контекстами в 256,000 токенов (масштабируемыми до 1 миллиона токенов). Это позволяет ей работать с целыми большими кодовыми базами. Благодаря агентному дизайну модель не только генерирует код, но и активно взаимодействует с инструментами и средами разработки для автономного решения сложных программных задач.
Как использовать Qwen3-Coder для своих проектов и что такое Qwen Code?
Qwen3-Coder-480B-A35B-Instruct можно получить через стандартные пайплайны Transformers или с помощью командного интерфейса Qwen Code, который является открытым исходным кодом и доступен на GitHub. Qwen Code, форкнутый из Gemini Code, представляет собой специализированный инструмент агентного кодирования, который использует продвинутые пользовательские подсказки и протоколы вызова функций. Он легко интегрируется с популярными стекерами разработки и позволяет использовать возможности Qwen3-Coder для задач, таких как генерация кода, рефакторинг и отладка непосредственно из вашего терминала.
Какие языки программирования и задачи поддерживает Qwen3-Coder?
Qwen3-Coder нативно поддерживает 358 языков программирования и разметки, включая Python, JavaScript, Java, C++, Go, Rust, HTML, SQL и многие другие. Модель демонстрирует высокую квалификацию в широком спектре задач программирования — от конкурентного программирования до автоматического тестирования, рефакторинга и многопользовательских агентных рабочих процессов.
Дополнительные Ресурсы
Ознакомьтесь с моделью на Hugging Face и страницей Qwen Code на GitHub. Все заслуги за это исследование принадлежат исследователям этого проекта.
Присоединяйтесь к самым быстрорастущим AI Dev новостям, читаемым разработчиками и исследователями из NVIDIA, OpenAI, DeepMind, Meta, Microsoft, JP Morgan Chase, Amgen, Aflac, Wells Fargo и многих других.