Компания Alibaba официально представила свою наиболее производительную языковую модель — Qwen-3-Max. Ранее она была доступна в статусе предварительного просмотра, а теперь опубликована в финальной версии. Ознакомиться с её возможностями можно бесплатно через официальный сайт.
Обновлённая модель демонстрирует улучшенные результаты в популярных бенчмарках и сравнима по производительности с Claude Opus 4, DeepSeek V3.1 и Qwen3-235b-a22b. В рейтинге LMArena Qwen-3-Max занимает третью позицию, опережая такие модели, как GPT-5-Chat и Claude Opus 4 Thinking.
Высокие показатели обеспечены архитектурой Mixture of Experts и масштабом — модель содержит свыше триллиона параметров. Такой подход позволяет задействовать только необходимые модули в зависимости от задачи, оптимизируя вычислительные ресурсы.
Помимо этого, Alibaba завершает обучение версии Qwen-3-Max Thinking — модели, ориентированной на рассуждение. По внутренним тестам, она уже сопоставима с GPT-5-Pro и Grok 4 Heavy в бенчмарках AIME 2025, GPQA и HMMT25. Информация о дате её выпуска будет представлена отдельно.
Обновлённая модель демонстрирует улучшенные результаты в популярных бенчмарках и сравнима по производительности с Claude Opus 4, DeepSeek V3.1 и Qwen3-235b-a22b. В рейтинге LMArena Qwen-3-Max занимает третью позицию, опережая такие модели, как GPT-5-Chat и Claude Opus 4 Thinking.
Высокие показатели обеспечены архитектурой Mixture of Experts и масштабом — модель содержит свыше триллиона параметров. Такой подход позволяет задействовать только необходимые модули в зависимости от задачи, оптимизируя вычислительные ресурсы.
Помимо этого, Alibaba завершает обучение версии Qwen-3-Max Thinking — модели, ориентированной на рассуждение. По внутренним тестам, она уже сопоставима с GPT-5-Pro и Grok 4 Heavy в бенчмарках AIME 2025, GPQA и HMMT25. Информация о дате её выпуска будет представлена отдельно.