Новости

Учёные обучили ИИ математическим рассуждениям через «Змейку»

2025-06-24 15:08
Представьте себе, что для обучения нейросети математике вы не используете традиционные учебники, а вместо этого предлагаете ей играть в классические аркадные игры, как Snake или Тетрис. На первый взгляд, это может показаться странным, но именно такой подход использовали исследователи из Rice University, Johns Hopkins University и Nvidia. Этот метод, названный Visual Game Learning (ViGaL), стал революцией в обучении ИИ.

Игры вместо датасетов

Обычно ИИ обучают на специализированных данных. Однако команда ученых решила попробовать новый путь, вдохновленный когнитивной наукой, утверждая, что игры развивают универсальные навыки решения проблем. В основу обучения легла мультимодальная модель Qwen2.5-VL-7B, для которой создали две уникальные игровые вселенные:

  1. Snake — две змейки на сетке 10×10 соревнуются за яблоки. Задача модели — улучшить планирование пути и избегать препятствий.
  2. Тетрис-вращалка — модель видит 3D-объекты под разными углами и должна распознать их после поворота на 90° или 180°.

Для каждой игры подготовили 36,000 тренировочных примеров с регулируемой сложностью. В результате игра "Змейка" улучшила понимание 2D-координат, а "Вращение" развило способности к оценке углов и длин.

Неожиданные результаты

Обучение на играх не только дало результаты, но и превзошло традиционные подходы. Модель ViGaL на базе Qwen показала точность 50,6% в математических тестах, что немного обогнало MM‑Eureka‑Qwen-7B (50,1%), которая обучалась на специализированных математических данных. Особенно впечатляющие результаты модель показала в геометрии, где её производительность почти удвоилась.

ViGaL также превзошла GPT-4 в математических задачах, показав 64,7% точности против 55,9% у GPT-4. В целом, ViGaL продемонстрировала высокие результаты, приближаясь к лидерам, таким как Gemini 2.0 Flash (55,4%).

Многофункциональность ViGaL

После обучения на аркадных играх ViGaL протестировали на других задачах, например, в области анализа 3D-сцен и экспертных вопросов в таких областях, как искусство, бизнес и медицина. И модель снова показала отличные результаты, что подтвердило её универсальность.

Что делает ViGaL таким эффективным?

Ключ к успеху — это несколько факторов:

  1. Пошаговые рассуждения — подсказки вроде «Найди ближайшее яблоко» или «Определи оси симметрии» добавили точности.
  2. Контрастное обучение — обучение как на лучших, так и на худших хода, что улучшило результат.
  3. Динамическая сложность — изменение сложности, например, длины змейки, стабилизировало процесс обучения.
  4. Обучение с подкреплением (RL) — это дало наибольший прирост в производительности (+12,3%).

Будущее: играем для обучения

Результаты ViGaL открывают новые горизонты. Игры могут стать эффективной альтернативой традиционным, затратным датасетам для обучения универсальных навыков рассуждения. Исследователи считают, что в будущем стоит изучить широкий спектр игр, чтобы создать ещё более мощные и универсальные ИИ-модели.