Сразу несколько источников утверждают, что OpenAI готовит к выпуску новую версию модели под внутренним кодовым именем Garlic. Согласно инсайдерской информации, GPT-5.2 была скорее переходным этапом — упрощённой версией того, чем в полной мере станет GPT-5.3.
Ключевая характеристика — до 2 000 токенов в секунду. Такой прирост скорости ожидается благодаря сотрудничеству OpenAI с Cerebras и использованию их инфраструктуры для арендного кодинга.
Для понимания масштаба: Claude Code на базе Opus 4.5 обрабатывает порядка 100 токенов в секунду. Разрыв — почти десятикратный.
Cerebras специализируется на аппаратных решениях для ультрабыстрого инференса. Их подход строится вокруг одного огромного чипа, где вычисления, память и пропускная способность объединены в единую систему, без типичных для GPU узких мест.
На практике это означает, что ИИ-агенты смогут писать, проверять и рефакторить код практически без задержек — почти в реальном времени. Любопытно, что ещё год назад главный исследователь OpenAI Марк Чен упоминал о неожиданных результатах, полученных в ходе предобучения моделей. Похоже, именно эти находки и легли в основу архитектуры GPT-5.3.
Если ориентироваться на предыдущие релизы, сначала модель могут незаметно обкатать на платформе DesignArena — по аналогии с GPT-5.2, которая ранее появлялась там под кодовыми названиями Honeycomb и Candycane. И лишь затем последует официальный анонс.
По словам источников, релиз может состояться буквально в ближайшие дни. Ранее подобные утечки такого уровня обычно появлялись непосредственно перед выходом модели.
Если карты лягут, GPT-5.3 станет не просто очередным апдейтом, а переходом на новый уровень по скорости и практической полезности. 2 000 токенов в секунду — это вам не хухры-мухры с медленной соображалкой, а почти живое общение в реальном времени. Редакция ставит 10 тысяч белорусских рублей на то, что это будет прорыв.