У четвер, 5 березня, OpenAI випустила нову базову модель GPT-5.4. Компанія називає її “нашою найпотужнішою та найефективнішою моделлю для професійної роботи”.
Про це пише TechCrunch.
Що відомо про нову модель GPT-5.4
Окрім стандартної версії, GPT-5.4 також доступна у вигляді моделі для логічного мислення (GPT-5.4 Thinking) або оптимізованої для високої продуктивності (GPT-5.4 Pro).
API-версія моделі буде доступна з контекстними вікнами розміром до 1 мільйона токенів, що є найбільшим контекстним вікном, яке коли-небудь пропонувала OpenAI.
OpenAI також наголосила на покращеній ефективності використання токенів та заявила, що GPT-5.4 здатна вирішувати ті ж самі завдання із значно меншою кількістю токенів у порівнянні з попередником.
Нова модель демонструє суттєво покращені результати бенчмарків, включаючи рекордні показники у тестах комп’ютерного використання OSWorld-Verified та WebArena Verified.
Крім того, нова модель отримала рекордні 83% у тесті GDPval від OpenAI для завдань, що потребують інтелектуальної роботи.
GPT-5.4 зайняла перше місце у бенчмарку APEX-Agents від Mercor, розробленому для оцінки професійних навичок у сфері права та фінансів, повідомив генеральний директор Mercor Брендан Фуді.
– (GPT-5.4. – Ред.) чудово справляється зі створенням завдань на довгу перспективу, таких як презентації, фінансові моделі та юридичні аналізи. Модель демонструє найвищу продуктивність, працюючи швидше та з меншими витратами, ніж конкурентні передові моделі, – зазначив Фуді.
Модель GPT-5.4 стала черговим кроком компанії щодо обмеження хибних висновків та фактологічних помилок.
OpenAI повідомила, що нова модель на 33% рідше робить помилки в окремих твердженнях у порівнянні з GPT-5.2, а загалом відповіді містять на 18% менше помилок.

