- OpenAI выпустила новую базовую модель искусственного интеллекта GPT-5.4, которую компания назвала своей самой мощной и эффективной моделью для профессиональной работы.
- Новая модель на 33% реже делает ошибки в утверждениях и в целом содержит на 18% меньше ошибок по сравнению с GPT-5.2.
В четверг, 5 марта, OpenAI выпустила новую базовую модель GPT-5.4. Компания называет ее “нашей самой мощной и эффективной моделью для профессиональной работы”.
Об этом пишет TechCrunch.
Что известно о новой модели GPT-5.4
Помимо стандартной версии, GPT-5.4 также доступна в виде модели для логического мышления (GPT-5.4 Thinking) или оптимизированной для высокой производительности (GPT-5.4 Pro).
API-версия модели будет доступна с контекстными окнами размером до 1 миллиона токенов, что является самым большим контекстным окном, которое когда-либо предлагала OpenAI.
OpenAI также подчеркнула улучшенную эффективность использования токенов и заявила, что GPT-5.4 способна решать те же задачи со значительно меньшим количеством токенов по сравнению с предшественником.
Новая модель демонстрирует существенно улучшенные результаты бенчмарков, включая рекордные показатели в тестах компьютерного использования OSWorld-Verified и WebArena Verified.
Кроме того, новая модель получила рекордные 83% в тесте GDPval от OpenAI для задач, требующих интеллектуальной работы.
GPT-5.4 заняла первое место в бенчмарке APEX-Agents от Mercor, разработанном для оценки профессиональных навыков в сфере права и финансов, сообщил генеральный директор Mercor Брендан Фуди.
— (GPT-5.4. – Ред.) отлично справляется с созданием задач на долгую перспективу, таких как презентации, финансовые модели и юридические анализы. Модель демонстрирует высочайшую производительность, работая быстрее и с меньшими затратами, чем конкурентные передовые модели, — отметил Фуди.
Модель GPT-5.4 стала очередным шагом компании по ограничению ошибочных выводов и фактологических ошибок.
OpenAI сообщила, что новая модель на 33% реже делает ошибки в отдельных утверждениях по сравнению с GPT-5.2, а в целом ответы содержат на 18% меньше ошибок.