OpenAI выпустила обновлённую версию GPT-5.4

OpenAI утверждает, что GPT-5.4 является самой достоверной моделью компании и первой универсальной моделью с нативными возможностями работы с компьютером.

OpenAI выпустила обновлённую версию GPT-5.4

Компания OpenAI представила новую модель GPT-5.4, которая будет доступна для ChatGPT, API и Codex. Также компания выпустила расширенную версию модели — GPT-5.4 Pro.

Для подписчиков уровней Plus, Team и Pro в ChatGPT доступна функция GPT-5.4 Thinking. Через API стоимость использования модели составляет $2,5 за 1 млн входных токенов и $15 за 1 млн выходных. Для подписчиков Pro и Enterprise, а также через API, GPT-5.4 Pro обойдётся в $30 и $180 соответственно.

В ChatGPT модель демонстрирует предварительный план своих размышлений, что позволяет пользователю корректировать запрос по мере формирования ответа. Функция «глубокого интернет-поиска» в GPT-5.4 Thinking была значительно улучшена, особенно для специфических запросов, при этом сохраняется контекст.

GPT-5.4 предоставляет более последовательные и точные ответы в реальных задачах. В бенчмарке GDPval, оценивающем знания в 44 профессиях, модель показывает результаты, сопоставимые с результатами специалистов, или превосходит их в 83% случаев, в то время как GPT-5.2 достигает этого показателя только в 70,9%.

Компания также улучшила возможности модели в создании и редактировании таблиц, презентаций и документов. OpenAI утверждает, что GPT-5.4 является самой достоверной моделью компании и первой универсальной моделью с нативными возможностями работы с компьютером. Она эффективно интерпретирует скриншоты и выполняет различные задачи по командам пользователя.

В бенчмарке OSWorld-Verified GPT-5.4 достигла 75%, в то время как у GPT-5.2 этот показатель составляет 47,3%. В WebArena-Verified, оценивающем использование браузера, GPT-5.4 показала результат 67,3%, в то время как GPT-5.2 — 65,4%.

Источник: OpenAI

В Telegram появилась возможность смотреть YouTube‑видео прямо в мессенджере 

Google выпустил Google Ads API версии 23.1 с новыми полями и метриками 

Аналитики AHD и Yandex B2B Tech представили исследование российского рынка программного обеспечения