Anthropic представила Claude Opus 4.8
Компания Anthropic выпустила обновлённую флагманскую модель Claude Opus 4.8. Это произошло всего через шесть недель после выпуска предыдущей версии — Claude Opus 4.7. Стоимость использования осталась неизменной. Основное внимание в релизе уделено не столько «интеллекту» модели, сколько её надёжности.
Anthropic заявляет, что новая версия в четыре раза реже предыдущей пропускает ошибки в коде, который она выдаёт за готовый результат. Компания называет это «честностью» модели. Opus 4.8 чаще признаётся в своей неуверенности, когда речь идёт о достоверности информации, и реже выдаёт неподтверждённые утверждения.
Также модель получила более высокие оценки по внутренним метрикам безопасности и «просоциальности». Это означает, что она лучше поддерживает самостоятельность пользователя и работает в его интересах. Все эти показатели Anthropic представила на основе собственных тестов.
Кроме того, в новой версии чат-бота появилась настройка, позволяющая пользователю выбирать, сколько усилий Claude будет вкладывать в выполнение задачи.
Источник: Anthropic
Читайте также по теме:
Дзен может стать Национальной новостной платформой