Google представил предварительную версию гибридной модели Gemini 2.5 Flash
Она намного дешевле своих прямых конкруентов.
Google представил предварительную версию гибридной модели Gemini 2.5 Flash
Эта модель значительно дешевле своих аналогов, таких как Claude Sonnet 3.7 и Grok 3 Beta. Она доступна для использования через чат-бот и API в Google AI Studio и Vertex AI.
Gemini 2.5 Flash — это первая гибридная модель искусственного интеллекта, разработанная компанией Google. Разработчики могут настроить модель так, чтобы она генерировала текст без использования «рассуждений». Для этого можно установить лимит на количество токенов, которые модель может использовать. Максимальное количество токенов составляет 24 576.
Чем больше лимит, тем лучше будет ответ на сложный запрос, требующий длинной цепочки «мыслей». Например, для ответа на вопрос «Как сказать «спасибо» на испанском?» рассуждения не нужны, но для решения сложных задач они могут быть полезны. Однако Gemini 2.5 Flash способна самостоятельно определять, сколько нужно «размышлять» над запросом.
Стоимость использования модели составляет 1 миллион «входных» токенов за 0,15 доллара и 1 миллион «выходных» токенов за 0,60 доллара без использования «рассуждений». Для сравнения, стоимость использования Claude Sonnet 3.7 и Grok 3 Beta составляет 3 и 15 долларов соответственно, а стоимость использования OpenAI o4-mini — 1,1 и 4,4 доллара. DeepSeek R1 стоит 0,55 и 2,19 доллара соответственно. При этом в некоторых отраслевых тестах модель от Google показала лучшие результаты по сравнению с первыми тремя аналогами.