This is an info Alert.
⌘K
  • Home
  • News
  • Blog
  • Releases
  • LLM history
  • Compare LLMs
  • Library
  • About
Sign in
Google

17 июня 2025

Gemini 2.5 Flash thinking (GA 17 июня 2025)

Context: 1.0MInput: $0.3 / 1MOutput: $2.5 / 1M

What's new
  • Первая Flash-модель с thinking и управляемым «бюджетом на размышление» через API
  • Улучшена по всем осям (reasoning, мультимодальность, код, длинный контекст) при экономии 20–30% токенов
  • Контекст 1M токенов; позиционируется как самый эффективный воркхорс линейки
  • На GA прайсинг унифицирован: единый тариф $0.30/$2.50 (input поднят с $0.15, output снижен с $3.50)
  • Аудио на входе — отдельно ($1.00/1M); рядом вышел ещё более дешёвый 2.5 Flash-Lite
Verdict

Reasoning для масс: думающая модель по цене воркхорса, с ручкой «сколько думать» — лучший баланс цены и интеллекта в линейке 2.5.

Google

A blog and notes on development. The easiest way to reach me is via the social links below.

Documents
Terms of UsePrivacy Policy
Contacts
talalaev.misha@gmail.com

© All rights reserved.