En una entrada de blog, Google afirmó que Gemini 3 Flash combina el razonamiento de nivel profesional introducido con Gemini 3 Pro, pero optimizado para ofrecer respuestas más rápidas y una mayor eficiencia.
Esta combinación, que la compañía presenta tanto para el uso diario como para flujos de trabajo 'agenticos' más avanzados que requieren iteraciones rápidas, se basa en gran medida en los resultados de las pruebas de rendimiento para definir la actualización.
La compañía afirmó que Gemini 3 Flash obtuvo una puntuación del 90.4 por ciento en GPQA Diamond, del 33.7 por ciento en Humanity's Last Exam (sin herramientas) y del 81.2 por ciento en MMMU Pro, utilizando en promedio menos tokens a que Gemini 2.5 Pro con un tráfico típico.
Google afirmó que esta eficiencia permite que el modelo escale sin sacrificar la calidad del razonamiento.
Para los desarrolladores, Gemini 3 Flash está disponible en versión preliminar a través de la API de Gemini en Google AI Studio, Gemini CLI y las herramientas de Google centradas en agentes, además de estar disponible para empresas a través de Vertex AI y Gemini Enterprise.
Google afirmó que el modelo es especialmente adecuado para agentes de codificación, análisis multimodal y aplicaciones en tiempo real que exigen velocidad y precisión.
El precio es otro aspecto clave de la propuesta, ya que Google ofrece Gemini 3 Flash a 0.50 dólares por millón de tokens de entrada y 3 dólares por millón de tokens de salida, lo que la posiciona como una opción más económica para el rendimiento de Gemini 3 en aplicaciones de alto volumen.
Para los consumidores, Google dijo que Gemini 3 Flash se está convirtiendo en el modelo predeterminado en la aplicación Gemini, reemplazando a 2.5 Flash, y también se está integrando en el modo AI en la búsqueda, una señal de que Gemini 3 está pasando del 'último modelo' a la infraestructura básica en los productos de Google.