top of page

Gemini 3 de Google (18 de noviembre de 2025)

  • hace 4 días
  • 8 Min. de lectura
ree

Antecedentes

Google, a través de su unidad DeepMind, ha encabezado la carrera de la inteligencia artificial multimodal con la serie Gemini. Después del lanzamiento de Gemini 2.5 a principios de 2025, la compañía presentó Gemini 3 el 18 de noviembre de 2025 como su modelo más avanzado y completo. Esta versión se anunció tan solo una semana después de la salida de GPT‑5.1 de OpenAI y pocas semanas después del lanzamiento de Claude Sonnet 4.5, lo que evidencia la acelerada competencia por liderar el mercado de modelos fundacionales. Gemini 3 se ofrece en dos variantes principales: Gemini 3 Pro, disponible de inmediato para usuarios gratuitos y suscriptores en la aplicación Gemini y en el modo de IA de Google Search, y Gemini 3 Deep Think, una variante de mayor razonamiento que se liberará a suscriptores Google AI Ultra tras evaluaciones de seguridad adicionales.


La empresa señala que más de 650 millones de personas utilizan la aplicación Gemini y 13 millones de desarrolladores han integrado la familia Gemini en sus flujos de trabajo. Según Tulsee Doshi, jefa de producto de Gemini, el nuevo modelo supone “un salto masivo en capacidad de razonamiento”, con respuestas más profundas y matizadas que sus predecesores. Google acompañó el lanzamiento con Google Antigravity, una plataforma de desarrollo multi‑panel que integra un editor, terminal y navegador para permitir agentes de código capaces de ejecutar tareas complejas.


Ficha técnica

Atributo

Detalle

Versión / Modelo

Gemini 3 Pro (disponible) y Gemini 3 Deep Think (próximo)

Empresa / Compañía

Google DeepMind

Tipo de IA

Modelo fundacional multimodal (lenguaje, imágenes, video, audio y código) con razonamiento de alta profundidad

Fecha de lanzamiento

18 de noviembre de 2025

Ventana de contexto

Hasta 1 millón de tokens para contextos extensos y tareas de aprendizaje

Principales características

Razonamiento de nivel PhD, multimodalidad extendida, evaluaciones récord (1501 Elo en LMArena, 37.5 % en Humanity’s Last Exam y 91.9 % en GPQA Diamond); modo Deep Think con 41 % en Humanity’s Last Exam y 45.1 % en ARC‑AGI‑2; aprendizaje, planificación y construcción de agentes con 1 M tokens; integración con Google Antigravity para codificación agente y control del navegador.

Entrenamiento y fuentes

Google no ha publicado el resumen completo de los datos de entrenamiento; se presume una mezcla de datos públicos, con licencia y contenidos generados por usuarios. El AI Act de la Unión Europea obliga a los proveedores de modelos de propósito general a proporcionar documentación técnica y un resumen de los datos empleados; actualmente no se conoce ese resumen para Gemini 3.

Acceso y licencias

Disponible a través de la aplicación Gemini (gratis, Pro y Ultra), el modo de IA de Google Search, AI Studio, Vertex AI, la interfaz de línea de comandos (CLI) y la nueva plataforma Antigravity.

Herramientas destacadas

Modo Deep Think, API para desarrolladores, integración con Google Antigravity, Gemini Agent (planificación de tareas), Gemini Canvas y AI Studio; ofrece generación de código con visualizaciones de datos y síntesis de contenido multimedia.


Descripción de la aplicación

Gemini 3 es un modelo generativo multimodal capaz de comprender y producir texto, imágenes, audio, video y código. Su diseño enfatiza el razonamiento profundo y la fiabilidad, superando a su predecesor Gemini 2.5 en todos los principales benchmarks; por ejemplo, alcanza el puntaje más alto registrado en el LMArena (1501 Elo) y un 37.5 % en Humanity’s Last Exam sin uso de herramientas En términos multimodales, obtiene 81 % en MMMU‑Pro y 87.6 % en Video‑MMMU, lo que refleja su capacidad para analizar y relacionar información visual y auditiva.

El modelo incluye un modo Deep Think, destinado a tareas que exigen mayor reflexión y planificación. Esta variante eleva la puntuación a 41 % en Humanity’s Last Exam y logra 45.1 % en ARC‑AGI‑2, mostrando habilidad para resolver problemas novelísticos. Con una ventana de contexto de 1 millón de tokens, Gemini 3 puede sintetizar libros completos, colecciones de artículos o videos largos y producir resúmenes, visualizaciones interactivas o planes de estudio.

El lanzamiento integra Google Antigravity, una plataforma de desarrollo que combina un editor, un terminal y un navegador para que agentes basados en Gemini planifiquen y ejecuten tareas de codificación end‑to‑end. Según el CTO de DeepMind, estos agentes pueden operar simultáneamente en el editor, la terminal y el navegador, validando su propio código. Además, el Gemini Agent permite planificar y ejecutar flujos de trabajo complejos, como reservar servicios locales o organizar un buzón de correo, gestionando decisiones a largo plazo.


Ventajas y desventajas

Ventajas

  1. Rendimiento de vanguardia: Gemini 3 lidera múltiples benchmarks (LMArena, Humanity’s Last Exam, GPQA Diamond, MathArena Apex) y, en modo Deep Think, incluso supera sus propios récords Las respuestas son concisas y directas, evitando halagos y ofreciendo profundidad intelectual.

  2. Multimodalidad extensiva: Capaz de procesar y generar texto, imágenes, audio, video y código con un contexto de 1 M tokens, facilita tareas como traducir recetas manuscritas, resumir artículos científicos o analizar partidos deportivos para ofrecer planes de mejora.

  3. Planificación y agentes: Introduce un marco agentic con Gemini Agent y Antigravity, que permite a los usuarios delegar tareas de codificación, gestión y planificación compleja a agentes que utilizan herramientas (editor, terminal, navegador). Para empresas, Gemini 3 puede utilizarse en Vertex AI y AI Studio para automatizar procesos y mejorar la productividad.

  4. Disponibilidad amplia: Accesible a través de la app Gemini, el modo de IA en Google Search y plataformas de desarrollo; el plan básico es gratuito, fomentando un acceso masivo.

  5. Seguridad reforzada: Google afirma que el modelo muestra menor servilismo (“sycophancy”) y mayor resistencia a inyecciones de prompt, tras evaluaciones internas y con organismos como el UK AISI.


Desventajas

  1. Vulnerabilidades recientes: Investigadores de Tenable descubrieron tres fallas (ya remediadas) que permitían ataques de search‑injection, inyección de logs en Cloud Assist y exfiltración de datos en la herramienta de navegación de Gemini. Estas vulnerabilidades ponían en riesgo la privacidad y demuestran que incluso los modelos más avanzados pueden ser vectores de ataque. La existencia de estas fallas resalta la necesidad de controles estrictos y mecanismos de recuperación.

  2. Opacidad en los datos de entrenamiento: De acuerdo con el AI Act de la UE, los proveedores de modelos de propósito general deben publicar un resumen del contenido empleado para entrenar la IA. Hasta la fecha, Google no ha divulgado detalladamente los conjuntos de datos utilizados en Gemini 3, lo que dificulta evaluar sesgos potenciales y reproducir auditorías.

  3. Uso intensivo de recursos: Aunque Google destaca una mejor eficiencia, la ejecución de modelos de gran tamaño con contextos de 1 M tokens implica altos costos computacionales y energéticos; aún no se publican estimaciones de consumo ni huella de carbono. Esta opacidad impide valorar el impacto ambiental y la sostenibilidad del modelo.

  4. Acceso parcial a funciones avanzadas: El modo Deep Think y las capacidades agentes más potentes están restringidos a suscriptores AI Ultra y usuarios corporativos en Vertex AI. La segmentación por niveles puede profundizar la brecha entre usuarios sin recursos y empresas que pueden pagar suscripciones.

  5. Complejidad de uso: La interacción con herramientas como Antigravity requiere competencias técnicas para comprender el entorno multi‑panel y el control de agentes. Usuarios sin formación pueden sentirse abrumados o delegar en exceso decisiones sin supervisión.


Diferencias con otras inteligencias artificiales

GPT‑5.1 (OpenAI): A diferencia de Gemini 3, GPT‑5.1 incorpora un enrutador que ajusta el tiempo de razonamiento según la complejidad y presenta dos variantes (Instant y Thinking). Sus mejoras incluyen nuevos presets de personalidad y herramientas como apply_patch y un shell para editar códigos. GPT‑5.1, sin embargo, ofrece una ventana de contexto menor y depende de arquitecturas separadas (GPT‑5 Pro y GPT‑5.1 Thinking) con un modelo de suscripción diferente. Además, la transparencia sobre la energía consumida y los datos de entrenamiento sigue siendo limitada.

Claude Sonnet 4.5 (Anthropic): Esta IA se promociona como el mejor modelo de codificación y destaca por soportar sesiones de programación continuas de hasta 30 horas. Logró 61.4 % en la prueba OSWorld, un salto considerable respecto al 42.2 % de su versión anterior, e introdujo funciones como checkpoints, extensiones nativas para VS Code, ejecución de código y creación de archivos dentro de la conversación. Claude 4.5 mantiene el mismo precio que Sonnet 4 y mejora el conocimiento en finanzas, derecho, medicina y STEM. Sin embargo, posee un contexto menor que Gemini 3 y no se integra tan profundamente con plataformas de búsqueda y productividad.

DeepSeek V3.1 Terminus (DeepSeek): Este modelo chino de código semi‑abierto busca replicar la capacidad de GPT‑4 con un enfoque en la investigación científica y la educación. Si bien ofrece un desempeño notable en traducción y problemas matemáticos, su contexto y multimodalidad no alcanzan el nivel de Gemini 3. Su ventaja radica en la apertura parcial del código y la menor huella de datos, lo que favorece la investigación académica.


Potencial para profesionales, académicos y usuarios en general

Aplicaciones interdisciplinares: Gracias a su capacidad de razonamiento profundo y multimodal, Gemini 3 permite a profesionales de cualquier área transformar grandes volúmenes de información en conocimiento práctico. Investigadores pueden analizar bases de datos heterogéneas (textos, imágenes, video) y generar resúmenes, visualizaciones o hipótesis; ingenieros pueden diseñar software a través de Antigravity con agentes que codifican, prueban y validan en un solo entorno; médicos pueden traducir literaturas clínicas multilingües y visualizar tendencias en los datos; artistas pueden fusionar texto, audio y video para crear obras multimedia; y docentes pueden elaborar materiales didácticos interactivos a partir de artículos y conferencias.


Comunicación y humanidades: Para profesionales de la comunicación, la IA ofrece herramientas para diseñar narrativas transmedia y analizar patrones de discurso. Su contexto de 1 M tokens facilita el estudio de discursos completos, campañas mediáticas o interacciones en redes, ayudando a identificar tendencias y construir mensajes con fundamento ético. Además, permite generar imágenes y videos coherentes con el texto, lo que potencia la producción de contenidos interactivos y la alfabetización mediática. Investigadores en comunicación pueden utilizar Gemini 3 para explorar la relación entre lenguaje e imagen, evaluar la recepción de mensajes y experimentar con nuevos formatos de storytelling.

Administrativos y usuarios cotidianos: La planificación a largo plazo de Gemini Agent puede agilizar tareas administrativas —como organizar correos, coordinar calendarios o gestionar proyectos—, liberando tiempo para actividades de valor. Usuarios cotidianos pueden obtener explicaciones precisas sobre temas complejos, traducir recetas familiares manuscritas o recibir asesoría para mejorar su rendimiento deportivo, demostrando un alcance que trasciende el ámbito profesional.


Índice de valoración del Observatorio

El Observatorio de Inteligencia Artificial asigna puntuaciones de 0 a 10 en cuatro dimensiones y calcula un promedio general ponderado:

Categoría

Evaluación (0–10)

Justificación

Usabilidad y funcionalidades

9

Interfaz integrada en la aplicación Gemini, modo de IA en Google Search y plataformas de desarrollo; contextos de 1 M tokens y modos Deep Think; integración con Antigravity que automatiza tareas y mejora la productividad. Se resta un punto por la curva de aprendizaje del entorno multi‑panel.

Normatividad y transparencia

6

El AI Act exige que los proveedores de modelos generalistas publiquen un resumen de datos de entrenamiento y realicen evaluaciones de riesgos. Google aún no divulga los datos de entrenamiento ni el impacto energético de Gemini 3, aunque ha mejorado la seguridad y coopera con reguladores. La puntuación refleja avances en seguridad pero opacidad en transparencia.

Ética y consideraciones legales

7

La reducción de servilismo y la resistencia a inyecciones son pasos positivos Sin embargo, las vulnerabilidades descubiertas por Tenable evidencian riesgos de exfiltración de datos y la posibilidad de que agentes autónomos cometan errores, por lo que se requiere supervisión humana y protocolos de seguridad rigurosos.

Valoración de usuarios y expertos

8

La comunidad de desarrolladores y usuarios celebra el salto en rendimiento y la multimodalidad, y más de 650 M de personas utilizan la aplicación. Sin embargo, algunos expertos señalan la complejidad del entorno y la falta de transparencia como áreas de preocupación; la valoración se mantiene alta por el potencial transformador.




Calificación global del Observatorio

7.5/10

Promedio ponderado que valora la excelencia técnica y la utilidad, pero reconoce la necesidad de mayor transparencia y mitigación de riesgos.


Conclusión

Gemini 3 representa un hito en la evolución de la inteligencia artificial, al combinar razonamiento de alto nivel, multimodalidad extrema y herramientas agentivas capaces de planificar y ejecutar tareas complejas. Su aporte para investigadores, profesionales de la comunicación y usuarios cotidianos es innegable; posibilita el procesamiento de información masiva y la creación de contenidos interactivos y rigurosos. No obstante, como señala el AI Act, la adopción responsable exige transparencia sobre los datos de entrenamiento y evaluación de riesgos. Las vulnerabilidades descubiertas por Tenable muestran que incluso los modelos punteros pueden ser vectores de ataque, por lo que la supervisión humana y la ciberseguridad deben acompañar su implementación. Desde el Observatorio, invitamos a utilizar Gemini 3 de manera crítica y ética, situando a la persona en el centro y promoviendo una ciudadanía digital corresponsable.


Liga para conocer y probar la aplicación

Puede acceder a la versión gratuita o suscrita de Gemini 3 en la aplicación oficial de Google: https://gemini.google.com. Para probar el entorno de desarrollo y el nuevo Google Antigravity, visite https://antigravity.google. Ambos enlaces son sitios oficiales de Google sin contenido malicioso.

bottom of page