IA y Sociedad

ChatGPT Images 1.5: edición y generación visual acelerada para todos

Antecedentes de la IA El 16 de diciembre de 2025, OpenAI anunció una actualización significativa de su herramienta de imágenes dentro de ChatGPT. Tras el éxito de GPT‑5.2 y la creciente competencia co

Retrato de Dr. Jorge Alberto Hidalgo Toledo

Dr. Jorge Alberto Hidalgo ToledoCICA

16 de diciembre de 20259 min de lectura

ChatGPT Images 1.5: edición y generación visual acelerada para todos

Antecedentes de la IA

El 16 de diciembre de 2025, OpenAI anunció una actualización significativa de su herramienta de imágenes dentro de ChatGPT. Tras el éxito de GPT‑5.2 y la creciente competencia con los modelos de Google (Gemini 3 y Nano Banana Pro), la empresa adelantó el lanzamiento de GPT‑Image 1.5, su nuevo modelo de generación y edición de imágenes. De acuerdo con la nota de OpenAI, el nuevo modelo es capaz de producir imágenes hasta cuatro veces más rápido que su antecesor y de realizar ediciones precisas respetando la composición, la iluminación y la apariencia de las personas. Esta actualización incluye también una experiencia renovada en ChatGPT que transforma la interfaz en un estudio creativo, con un espacio dedicado en la barra lateral para explorar estilos predefinidos y tendencias.

La decisión de lanzar GPT‑Image 1.5 en diciembre, en lugar de enero como se había planeado, responde a la “alarma roja” declarada por Sam Altman ante el dominio que los modelos de Google estaban obteniendo en los principales benchmarks de imágenes. Esta estrategia busca recuperar liderazgo en el mercado de generadores visuales y ofrecer a usuarios de todas las versiones de ChatGPT (gratuita y de pago) una herramienta competitiva y accesible, mientras se prepara la integración de personajes de Disney y otras alianzas para 2026

Ficha técnica

Descripción de la aplicación

ChatGPT Images 1.5 presenta un salto cualitativo respecto a su antecesor. El modelo genera imágenes a partir de descripciones textuales o de entradas visuales y aplica ediciones locales, garantizando que solo se modifiquen los aspectos indicados por el usuario. Según OpenAI, el modelo “adopta la intención” del usuario de forma más fidedigna, conservando la composición, la iluminación y los rasgos de las personas. Esto se traduce en ediciones de fotografías más útiles, pruebas de vestuario y filtros estilísticos que mantienen la esencia de la imagen original.

La herramienta permite agregar, eliminar, combinar, mezclar y transponer elementos sin necesidad de regenerar la imagen completa. Además, incorpora transformaciones creativas que alteran textos y disposiciones para crear pósteres, infografías o anuncios ficticios. El modelo también mejora el renderizado de texto, siendo capaz de manejar letras densas y pequeñas, lo que amplía su utilidad para diagramas, cómics y material educativo.

Una de las novedades más destacadas es la experiencia visual-first: ChatGPT ahora ofrece un espacio dedicado en la barra lateral que funciona como un estudio creativo, con estilos predefinidos, filtros y prompts de tendencia. Esta interfaz facilita la exploración sin necesidad de redactar prompts largos, permitiendo cargar imágenes de referencia y reutilizar retratos mediante un único registro facial.

Ventajas y desventajas

Ventajas

Velocidad y eficiencia: el nuevo modelo genera imágenes hasta cuatro veces más rápido que su versión anterior, reduciendo tiempos de iteración y permitiendo trabajar en paralelo mientras se generan otras imágenes.
Ediciones precisas: preserva detalles esenciales (iluminación, composición, rasgos faciales) y aplica cambios específicos sin reconstruir la imagen completa.
Mejor seguimiento de instrucciones: el modelo entiende solicitudes complejas y preserva relaciones entre elementos, mejorando la coherencia de composiciones.
Renderizado de texto mejorado: puede generar texto denso y legible dentro de las imágenes.
Interface amigable: la experiencia de estudio creativo en la barra lateral facilita la inspiración con estilos predefinidos y filtros.
Acceso generalizado: disponible para todos los usuarios de ChatGPT y vía API; democratiza la creación visual a gran escala.

Desventajas

Posible uso indebido: la facilidad para editar y generar imágenes realistas incrementa el riesgo de manipulación, desinformación y deepfakes. La tecnología puede ser utilizada para crear contenido engañoso o dañino si no se aplican filtros adecuados.
Falta de transparencia: OpenAI no ha publicado detalles sobre los conjuntos de datos de entrenamiento ni sobre los sesgos presentes en el modelo, lo que dificulta evaluar su equidad. De acuerdo con la Ley de IA de la UE, los proveedores de modelos generales deben publicar resúmenes de sus datos y realizar evaluaciones de riesgos sistémicos; esta información no está claramente disponible.
Derechos de autor y propiedad intelectual: generar imágenes con estilos específicos o contenidos protegidos plantea interrogantes sobre licencias y protección de obras. Aunque OpenAI ha firmado acuerdos (por ejemplo con Disney) para integrar personajes en 2026, las implicaciones legales de utilizar obras de terceros siguen siendo objeto de debate.
Consumo energético y huella ambiental: la generación de imágenes mediante modelos de IA consume recursos computacionales significativos; OpenAI no ha publicado cifras sobre el impacto ambiental de GPT‑Image 1.5.
Limitaciones creativas: a pesar de mejoras en precisión, el modelo puede producir resultados inconsistentes o incorrectos, especialmente en composiciones complejas o con instrucciones ambiguas.

Diferencias contra otras inteligencias artificiales

Nano Banana Pro (Google): El modelo de imágenes de Google (basado en Gemini 3 Pro) se centra en infografías y diagramas con texto multilingüe y se integra a productos como Google Workspace y Gemini App. GPT‑Image 1.5, en cambio, está orientado a la generación y edición creativa generalista dentro de ChatGPT, con menos énfasis en gráficos técnicos pero mayor control de edición.
Sora 2 (OpenAI): Sora 2 se especializa en generación de video y audio, con física mejorada y capacidades de guion. ChatGPT Images 1.5 está enfocado exclusivamente en imágenes estáticas; los usuarios que requieran contenidos audiovisuales deben recurrir a Sora o a modelos de video como Veo 3.1.
DALL·E 3 y Midjourney: DALL·E 3 (también de OpenAI) ofrece generación de imágenes pero no edición precisa ni velocidad mejorada; Midjourney se mantiene como una herramienta comunitaria con estéticas artísticas particulares. GPT‑Image 1.5 destaca por su integración directa en ChatGPT, control granular y salida rápida.
Nano Banana Pro vs. GPT‑Image 1.5: Ambos modelos mejoran la precisión de textos y permiten añadir o eliminar objetos; sin embargo, GPT‑Image 1.5 prioriza la experiencia de usuario dentro de una aplicación conversacional, mientras que Nano Banana Pro se dirige a diseñadores y empresas con resoluciones de hasta 4K.

Potencial para profesionales, académicos e investigadores, administrativos y usuarios cotidianos, egresados

Profesionales de la comunicación y entretenimiento: GPT‑Image 1.5 permite crear portadas de revistas, pósteres, infografías y material promocional con rapidez, manteniendo la coherencia visual y adaptándose a campañas de última hora. Los comunicólogos pueden experimentar con diferentes estilos y elementos gráficos sin depender de software especializado.
Académicos e investigadores: la capacidad de generar diagramas, esquemas y visualizaciones con textos legibles facilita la elaboración de material didáctico y presentaciones científicas. En la investigación de comunicación digital, la herramienta sirve para experimentar con narrativas visuales y analizar la recepción de contenidos generados por IA.
Administrativos y gestores de proyectos: la interfaz intuitiva permite crear rápidamente imágenes para informes, presentaciones o comunicaciones internas. Al integrarse con ChatGPT, se pueden automatizar reportes que incluyan gráficos generados al momento.
Usuarios cotidianos: cualquier persona con acceso a ChatGPT puede utilizar el modelo para editar fotografías personales, crear memes o diseñar tarjetas. La experiencia visual-first y los filtros predefinidos simplifican el proceso para usuarios sin habilidades de diseño.
Egresados: exalumnos de comunicación y otras disciplinas pueden emplear la herramienta para proyectos independientes, portfolios o emprendimientos creativos, explorando nuevas formas de narrar a través de imágenes.

Índice de valoración del Observatorio

Conclusión

La llegada de ChatGPT Images 1.5 marca un hito en la democratización de la creación visual mediante IA. Al ofrecer ediciones precisas, un flujo de trabajo rápido y una interfaz centrada en lo visual, OpenAI responde a la creciente demanda de herramientas creativas accesibles. Este movimiento, acelerado por la competencia con Google, pone de manifiesto la carrera por liderar el mercado de generadores de imágenes y la presión por innovar a ritmos vertiginosos.

Sin embargo, como advierte la literatura de estudios críticos de la tecnología, la adopción masiva de estos modelos debe ir acompañada de reflexión ética y mecanismos de regulación. La Ley de IA de la UE exige transparencia en los datos y evaluaciones de riesgos; la ausencia de estas prácticas en GPT‑Image 1.5 deja preguntas abiertas sobre sesgos, derechos de autor y potenciales usos indebidos. Siguiendo la perspectiva holística de pensadores como Luciano Floridi, el verdadero impacto social de esta tecnología dependerá de la capacidad de integrar innovación con responsabilidad y justicia digital.

Para explorar y probar GPT‑Image 1.5 de forma segura, puede consultarse la entrada oficial de OpenAI (en inglés) en The new ChatGPT Images is here. Se recomienda evitar sitios no verificados o enlaces de terceros que puedan contener spam o contenidos no regulados.

Deliverect AI Agent Library: automatización inteligente para la restauración

EPAM AI Agents en Google Cloud Marketplace – transformación de procesos empresariales con agentes de IA

Google Workspace Studio – automatización de tareas con agentes de IA (8 de diciembre de 2025)

“Antecedentes de la IA El 16 de diciembre de 2025, OpenAI anunció una actualización significativa de su herramienta de imágenes dentro de ChatGPT. Tras el éxito de GPT‑5.2 y la creciente competencia co”

Compartir esta historia

Ayuda a que más personas la lean

Sigue leyendo

Ver todas

IA y Sociedad

24.02.2026: Ecosistemas de IA generativa multimodal y reconfiguración de la autoría en nuevos medios

1. Tres tendencias principales1.1. Ecosistemas de IA generativa multimodal y reconfiguración de la autoría en nuevos mediosLa maduración de modelos generativos multimodales —capaces de integrar texto,

Retrato de Dr. Jorge Alberto Hidalgo Toledo Por Dr. Jorge Alberto Hidalgo Toledo24 feb3 min

IA y Sociedad

GPT‑5.2‑Codex: el avance de OpenAI en codificación y ciberseguridad

Antecedentes y compañíaOpenAI, organización fundada en 2015 con la misión de que la inteligencia general artificial beneficie a la humanidad, ha lanzado modelos cada vez más sofisticados. Tras GPT‑5 y

Retrato de Dr. Jorge Alberto Hidalgo Toledo Por Dr. Jorge Alberto Hidalgo Toledo19 dic10 min

IA y Sociedad

24.09.2025: Lanzamiento del Latam‑GPT como proyecto de autonomía lingüística y digital

IntroducciónHoy, 24 de septiembre de 2025, se vislumbra como una jornada paradigmática en la geopolítica de la inteligencia artificial para América Latina: el proyecto Latam‑GPT, impulsado desde Chile

Retrato de Dr. Jorge Alberto Hidalgo Toledo Por Dr. Jorge Alberto Hidalgo Toledo24 sep9 min