Entre las novedades de la herramienta de generación de imágenes de Google destaca la garantía de la consistencia visual en cada transformación.

La generación de imágenes con inteligencia artificial ha pasado de ser una propuesta futurista a una realidad cotidiana al alcance de cualquier persona. Y en las últimas semanas, una misteriosa herramienta bajo el nombre «Nano Banana» ha dado de qué hablar. Se trata nada más y nada menos que de un nuevo modelo de edición de imágenes de Google DeepMind, una actualización de Gemini que promete revolucionar el mundo audiovisual.

Si bien «Nano Banana» empezó siendo el nombre en clave de las pruebas internas del modelo Gemini 2.5 Flash Image de Google, esta funcionalidad ha demostrado ser el próximo paso en el mundo de la generación de imágenes con inteligencia artificial, y ya está disponible en la app de Gemini.

Como explican desde Google, para empezar a utilizarla solo será necesario aportar una foto a Gemini, y darle las especificaciones deseadas. De esta forma, la herramienta de IA permite combinar fotos, cambiar el fondo o editar por completo la imagen sin perder su esencia original.

«Nano Banana» lo último de Google en generación de imágenes con IA

La herramienta de Google no solo facilita la edición avanzada de imágenes, sino que garantiza la consistencia visual en cada transformación, resolviendo uno de los principales desafíos en la personalización de contenido generado por IA. De esta forma, la herramienta promete ser especialmente útil en el mundo del branding, y por lo tanto, clave para los profesionales del marketing.

Por ejemplo, una marca puede reutilizar la misma imagen base de un producto en múltiples contextos, manteniendo una apariencia fiel y reconocible en todo momento. Esto significa menos retoque manual, mayor coherencia visual y un enorme ahorro de tiempo en producción de contenidos.

Sundar Pichai, director ejecutivo de Google, compartió con motivo del lanzamiento una serie de imágenes donde su mascota, un perro llamado Jeffree, viste diferentes trajes e incluso surfea una ola, manteniendo las características reconocibles.

Entre las capacidades de edición con IA de esta herramienta destacan:

  • Cambios de vestuario o ubicación: el modelo de IA es capaz de mantener una apariencia estandarizada en cada imagen al colocarla en nuevos escenarios.
  • Fusionar fotos: es posible subir varias fotos y fusionarlas para crear una escena completamente nueva.
  • Edición multi-turno: los usuarios pueden seguir editando las imágenes que crea Gemini, permitiendo modificar partes específicas de una imagen, conservando el resto.
  • Mezcla de diseños: la herramienta permite aplicar el estilo de una imagen a un objeto de otra. Es posible tomar el color o la textura de un elemento y aplicarlos a otros.





Source link

Artículo anteriorLa cesta de la compra, cada vez más imprevisible por el cambio climático y los fenómenos extremos | Economía
Artículo siguienteLisa Cook, la gobernadora de la Reserva Federal que planta cara a Trump | Internacional