mayo 23, 2025

VEKTRA 374

Sitio web de animación 3D, inteligencia artificial, robótica y tecnología

Genie 2: Modelo de IA que crea mundos y entrena robots

Genie 2
Google DeepMind presentó un adelanto en inteligencia artificial: Genie 2, modelo capaz de generar mundos interactivos a partir de una imagen.

Google DeepMind presentó esta semana un adelanto en inteligencia artificial: Genie 2, un modelo capaz de generar mundos tridimensionales interactivos a partir de una sola imagen.

Durante una entrevista con 60 Minutes, el CEO de DeepMind, Demis Hassabis, explicó cómo esta tecnología puede transformar tanto el entretenimiento como el entrenamiento de agentes de IA, incluyendo robots.

El investigador Jack Parker-Holder demostró cómo Genie 2 toma una imagen estática —como la vista desde una cascada— y la convierte en un entorno 3D que un avatar puede explorar.

Incluso genera elementos no presentes en la imagen original, construyendo nuevos espacios en tiempo real mientras el agente se desplaza.

IA que ve, escucha y crea historias

Aparte de Genie 2, 60 Minutes presentó a Astra, un asistente de IA con visión y audición integradas mediante cámaras y micrófonos.

Astra reconoció lugares, obras de arte e incluso interpretó emociones en una pintura de Edward Hopper, creando luego una historia contextualizada y sensible, demostrando capacidades avanzadas de percepción y narrativa.

Genie 2

Del video borroso al realismo cinematográfico

Otro avance mostrado fue Veo 2, el modelo de generación de video de Google DeepMind.

Hace dos años, generar un “golden retriever con alas” producía imágenes borrosas; hoy, Veo 2 puede crear escenas fotorrealistas con luz dinámica y detalles nítidos, parecidas a secuencias de películas reales.

Entrenamiento de robots en mundos simulados

Hassabis subrayó que Genie 2 no solo sirve para crear videojuegos: su potencial radica en el entrenamiento de agentes de IA en entornos virtuales.

Dado que recolectar datos del mundo real es costoso y lento, los mundos generados por IA entrenan robots de forma optima, para luego transferir ese conocimiento al entorno físico.

Una nueva era para la comprensión del mundo

Finalmente, Hassabis planteó que datos como los de Google Maps o Street View podrían usarse para dar a la IA una comprensión más profunda del mundo real.

Imágenes estáticas de vacaciones o mapas podrían convertirse en experiencias tridimensionales e interactivas.

Genie 2 marca un paso crucial hacia un futuro donde la IA no solo entienda, sino que construya su propio entorno de aprendizaje.

Con información de CBS News.