Genie 3: Nuevo avance en mundos virtuales

Genie 3

DeepMind ha presentado Genie 3, un modelo de “world model” que puede generar entornos 3D interactivos en tiempo real a partir de una simple descripción en texto.

El sistema produce mundos navegables a 24 fotogramas por segundo, con resolución de 720p y manteniendo la coherencia visual durante varios minutos de interacción continua.

El desarrollo de Genie 3 se basa en más de una década de investigación en entornos simulados para el entrenamiento de agentes y robótica.

Modelos anteriores como Genie 1 y Genie 2 ya habían logrado generar escenarios, pero Genie 3 da un paso más al integrar interacción en tiempo real con un mayor nivel de consistencia y realismo.

Genie 3

Capacidades y posibilidades

Entre las funciones más destacadas de Genie 3 se encuentran:

  • Simulación física del entorno, con efectos como iluminación dinámica, movimiento del agua y reacciones realistas a las acciones del usuario.
  • Generación de ecosistemas naturales detallados, desde animales hasta vegetación compleja.
  • Creación de mundos imaginarios, con personajes y escenarios animados para aplicaciones creativas.
  • Consistencia prolongada, recordando posiciones y cambios en el entorno durante varios minutos.
  • Modificación en tiempo real mediante texto, lo que permite alterar el clima, añadir objetos o cambiar elementos del escenario al instante.

Además, Genie 3 se ha utilizado junto con el agente SIMA para investigar cómo los agentes pueden desenvolverse en entornos complejos, ejecutando secuencias largas y cumpliendo objetivos definidos por texto.

Limitaciones actuales de Genie 3

Pese a su potencial, Genie 3 aún enfrenta desafíos:

  • Su espacio de acciones es limitado, restringiendo lo que los agentes pueden hacer.
  • La simulación de múltiples agentes y las interacciones sociales complejas todavía es difícil.
  • No reproduce ubicaciones reales con precisión geográfica.
  • La renderización de texto no siempre es clara.
  • Las sesiones de interacción continua se limitan a pocos minutos.

Desarrollo responsable y acceso restringido

DeepMind ha trabajado junto a su equipo de Responsabilidad e Innovación para asegurar un desarrollo ético y seguro de esta tecnología.

Por el momento, Genie 3 está disponible solo para un grupo reducido de investigadores y creadores, con el objetivo de recopilar retroalimentación y evaluar posibles aplicaciones.

La compañía planea ampliar el acceso de forma gradual y explorar su uso en áreas como educación, formación especializada y evaluación de agentes autónomos.

Con este tipo de modelo, DeepMind abre la puerta a nuevas formas de experimentar y comprender los mundos virtuales.

Con información de Google DeepMind.

Más entradas