noviembre 11, 2024

VEKTRA 374

Sitio web de animación 3D, inteligencia artificial, robótica y tecnología

- Inicio » Google mejora la inteligencia de sus robots con Gemini AI

Google mejora la inteligencia de sus robots con Gemini AI

Gemini AI robots
Google DeepMind utiliza recorridos en video y Gemini AI 1.5 Pro para entrenar robots en navegación y tareas.

DeepMind utiliza recorridos en video y Gemini AI 1.5 Pro para entrenar robots en navegación y tareas.

Google anunció progresos considerables en la inteligencia de sus robots gracias a la integración de Gemini AI.

DeepMind, el equipo de robótica de Google, han explicado en un reciente artículo de investigación cómo el uso de la ventana de contexto larga de Gemini 1.5 Pro, que determina cuánta información puede procesar un modelo de IA, permite una interacción más natural con sus robots RT-2 mediante instrucciones en lenguaje natural.

Robots que aprenden de videos

Este avance se basa en filmar recorridos en video de áreas designadas, como casas u oficinas.

Los investigadores utilizan Gemini 1.5 Pro para que los robots “vean” estos videos y aprendan sobre su entorno.

Posteriormente, los robots pueden ejecutar comandos basados en lo que han observado, utilizando respuestas verbales o visuales.

Por ejemplo, pueden guiar a los usuarios hacia una toma de corriente después de que se les muestre un teléfono y se les pregunte “¿dónde puedo cargar esto?”.

Según DeepMind, los robots impulsados por Gemini lograron una tasa de éxito del 90% en más de 50 instrucciones de usuario en un área de operación de más de 9,000 pies cuadrados.

Gemini AI robots

Más allá de la navegación

Los científicos también encontraron “evidencia preliminar” de que Gemini 1.5 Pro permite a los robots planificar cómo cumplir instrucciones más allá de la simple navegación.

Un ejemplo de esto es cuando un usuario pregunta al robot si hay Coca-Cola disponible, y el robot navega hasta el refrigerador, verifica su contenido y luego regresa para informar al usuario.

Aunque las demostraciones en video proporcionadas por Google son impresionantes, los cortes obvios después de que el robot reconoce cada solicitud ocultan el tiempo real de procesamiento, que puede ser entre 10 y 30 segundos.

A pesar de esto, los mencionados desarrollos sugieren que podríamos estar más cerca de tener robots en nuestros hogares que no solo naveguen eficientemente, también nos ayuden a encontrar objetos perdidos como llaves o billeteras.

DeepMind planea seguir investigando estos prometedores resultados.

Con información de The Verge.