diciembre 8, 2024

VEKTRA 374

Sitio web de animación 3D, inteligencia artificial, robótica y tecnología

Alter3: Último robot humanoide impulsado por GPT-4

Alter3 GPT-4 Vektra 374
Investigadores de la Universidad de Tokio y Alternative Machine han desarrollado un avanzado robot humanoide llamado Alter3.

Investigadores de la Universidad de Tokio y Alternative Machine han desarrollado un avanzado robot humanoide llamado Alter3.

Este robot puede asignar directamente comandos en lenguaje natural a acciones específicas gracias a la integración del modelo de lenguaje GPT-4.

Alter3 está diseñado para realizar tareas complejas como tomarse una selfie o fingir ser un fantasma, utilizando el vasto conocimiento de los grandes modelos de lenguaje (LLM) como GPT-4.

Controlando robots con LLM

Alter3 utiliza GPT-4 como modelo de backend para recibir y procesar instrucciones en lenguaje natural.

El modelo actúa como un planificador, determinando los pasos necesarios para realizar la acción deseada.

Posteriormente, un agente de codificación genera los comandos específicos para que el robot ejecute cada paso.

Gracias a la capacidad de aprendizaje en contexto de GPT-4, el modelo puede adaptar su comportamiento a la API de Alter3, asignando comandos precisos para cada acción.

Aprendizaje a través de la retroalimentación humana

El lenguaje no siempre describe detalladamente las poses físicas, por lo que la secuencia de acciones generada puede no ser perfecta.

Para mejorar esto, los investigadores han implementado una funcionalidad que permite a los humanos proporcionar retroalimentación, como “Levanta el brazo un poco más”.

Las instrucciones se envían a otro agente GPT-4 que ajusta el código y devuelve la secuencia corregida al robot. La receta de acción refinada se almacena en una base de datos para futuros usos.

Experimentos y resultados de Alter3

Los científicos probaron a Alter3 en diversas tareas, desde acciones cotidianas como tomarse una selfie y beber té, hasta movimientos de mímica como fingir ser un fantasma.

El modelo mostró capacidad para responder a escenarios que requieren una planificación elaborada de acciones.

Alter3 también fue capaz de imitar emociones humanas como vergüenza y alegría, demostrando la habilidad de GPT-4 para mapear representaciones lingüísticas en el cuerpo del robot con precisión.

Alter3 GPT-4 Vektra 374

Futuro de los modelos avanzados en robótica

El uso de modelos de cimentación como GPT-4 se está popularizando en la investigación robótica.

Proyectos similares, como RT-2-X y OpenVLA, utilizan modelos especializados para producir comandos robóticos directamente.

Alter3 GPT-4 Vektra 374

Aunque estos modelos son más costosos y requieren habilidades técnicas, ofrecen resultados más estables y se generalizan a más tareas y entornos.

A medida que la multimodalidad se convierta en la norma, los sistemas robóticos estarán mejor equipados para razonar sobre su entorno y seleccionar sus acciones de manera efectiva.

Alter3 es un ejemplo de cómo la integración de grandes modelos de lenguaje y la robótica avanzada pueden impulsar la innovación en el campo, dando una visión aún más cercana para los robots humanoides.

Con información de Venture Beat.