Alter3: Último robot humanoide impulsado por GPT-4

Investigadores de la Universidad de Tokio y Alternative Machine han desarrollado un avanzado robot humanoide llamado Alter3.

Este robot puede asignar directamente comandos en lenguaje natural a acciones específicas gracias a la integración del modelo de lenguaje GPT-4.

Alter3 está diseñado para realizar tareas complejas como tomarse una selfie o fingir ser un fantasma, utilizando el vasto conocimiento de los grandes modelos de lenguaje (LLM) como GPT-4.

Controlando robots con LLM

Alter3 utiliza GPT-4 como modelo de backend para recibir y procesar instrucciones en lenguaje natural.

El modelo actúa como un planificador, determinando los pasos necesarios para realizar la acción deseada.

Posteriormente, un agente de codificación genera los comandos específicos para que el robot ejecute cada paso.

Gracias a la capacidad de aprendizaje en contexto de GPT-4, el modelo puede adaptar su comportamiento a la API de Alter3, asignando comandos precisos para cada acción.

Aprendizaje a través de la retroalimentación humana

El lenguaje no siempre describe detalladamente las poses físicas, por lo que la secuencia de acciones generada puede no ser perfecta.

Para mejorar esto, los investigadores han implementado una funcionalidad que permite a los humanos proporcionar retroalimentación, como «Levanta el brazo un poco más».

Las instrucciones se envían a otro agente GPT-4 que ajusta el código y devuelve la secuencia corregida al robot. La receta de acción refinada se almacena en una base de datos para futuros usos.

Experimentos y resultados de Alter3

Los científicos probaron a Alter3 en diversas tareas, desde acciones cotidianas como tomarse una selfie y beber té, hasta movimientos de mímica como fingir ser un fantasma.

El modelo mostró capacidad para responder a escenarios que requieren una planificación elaborada de acciones.

Alter3 también fue capaz de imitar emociones humanas como vergüenza y alegría, demostrando la habilidad de GPT-4 para mapear representaciones lingüísticas en el cuerpo del robot con precisión.

Futuro de los modelos avanzados en robótica

El uso de modelos de cimentación como GPT-4 se está popularizando en la investigación robótica.

Proyectos similares, como RT-2-X y OpenVLA, utilizan modelos especializados para producir comandos robóticos directamente.

Aunque estos modelos son más costosos y requieren habilidades técnicas, ofrecen resultados más estables y se generalizan a más tareas y entornos.

A medida que la multimodalidad se convierta en la norma, los sistemas robóticos estarán mejor equipados para razonar sobre su entorno y seleccionar sus acciones de manera efectiva.

Alter3 es un ejemplo de cómo la integración de grandes modelos de lenguaje y la robótica avanzada pueden impulsar la innovación en el campo, dando una visión aún más cercana para los robots humanoides.

Con información de Venture Beat.

L	M	X	J	V	S	D
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

Alter3: Último robot humanoide impulsado por GPT-4

Controlando robots con LLM

Aprendizaje a través de la retroalimentación humana

Experimentos y resultados de Alter3

Futuro de los modelos avanzados en robótica

Intempus: ¿Los robots necesitan un estado fisiológico humano?

El impulso de Nvidia en la robótica avanzada presentado en ICRA

VideoMimic: enseñar a los robots observando videos humanos

Controlando robots con LLM

Aprendizaje a través de la retroalimentación humana

Experimentos y resultados de Alter3

Futuro de los modelos avanzados en robótica

Deja una respuesta

Más historias

Intempus: ¿Los robots necesitan un estado fisiológico humano?

El impulso de Nvidia en la robótica avanzada presentado en ICRA

VideoMimic: enseñar a los robots observando videos humanos