Meta lanzó Meta Motivo, un modelo de base conductual para controlar agentes humanoides virtuales basados en física.
Meta Motivo es el primero de su tipo y está diseñado para resolver una amplia gama de tareas de cuerpo completo sin necesidad de ajustes posteriores al entrenamiento.
Con este modelo, los agentes pueden realizar tareas como seguir movimientos, adoptar poses y optimizar recompensas.
Control humanoide avanzado
Meta Motivo se basa en un nuevo algoritmo de aprendizaje por refuerzo no supervisado.
Durante el entrenamiento, el modelo utiliza trayectorias no etiquetadas para desarrollar políticas generales que pueden adaptarse a diversas tareas.
El desarrollo permite realizar inferencias de cero disparos, significando que puede resolver tareas no previstas durante el entrenamiento inicial.
Exploración y desarrollo
Meta también está compartiendo el modelo preentrenado, un punto de referencia humanoide y el código de entrenamiento.
El esfuerzo busca fomentar la investigación y avanzar en el desarrollo de modelos conductuales generalizados para agentes más complejos y diversos.
Conclusiones clave
- Meta Motivo fue entrenado en un humanoide basado en el modelo SMPL con el simulador Mujoco, utilizando datos del conjunto AMASS y 30 millones de muestras de interacción en línea.
- El modelo combina representaciones hacia adelante y hacia atrás con una regularización condicional de políticas (FB-CPR). Este enfoque alinea estados, recompensas y movimientos en un espacio latente común.
- En evaluaciones, Meta Motivo logró entre el 61% y el 88% del rendimiento de los mejores métodos específicos para cada tarea, superando a la mayoría de las alternativas.
Resultados cuantitativos y cualitativos
Durante las pruebas, Meta Motivo demostró comportamientos más naturales y humanos en comparación con otros modelos optimizados solo para el rendimiento.
Tanto el equilibrio entre calidad y efectividad lo convierte en un hito importante para el control de humanoides.
Limitaciones y futuro
Aunque Meta Motivo ofrece resultados prometedores, aún enfrenta limitaciones en tareas específicas y ambientes complejos.
Solo es el comienzo de una nueva era en la investigación de modelos conductuales generalizados. Meta invita a la comunidad a explorar y mejorar esta tecnología llamativa.
Con información de Meta.
More Stories
Gemini 2.0: El rumbo de la inteligencia artificial multimodal
NVIDIA y AWS: Innovación en IA, robótica y computación cuántica
Fugatto: La revolución del audio generativo de Nvidia