Meta Motivo: El nuevo modelo de base conductual de Meta

Meta lanzó Meta Motivo, un modelo de base conductual para controlar agentes humanoides virtuales basados en física.

Meta Motivo es el primero de su tipo y está diseñado para resolver una amplia gama de tareas de cuerpo completo sin necesidad de ajustes posteriores al entrenamiento.

Con este modelo, los agentes pueden realizar tareas como seguir movimientos, adoptar poses y optimizar recompensas.

Control humanoide avanzado

Meta Motivo se basa en un nuevo algoritmo de aprendizaje por refuerzo no supervisado.

Durante el entrenamiento, el modelo utiliza trayectorias no etiquetadas para desarrollar políticas generales que pueden adaptarse a diversas tareas.

El desarrollo permite realizar inferencias de cero disparos, significando que puede resolver tareas no previstas durante el entrenamiento inicial.

Exploración y desarrollo

Meta también está compartiendo el modelo preentrenado, un punto de referencia humanoide y el código de entrenamiento.

El esfuerzo busca fomentar la investigación y avanzar en el desarrollo de modelos conductuales generalizados para agentes más complejos y diversos.

Conclusiones clave

Meta Motivo fue entrenado en un humanoide basado en el modelo SMPL con el simulador Mujoco, utilizando datos del conjunto AMASS y 30 millones de muestras de interacción en línea.
El modelo combina representaciones hacia adelante y hacia atrás con una regularización condicional de políticas (FB-CPR). Este enfoque alinea estados, recompensas y movimientos en un espacio latente común.
En evaluaciones, Meta Motivo logró entre el 61% y el 88% del rendimiento de los mejores métodos específicos para cada tarea, superando a la mayoría de las alternativas.

Resultados cuantitativos y cualitativos

Durante las pruebas, Meta Motivo demostró comportamientos más naturales y humanos en comparación con otros modelos optimizados solo para el rendimiento.

Tanto el equilibrio entre calidad y efectividad lo convierte en un hito importante para el control de humanoides.

Limitaciones y futuro

Aunque Meta Motivo ofrece resultados prometedores, aún enfrenta limitaciones en tareas específicas y ambientes complejos.

Solo es el comienzo de una nueva era en la investigación de modelos conductuales generalizados. Meta invita a la comunidad a explorar y mejorar esta tecnología llamativa.

Con información de Meta.

L	M	X	J	V	S	D
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

Meta Motivo: El nuevo modelo de base conductual de Meta

Control humanoide avanzado

Exploración y desarrollo

Conclusiones clave

Resultados cuantitativos y cualitativos

Limitaciones y futuro

Gemini CLI: Inteligencia artificial en la terminal

Bots de IA generan caos en portales científicos al extraer datos

Nuevas fronteras del video generado por IA

Control humanoide avanzado

Exploración y desarrollo

Conclusiones clave

Resultados cuantitativos y cualitativos

Limitaciones y futuro

Más historias

Gemini CLI: Inteligencia artificial en la terminal

Bots de IA generan caos en portales científicos al extraer datos

Nuevas fronteras del video generado por IA