Inspirados en modelos de lenguaje avanzados, investigadores del MIT desarrollaron una técnica para entrenar robots de uso general.
La metodología reúne datos de múltiples fuentes, permitiendo que los robots aprendan diversas tareas sin tener que comenzar desde cero cada vez.
En la popular serie animada Los Supersónicos, la robot doméstica Rosie (Robotina) podía realizar tareas tan distintas como limpiar la casa, cocinar y sacar la basura.
Pero en la vida real, lograr que un robot realice tareas tan variadas sigue siendo un gran desafío.
Hasta ahora, el proceso ha sido costoso y lento, ya que cada robot se entrena para una tarea específica en un entorno controlado, limitando su capacidad de adaptación.
Un método de entrenamiento robótico
Para solucionar este problema, los investigadores desarrollaron una técnica que combina datos de diferentes dominios, desde simulaciones hasta robots reales, y modalidades, como sensores visuales y de posición, en un sistema unificado.
El sistema permite que un modelo de inteligencia artificial procese y aprenda a realizar diversas tareas.
La investigación no solo acelera el proceso de entrenamiento, también reduce los costos, requiriendo menos datos específicos para cada tarea.
En pruebas, el nuevo sistema superó al entrenamiento convencional en más de un 20% en tareas simuladas y reales.

La clave: Transformadores Preentrenados Heterogéneos
La arquitectura desarrollada, llamada Transformadores Preentrenados Heterogéneos (HPT), usa un transformador de IA para alinear y procesar las entradas de visión y propiocepción.
Dicho modelo se entrena con una vasta cantidad de datos de distintos tipos, similar a cómo se entrenan los grandes modelos de lenguaje como GPT-4.
HPT se entrena con 52 conjuntos de datos que incluyen más de 200,000 trayectorias de robots y videos de demostración humana, lo que lo convierte en un modelo preentrenado robusto.
La técnica genera que el robot realice tareas con gran precisión y se adapte a nuevos entornos y robots sin necesidad de un extenso reentrenamiento.
Inspiración en modelos de lenguaje para entrenar robots
El éxito de HPT en mejorar el rendimiento robótico abre nuevas posibilidades en la robótica de propósito general.
A futuro, los científicos planean ampliar la diversidad de datos y hacer que HPT procese datos no etiquetados, lo cual podría llevarnos a un “cerebro robótico universal” que pueda adaptarse a cualquier robot y tarea sin entrenamiento adicional.
Esto marca un paso importante hacia robots más versátiles y adaptables, listos para enfrentar desafíos del mundo real.
Con información del MIT.
More Stories
Figure AI abandona OpenAI y apuesta por modelos internos
Avances tecnológicos en robótica y navegación autónoma
Tendencias de robots humanoides para 2025