Alibaba Cloud lanza Qwen RobotSuite para romper los límites de la robótica y conectar la IA con el mundo físico

Imagen de Qwen-Robot Suite
Imagen de Qwen-Robot Suite - QWEN
Europa Press PortalTIC
Publicado: jueves, 18 junio 2026 16:58

   MADRID, 18 Jun. (Portaltic/EP) -

   Tongyi Lab, la división de IA de Alibaba Cloud, ha anunciado Qwen-RobotSuite, un conjunto de modelos de lenguaje y visión que han sido diseñados con el objetivo de cerrar la brecha existente entre "entender" el mundo físico y "actuar en él" dentro del ámbito de la robótica.

   Tongyi Lab se ha convertido en uno de los pilares del software libre en inteligencia artificial gracias a la estrategia de modelos de pesos abiertos (open-weights) como Qwen 2.5 y Qwen3, que se han caracterizado por su ejecución local en los equipos de los usuarios.

   El objetivo de Qwen-RobotSuite es que desde el software se pueda controlar una gran variedad de hardware en forma de robots y convertirse en el motor cerebral de la próxima generación de robótica industrial y comercial.

   La nueva familia de modelos de IA es capaz de reconocer objetos, entender las relaciones espaciales, seguir instrucciones visuales complejas y razonar sobre entornos del mundo real. Esto significa que podría entender un comando como "Ve a la cocina, encuentra un plato azul, tómalo y colócalo en la estantería".

   Desde el anuncio en el blog se explica cada uno de los objetivos de los tres modelos fundacionales de la nueva 'suite' y se destaca que ya han comenzado las fases piloto y pruebas de rendimiento con clientes empresariales seleccionados desde la plataforma de Alibaba Cloud.

   El primero de los tres modelos es Qwen-RobotNav, que se caracteriza por unir tareas, como seguir instrucciones de voz, búsqueda de objetos, seguimiento de objetivos y conducción autónoma, bajo un solo modelo, y ha sido probado con éxito en el perro robot Unitree Go2 usando solo su cámara integrada de baja resolución.

   El objetivo de Nav es gestionar la memoria visual para tomar el contexto como un parámetro controlable.

   Qwen-RobotManip es el modelo fundacional encargado de resolver el gran problema al que suelen enfrentarse robots con distintas configuraciones de brazos, ya sea por los distintos números de articulaciones o las cámaras puestas desde distintos ángulos.

   Lo resuelve de tal forma que mapea los movimientos en un espacio de estado y acción de 80 dimensiones y con un sistema de coordenadas de cámara. Esto consigue que Manip realmente sea un "traductor universal" al traducir cualquier acción, como un vídeo de una persona lavando platos, a un formato matemático estándar.

   Su principal virtud recae en su capacidad para recuperarse de errores en tiempo real y en la transferencia de habilidades de un tipo de robot a otro que tiene un diseño o configuración totalmente diferente.

   Qwen-RobotWorld, en cambio, es el modelo dedicado a actuar como un simulador mental que funciona de tal forma que, cuando recibe una imagen y una instrucción en lenguaje natural, predice o genera un vídeo de lo que pasará después en el entorno físico.

   Aquí entra en juego la utilización de un LLM para entender cómo funcionan ciertas físicas de objetos y líquidos, e interactuar con los brazos que son rígidos. De hecho, genera vídeos desde distintos ángulos para entender mejor el entorno y así entrenar robots en simuladores antes de llevarlos a producción o a la realidad.

   Estos son los tres modelos fundacionales de Qwen-RobotSuite, pero el potencial surge cuando el modelo superior, como uno generalista tipo Qwen3.7, se encarga de dirigirlos para que interactúen entre sí, actuando como el "cerebro pensante" que descompone una orden compleja en distintas subtareas para enviar los comandos detallados a Qwen-RobotManip o Qwen-RobotNav.

   El manejo de imprevistos también está presente en esta 'suite' y, si el robot falla al intentar agarrar algo, el planificador se encarga de pasar a la acción para detectar el atasco y replanificar una nueva subtarea para corregir el fallo.

Contador

Últimas noticias sobre estos temas

Contenido patrocinado