Ilustración del logo de OpenClaw. - Europa Press/Contacto/Thomas Fuller
MADRID, 20 Feb. (Portaltic/EP) -
Un hacker ha aprovechado una brecha de seguridad en el agente de inteligencia artificial (IA) de código abierto Cline para, mediante 'prompt injections' instalar OpenClaw en los ordenadores de varios usuarios.
OpenClaw, lanzada como Clawdbot y posteriormente renombrada como Moltbot, se popularizó por su capacidad de controlar todas las funciones de un ordenador, como un agente al servicio del usuario que lleva a cabo cualquier tarea. Sin embargo, la posibilidad de acceder a todo el equipo puede suponer un riesgo ante ciberataques o extensiones que encubren 'malware'.
A estos riesgos hay que sumarle también las brechas de seguridad que pueden sufrir los agentes de código abierto, como ha ocurrido con el agente Cline, que utiliza el flujo de trabajo de Claude, el modelo de IA de Anthropic y que es utilizado habitualmente por desarrolladores al integrarse con IDEs como VSCode.
Recientemente el desarrollador e investigador de seguridad Adnan Khan reportó un error en Cline por el que el agente permitía recibir instrucciones para llevar a cabo tareas que no debería. Este tipo de ataques conocidos como 'prompt injection', hacen que los agentes de IA ignoren las protecciones del sistema y ejecuten tareas que normalmente están bloqueadas.
Tras compartir el error, identificado como GHSA-9ppg-jx86-fqw7, fue explotado por un hacker para instalar OpenClaw en los equipos de los usuarios que instalaron la versión 2.3.0 de Cline, aprovechándose del 'prompt injection'. No obstante, la vulnerabilidad solo duró 8 horas (desde las 12:30 hasta las 20:30 horas en horario español peninsular), dado que tras identificarse, se lanzó rápidamente la versión 2.4.0, que corregía el error.
Se ha de tener en cuenta que, aunque en este caso el actor malicioso haya utilizado la vulnerabilidad para instalar OpenClaw, que no es en principio malicioso, se trata de un ejemplo que demuestra el peligro que pueden ocasionar los agentes de IA en determinados casos, que en caso de un ataque de 'prompt injections' tienen vía libre para llevar a cabo tareas de forma autónoma en nombre de los usuarios sin supervisión.