Seguridad para IA: Un nuevo agente de código abierto promete evitar los desastres de los bots autónomos.
Los asistentes autónomos como OpenClaw ganan popularidad al gestionar rutinas digitales: desde resumir noticias hasta interactuar con servicios de atención al cliente o completar tareas pendientes. Sin embargo, su acceso irrestricto a cuentas ha generado caos: borran correos importantes, publican opiniones polémicas sin consentimiento o incluso lanzan ataques de phishing contra sus propios usuarios.
Para frenar estos riesgos, Niels Provos, experto en ciberseguridad, lanza IronCurtain, un agente de código abierto que opera dentro de una máquina virtual aislada. Su innovación clave: convierte las reglas escritas por el usuario en una «constitución» ejecutable, transformando frases simples en políticas de seguridad infalibles.
«Los servicios como OpenClaw están en auge, pero quizá no sean la solución ideal. Queremos ofrecer la misma utilidad sin exponernos a riesgos innecesarios», explica Provos.
Cómo funciona IronCurtain: reglas que no se rompen
La tecnología detrás de IronCurtain resuelve un problema crítico: los modelos de lenguaje (LLM) son probabilísticos, lo que significa que sus respuestas varían según el contexto. Esto dificulta establecer límites claros. Por ejemplo, una instrucción como «puede leer mis correos y enviar mensajes a contactos conocidos, pero debe consultarme antes de escribir a desconocidos y jamás borrará nada» se traduce en una política rígida que actúa como filtro entre el agente y los sistemas externos.
Este «muro de control» no solo restringe acciones peligrosas, sino que también aprende de los casos límite. Cuando surge una situación ambigua, IronCurtain consulta al usuario y registra cada decisión en un log de auditoría. Además, es compatible con cualquier LLM y no depende de un modelo específico.
IronCurtain evoluciona con el uso: Cada interacción refina las reglas, adaptándose a las necesidades del usuario sin sacrificar seguridad.
Un prototipo con potencial, pero no para todos
IronCurtain no es un producto comercial, sino un proyecto de investigación que busca colaboradores para probar y mejorar su código. Dino Dai Zovi, investigador en ciberseguridad que probó versiones tempranas, destaca su enfoque revolucionario: «La mayoría de los agentes exigen aprobar permisos uno por uno. Con el tiempo, los usuarios aceptan sin leer, otorgando acceso ilimitado. IronCurtain elimina esa posibilidad: acciones como borrar archivos quedan fuera del alcance del LLM, sin excepciones».
Dai Zovi compara el sistema con la ingeniería aeroespacial: «Si buscas velocidad, necesitas estructura. Un cohete requiere un fuselaje estable; sin él, no llegaría lejos. Lo mismo aplica a los agentes autónomos».
¿Podría IronCurtain ser el futuro de la IA segura? Su enfoque promete equilibrar autonomía y control, pero aún queda camino por recorrer.








