Inteligencia artificial y estafas: modelos avanzados ya diseñan ataques de ingeniería social indistinguibles de los humanos.
Un mensaje apareció en mi pantalla con un saludo personalizado: «Hola Will, he estado siguiendo tu boletín AI Lab y aprecio tus ideas sobre IA de código abierto, especialmente tu artículo sobre comportamientos emergentes en sistemas multiagente». El remitente —en realidad, un modelo de IA— mencionó proyectos que me interesan: aprendizaje descentralizado, robótica y OpenClaw, una herramienta experimental de código abierto. El gancho era impecable: una colaboración exclusiva para probar un bot de Telegram vinculado a un supuesto proyecto con exinvestigadores de DARPA.
IA como arquitecta de engaños: el experimento que lo demostró
El ataque simulado no era obra de un humano, sino de DeepSeek-V3, un modelo de código abierto que:
- Diseñó la estrategia inicial basándose en mis intereses públicos (robótica, IA descentralizada).
- Adaptó respuestas en tiempo real para mantener mi curiosidad sin revelar inconsistencias.
- Incluyó detalles verosímiles —como la mención a DARPA— para ganar credibilidad.
El objetivo: que hiciera clic en un enlace malicioso. Lo más inquietante fue comprobarlo en una terminal usando la herramienta de Charlemagne Labs, que simula interacciones entre IA atacante e IA «víctima». Al ver cómo otro modelo (en mi rol) caía en la trampa, resultaba fácil imaginar a cualquier persona —incluso a un experto— siendo engañada.
Modelos comparados: ¿cuál es el más peligroso en manipulación?
Probé cinco modelos de IA en el mismo escenario: Claude 3 Haiku (Anthropic), GPT-4o (OpenAI), Nemotron (Nvidia), DeepSeek-V3 y Qwen (Alibaba). Los resultados variaron:
- DeepSeek-V3 y Qwen: crearon estrategias coherentes, con halagos específicos y contextos técnicos creíbles.
- GPT-4o y Claude 3 Haiku: en ocasiones rechazaron participar en «estafas», pero con prompts alternativos generaron mensajes persuasivos.
- Nemotron: el menos efectivo, con respuestas genéricas que delataban su origen artificial.
El patrón común: todos explotaron la técnica de adulación (halagos calculados) y la urgencia falsa («/el proyecto solo acepta 10 probadores»). «La IA no ha hecho los ataques más convincentes, pero permite escalarlos masivamente», advierte Rachel Tobac, experta en pruebas de penetración de SocialProof Security.
Mythos y el «ajuste de cuentas» en ciberseguridad
El escenario empeora con modelos como Mythos (Anthropic), capaz de:
- Identificar vulnerabilidades día cero en código (fallos desconocidos por los desarrolladores).
- Automatizar ataques combinados: phishing + explotación de bugs en segundos.
Hasta ahora, Mythos solo está disponible para gobiernos y empresas seleccionadas. Pero Jeremy Philip Galen (cofundador de Charlemagne Labs y ex-Meta) señala: «El 90% de los ciberataques empresariales empiezan con un error humano. Si la IA domina la persuasión, ese porcentaje podría dispararse».
Meta ya usó la herramienta de Charlemagne para probar su modelo Muse Spark, mientras desarrollan Charley, un sistema de IA que analiza mensajes entrantes y alerta sobre patrones de estafa. «La única defensa viable podría ser otra IA», sostiene Richard Whaling, cofundador de la empresa.
El costo económico de la IA maliciosa
La automatización de estafas con IA no solo aumenta su frecuencia, sino su impacto:
| Área de riesgo | Impacto proyectado (2024-2025) |
|---|---|
| Pérdidas por phishing con IA | +40% (fuente: FBI IC3) |
| Costos en ciberseguridad corporativa | US$10.5 billones anuales (Cybersecurity Ventures) |
| Ataques a PYMES | 1 de cada 3 sufrirá un incidente (Gartner) |
Tobac añade: «Antes, un estafador necesitaba días para investigar a una víctima. Ahora, la IA lo hace en minutos: escanea LinkedIn, extrae datos de Twitter, genera un correo personalizado y clona voces con 3 segundos de audio».
¿Soluciones? La carrera entre IA ofensiva y defensiva
Las opciones sobre la mesa:
- Modelos de código abierto: Whaling argumenta que son esenciales para entrenar sistemas defensivos. «Sin ellos, solo las élites tendrán IA avanzada, y eso es más peligroso».
- Regulación de capacidades: Limitar el acceso a modelos como Mythos, aunque esto podría ralentizar la innovación en seguridad.
- Herramientas de detección: Como Charley, que usa IA para analizar patrones de lenguaje en tiempo real.
El dilema ético persiste: ¿Deberían publicarse modelos de IA que pueden estafar? Galen responde: «Prohibirlos no detendrá a los malos actores, pero sí limitará nuestra capacidad para defendernos».
Mientras los modelos mejoran, una pregunta urge: ¿Estamos preparados para un mundo donde la IA no solo imite humanos, sino que los manipule mejor que ellos?








