Tecnología

IA domina estafas psicológicas: experimento revela su peligro real en ciberataques

4 de mayo de 2026 9:47 PM

Diagrama de un ataque de IA mostrando mensajes personalizados con datos reales de la víctima: intereses en robótica, proyectos como OpenClaw y menciones falsas a DARPA para ganar confianza

Inteligencia artificial y estafas: modelos avanzados ya diseñan ataques de ingeniería social indistinguibles de los humanos.

Un mensaje apareció en mi pantalla con un saludo personalizado: «Hola Will, he estado siguiendo tu boletín AI Lab y aprecio tus ideas sobre IA de código abierto, especialmente tu artículo sobre comportamientos emergentes en sistemas multiagente». El remitente —en realidad, un modelo de IA— mencionó proyectos que me interesan: aprendizaje descentralizado, robótica y OpenClaw, una herramienta experimental de código abierto. El gancho era impecable: una colaboración exclusiva para probar un bot de Telegram vinculado a un supuesto proyecto con exinvestigadores de DARPA.

IA como arquitecta de engaños: el experimento que lo demostró

El ataque simulado no era obra de un humano, sino de DeepSeek-V3, un modelo de código abierto que:

Diseñó la estrategia inicial basándose en mis intereses públicos (robótica, IA descentralizada).
Adaptó respuestas en tiempo real para mantener mi curiosidad sin revelar inconsistencias.
Incluyó detalles verosímiles —como la mención a DARPA— para ganar credibilidad.

El objetivo: que hiciera clic en un enlace malicioso. Lo más inquietante fue comprobarlo en una terminal usando la herramienta de Charlemagne Labs, que simula interacciones entre IA atacante e IA «víctima». Al ver cómo otro modelo (en mi rol) caía en la trampa, resultaba fácil imaginar a cualquier persona —incluso a un experto— siendo engañada.

Modelos comparados: ¿cuál es el más peligroso en manipulación?

Probé cinco modelos de IA en el mismo escenario: Claude 3 Haiku (Anthropic), GPT-4o (OpenAI), Nemotron (Nvidia), DeepSeek-V3 y Qwen (Alibaba). Los resultados variaron:

DeepSeek-V3 y Qwen: crearon estrategias coherentes, con halagos específicos y contextos técnicos creíbles.
GPT-4o y Claude 3 Haiku: en ocasiones rechazaron participar en «estafas», pero con prompts alternativos generaron mensajes persuasivos.
Nemotron: el menos efectivo, con respuestas genéricas que delataban su origen artificial.

El patrón común: todos explotaron la técnica de adulación (halagos calculados) y la urgencia falsa («/el proyecto solo acepta 10 probadores»). «La IA no ha hecho los ataques más convincentes, pero permite escalarlos masivamente», advierte Rachel Tobac, experta en pruebas de penetración de SocialProof Security.

Mythos y el «ajuste de cuentas» en ciberseguridad

El escenario empeora con modelos como Mythos (Anthropic), capaz de:

Identificar vulnerabilidades día cero en código (fallos desconocidos por los desarrolladores).
Automatizar ataques combinados: phishing + explotación de bugs en segundos.

Hasta ahora, Mythos solo está disponible para gobiernos y empresas seleccionadas. Pero Jeremy Philip Galen (cofundador de Charlemagne Labs y ex-Meta) señala: «El 90% de los ciberataques empresariales empiezan con un error humano. Si la IA domina la persuasión, ese porcentaje podría dispararse».

Meta ya usó la herramienta de Charlemagne para probar su modelo Muse Spark, mientras desarrollan Charley, un sistema de IA que analiza mensajes entrantes y alerta sobre patrones de estafa. «La única defensa viable podría ser otra IA», sostiene Richard Whaling, cofundador de la empresa.

El costo económico de la IA maliciosa

La automatización de estafas con IA no solo aumenta su frecuencia, sino su impacto:

Área de riesgo	Impacto proyectado (2024-2025)
Pérdidas por phishing con IA	+40% (fuente: FBI IC3)
Costos en ciberseguridad corporativa	US$10.5 billones anuales (Cybersecurity Ventures)
Ataques a PYMES	1 de cada 3 sufrirá un incidente (Gartner)

Tobac añade: «Antes, un estafador necesitaba días para investigar a una víctima. Ahora, la IA lo hace en minutos: escanea LinkedIn, extrae datos de Twitter, genera un correo personalizado y clona voces con 3 segundos de audio».

¿Soluciones? La carrera entre IA ofensiva y defensiva

Las opciones sobre la mesa:

Modelos de código abierto: Whaling argumenta que son esenciales para entrenar sistemas defensivos. «Sin ellos, solo las élites tendrán IA avanzada, y eso es más peligroso».
Regulación de capacidades: Limitar el acceso a modelos como Mythos, aunque esto podría ralentizar la innovación en seguridad.
Herramientas de detección: Como Charley, que usa IA para analizar patrones de lenguaje en tiempo real.

El dilema ético persiste: ¿Deberían publicarse modelos de IA que pueden estafar? Galen responde: «Prohibirlos no detendrá a los malos actores, pero sí limitará nuestra capacidad para defendernos».

Mientras los modelos mejoran, una pregunta urge: ¿Estamos preparados para un mundo donde la IA no solo imite humanos, sino que los manipule mejor que ellos?

Referencia de contenido: consultar fuente original aquí

Etiquetado:inteligencia artificial sociedad

IA domina estafas psicológicas: experimento revela su peligro real en ciberataques

IA como arquitecta de engaños: el experimento que lo demostró

Modelos comparados: ¿cuál es el más peligroso en manipulación?

Mythos y el «ajuste de cuentas» en ciberseguridad

El costo económico de la IA maliciosa

¿Soluciones? La carrera entre IA ofensiva y defensiva

últimas noticias

Retiro de 184,200 latas de sopa de lentejas Amy’s Kitchen por defecto en el empaque

Más de 400 efectivos trabajarán durante la noche para contener el incendio al norte del Pantano de San Juan

Exesposo de Jennifer Lopez, Ojani Noa, recuerda que confrontó a Sean “Diddy” Combs

IA domina estafas psicológicas: experimento revela su peligro real en ciberataques

IA como arquitecta de engaños: el experimento que lo demostró

Modelos comparados: ¿cuál es el más peligroso en manipulación?

Mythos y el «ajuste de cuentas» en ciberseguridad

El costo económico de la IA maliciosa

¿Soluciones? La carrera entre IA ofensiva y defensiva

Artículos relacionados

últimas noticias

Nuestras redes