Filtración masiva: Anthropic expone sin querer el código secreto de Claude Code a hackers

Captura de pantalla mostrando el archivo de 60 MB con código filtrado de Claude Code y diagramas de su arquitectura interna

Error histórico en IA: Un fallo en la configuración de un paquete rutinario reveló 500.000 líneas de código y la hoja de ruta secreta de Anthropic.

El 31 de marzo de 2024, lo que comenzó como una actualización técnica menor de Claude Code 2.1.88 —la herramienta de programación por línea de comandos de Anthropic— se convirtió en uno de los peores incidentes de seguridad en la historia de la IA. Un error en el archivo de limpieza del paquete (`.npmignore` mal configurado) permitió que se filtrara un archivo de mapa de origen (source map) de 60 MB, conteniendo:

  • 1.900 archivos internos de la arquitectura del sistema,
  • 500.000 líneas de código TypeScript, y
  • detalles críticos de la hoja de ruta 2024-2025 de la empresa.

Filtración masiva: Anthropic: El investigador de seguridad Chaofan Shou detectó la filtración en minutos y la publicó en X (Twitter) , desencadenando una réplica global del código antes de que Anthropic pudiera reaccionar. La compañía retiró el paquete de npm y lanzó una ofensiva legal con avisos DMCA a GitHub y otras plataformas, pero para entonces, el daño ya era irreversible: el código se había descargado, copiado y analizado en cientos de repositorios.

El investigador de seguridad Chaofan Shou detectó la filtración en minutos y la publicó en X (Twitter), desencadenando una réplica global del código antes de que Anthropic pudiera reaccionar. La compañía retiró el paquete de npm y lanzó una ofensiva legal con avisos DMCA a GitHub y otras plataformas, pero para entonces, el daño ya era irreversible: el código se había descargado, copiado y analizado en cientos de repositorios.

¿Qué se filtró exactamente?

La exposición no se limitó a código genérico. El archivo incluía:

  • Arquitectura de memoria de tres capas: Un sistema que obliga a Claude Code a verificar cada instrucción contra el código fuente antes de ejecutarla, revelando cómo la IA prioriza y filtra comandos.
  • Modo autónomo «Kairos»: Un componente oculto que opera en segundo plano para limpiar el contexto del agente y evitar conflictos en tareas prolongadas.
  • Nombres en clave de modelos futuros:
    • «Capibara»: Variante de Claude 4.6 con mejoras en razonamiento lógico.
    • «Fennec»: Versión interna de Opus 4.6, optimizada para empresas.
    • «Numbat»: Modelo en desarrollo con capacidades aún no anunciadas.

Anthropic emitió un comunicado atribuyendo el incidente a un «error humano» y descartando una brecha de ciberseguridad. Sin embargo, aclaró que, aunque no se expusieron datos de clientes, la filtración comprometió años de ventaja competitiva y abrió puertas a exploits antes impensables.

Tres riesgos críticos identificados por ESET

La empresa de ciberseguridad ESET alertó sobre consecuencias inmediatas:

  1. Fin de la «caja negra»: Con el código público, ahora es posible mapear exactamente cómo Claude filtra comandos peligrosos. Esto permite diseñar instrucciones que eludan sus protecciones, como inyecciones de código o solicitudes de ejecución remota disfrazadas de tareas legítimas.
  2. Ataques a la cadena de suministro: Cibercriminales pueden crear clones maliciosos de Claude Code que imiten su funcionamiento pero incluyan puertas traseras para robar datos o instalar malware. Estos falsos paquetes ya circulan en GitHub con nombres como «claude-code-pro» o «anthropic-unlocked».
  3. Exposición de funciones no lanzadas: Modos como «Proactivo» (para automatización avanzada) y «Sueño» (para optimizar recursos en inactividad) fueron analizados por competidores como Meta y Mistral AI antes de su lanzamiento oficial.

Malware en GitHub: la primera ola de ataques

En menos de 48 horas, la firma Zscaler documentó una oleada de repositorios fraudulentos en GitHub que usaban el código filtrado como señuelo. Uno de los casos más graves fue el del usuario «idbzoomh», cuyo repositorio prometía:

«Acceso sin restricciones a las funciones empresariales de Claude».

La realidad era un archivo comprimido infectado que instalaba:

  • Vidar: Malware especializado en robar credenciales, cookies y datos bancarios.
  • GhostSocks: Proxy malicioso que redirige tráfico a través de dispositivos hackeados para encubrir ataques.

«Los cibercriminales actúan con una velocidad récord cuando se filtra código sensible», advirtió Zscaler. «Esta celeridad multiplica el riesgo de intrusiones oportunistas, especialmente en repositorios que imitan proyectos legítimos».

¿Qué sigue ahora? Anthropic enfrenta no solo una crisis de reputación, sino también una carrera contra el tiempo para parchear vulnerabilidades recién descubiertas… mientras sus competidores estudian sus secretos mejor guardados.

Referencia de contenido: consultar fuente original aquí
Etiquetado: