Bots de IA dominan el 20% del tráfico web: la batalla por el futuro de internet

Gráfico de tráfico web mostrando el 20% dominado por bots de IA, con patrones de evasión avanzados y datos de Akamai

Tráfico robótico: Los bots de inteligencia artificial ya representan una quinta parte de las visitas a sitios web, según datos exclusivos de TollBit y Akamai. La web se transforma en un ecosistema donde máquinas superan a humanos.

Un informe reciente, respaldado por datos de Akamai, revela que los bots de IA no solo aumentan su presencia en internet, sino que también desarrollan tácticas cada vez más sofisticadas para evadir las defensas de los sitios web. «En el futuro, la mayor parte de internet será tráfico de bots», advierte Toshit Pangrahi, CEO de TollBit, empresa especializada en monitorear el web-scraping.

La mayoría de los grandes sitios web intentan limitar el contenido que los bots pueden extraer para entrenar sistemas de IA. Condé Nast, matriz de WIRED, junto a otros editores, demanda a varias compañías de IA por presuntas infracciones de derechos de autor vinculadas a este fenómeno.

Sin embargo, el scraping no se limita al entrenamiento de modelos. Herramientas como chatbots y asistentes virtuales acceden en tiempo real a datos actualizados, desde precios de productos hasta horarios de cine o resúmenes de noticias. Según Akamai, el tráfico de bots asociado a estas actividades crece sin pausa desde julio pasado.

«La IA está redefiniendo la web», afirma Robert Blumofe, CTO de Akamai. «La carrera que se avecina determinará cómo lucirá, funcionará e incluso cómo se harán negocios en internet».

Número de solicitudes a sitios web por parte de bots cada día.

La invasión silenciosa

En el cuarto trimestre de 2025, TollBit registró que 1 de cada 50 visitas a sitios web de sus clientes provenía de bots de IA. En los primeros tres meses del año, la proporción era de 1 de cada 200. El salto evidencia una aceleración sin precedentes.

El informe también destaca que más del 13% de las solicitudes de bots ignoraron el archivo robots.txt, un protocolo que indica qué páginas deben evitar los rastreadores. Esta cifra creció un 400% entre el segundo y cuarto trimestre de 2024.

TollBit reportó un aumento del 336% en sitios web que intentaron bloquear bots de IA durante el año pasado. Las técnicas de evasión son cada vez más avanzadas: algunos bots simulan tráfico humano, mientras otros imitan patrones de navegación reales. «El comportamiento de ciertos agentes de IA es casi indistinguible del tráfico humano», señala el estudio.

Empresas como TollBit y Cloudflare ofrecen herramientas para que los propietarios de sitios cobren a los scrapers por acceder a su contenido. «Cualquiera que dependa del tráfico humano se verá afectado», alerta Pangrahi. «Necesitamos un intercambio de valor programático entre máquinas».

Porcentaje de clientes usando tácticas para mitiga a los bote de IA.

¿Quién controla a los bots?

WIRED contactó a 15 empresas de AI scraping mencionadas en el informe de TollBit. La mayoría no respondió o no pudo ser contactada. Algunas aseguraron que sus sistemas respetan los límites técnicos de los sitios, aunque admitieron que estas barreras suelen ser complejas.

O Lenchner, CEO de Bright Data, una de las mayores empresas de web scraping, afirma que sus bots no recopilan información no pública. Bright Data enfrentó demandas de Meta y X por presunta sustracción de contenidos, aunque Meta retiró su acusación y un juez desestimó el caso de X.

Karolis Stasiulevičiu, portavoz de ScrapingBee, declaró: «ScrapingBee se basa en un principio fundamental: la web abierta debe ser accesible. Las páginas públicas son legibles tanto para humanos como para máquinas».

Oxylabs, otra empresa del sector, aseguró en un comunicado que sus bots no acceden a contenidos detrás de muros de pago o inicios de sesión. «Exigimos a nuestros clientes que solo usen nuestros servicios para información pública y aplicamos normas de cumplimiento estrictas», indicaron.

Oxylabs también defendió usos legítimos del scraping, como ciberseguridad y periodismo de investigación. Criticaron que las contramedidas de algunos sitios no distinguen entre tráfico malicioso y acceso automatizado legítimo. «Muchos sistemas anti-bot modernos no diferencian bien entre ambos», reclamaron.

Nuevos modelos de negocio

La guerra por el web-scraping no solo genera conflictos, sino también oportunidades. El informe de TollBit identifica más de 40 empresas que comercializan bots para recopilar contenido web, ya sea para entrenar IA u otros fines. El auge de motores de búsqueda basados en IA y herramientas como OpenClaw impulsan esta demanda.

Algunas compañías apuestan por colaborar con los bots en lugar de bloquearlos. Esta estrategia, conocida como Generative Engine Optimization (GEO), busca optimizar contenidos para que aparezcan en respuestas de herramientas de IA. «Estamos ante el surgimiento de un nuevo canal de marketing«, explica Uri Gafni, director comercial de Brandlight.

«En 2026, veremos este despliegue como un canal completo, donde convergerán búsqueda, anuncios, medios y comercio», proyecta Gafni.

Lecturas relacionadas:

  • La paradoja de la IA en América Latina: ¿moldeará la tecnología o será moldeada por ella?
Referencia de contenido: consultar fuente original aquí
Etiquetado: