Amazon frena su obsesión por la IA: empleados la usaban para tareas absurdas

Oficina de Amazon con pantallas mostrando gráficos de uso de IA y un letrero de 'Kirorank' en rojo, simbolizando métricas fallidas

IA en el trabajo: Amazon impulsó su uso, pero los empleados la explotaron sin sentido.

Amazon intentó imponer a sus empleados un uso masivo de herramientas de inteligencia artificial, incluso midiendo su rendimiento con un sistema de puntuación. Sin embargo, el experimento terminó en fracaso: los ingenieros comenzaron a automatizar tareas innecesarias solo para escalar en el ranking interno, disparando costes y obligando a la compañía a dar marcha atrás.

El fracaso del Kirorank: cuando la IA se usa por obligación

La herramienta clave en este desastre fue el Kirorank, un tablón de puntuaciones que evaluaba cuánto usaban los desarrolladores Kiro (el equivalente de Amazon a Claude Code). El objetivo era ambicioso: que el 80% de los programadores interactuaran con la IA semanalmente. Pero en lugar de innovar, muchos recurrieron a agentes autónomos basados en MeshClaw (la versión corporativa de OpenClaw) para ejecutar procesos repetitivos y consumir tokens sin propósito real.

El resultado fue un fenómeno ahora bautizado como tokenmaxxing: inflar artificialmente el uso de IA para cumplir cuotas, sin aportar valor. Dave Treadwell, vicepresidente sénior de Amazon, tuvo que intervenir esta semana para cancelar el sistema. «No uséis la IA solo por usarla«, advirtió, instando a los equipos a enfocarse en «crear mejores productos» en lugar de quemar recursos en servidores.

El coste oculto de la obsesión por la IA

El problema va más allá de la picaresca laboral. Empresas como Anthropic —cuya tecnología Claude usa Amazon— han cambiado su modelo de facturación: de tarifas planas a pago por token consumido. Esto significa que cada interacción «falsa» con la IA encarecía la factura de Amazon. Según estimaciones, el capex de la compañía para 2026 ronda los 200.000 millones de dólares, en gran parte destinados a infraestructura de IA y centros de datos. Malgastar tokens en tareas inútiles se volvió insostenible.

El caso no es único. Meta y Microsoft enfrentaron situaciones similares, con empleados manipulando rankings internos mediante consumo masivo de tokens. La ironía para Amazon es evidente: mientras despide trabajadores para recortar costes, sus propios ingenieros derrochaban recursos en una carrera por puntos virtuales.

¿Por qué fracasó el experimento?

  • Incentivos mal diseñados: Premiar el uso de IA sin evaluar su impacto real llevó a abusos.
  • Falta de métricas de calidad: Kirorank medía cantidad, no resultados útiles.
  • Costes imprevisibles: El tokenmaxxing multiplicó gastos en un modelo de pago por uso.
  • Cultura de productividad ficticia: Los empleados priorizaron «cumplir» sobre innovar.

El episodio deja una lección clara: la IA no es un fin, sino una herramienta. Obligar a usarla sin propósito solo genera ineficiencias. Como admitió Treadwell, el experimento nació con «buenas intenciones», pero demostró que sin controles, la tecnología puede convertirse en un boomerang económico.

El precedente de Amazon y el riesgo de la «automatización vanidosa» en la industria tech

El caso de Amazon no es un error aislado, sino un síntoma de un patrón recurrente en Silicon Valley: la automatización por automatizar, un fenómeno que analistas como Benedict Evans han denominado *vanity automation*. Empresas desde Google (con su fallido proyecto *Maven* para automatizar publicidad sin criterio humano) hasta Uber (cuya obsesión por algoritmos de asignación de rutas generó quejas masivas de conductores por decisiones absurdas) han tropezado con la misma piedra. La diferencia en Amazon es la escala: al vincular el uso de IA a bonificaciones internas y rankings públicos como Kirorank, se creó un incentivo perverso que distorsionó prioridades técnicas.

El problema trasciende lo operativo. Según informes internos filtrados de AWS (la división de cloud de Amazon), el *tokenmaxxing* no solo infló costes, sino que saturó la capacidad de los centros de datos en regiones como Virginia y Oregón, donde se concentran sus servidores de IA. Esto obligó a reasignar recursos destinados a clientes externos —como startups que pagan por acceso a Bedrock— para cubrir la demanda interna artificial. En casos similares, como el de IBM con Watson en 2017, la compañía tuvo que depreciar activos por miles de millones tras descubrir que el 60% de las consultas a su IA eran pruebas sin aplicación real. Amazon evita por ahora ese extremo, pero el episodio expone una vulnerabilidad: cuando la métrica se convierte en el objetivo, el valor real se diluye.

Otro efecto colateral es la erosión de la confianza en herramientas de IA interna. Ingenieros consultados por Platformer admiten que, tras el escándalo, muchos equipos han reducido el uso de Kiro incluso para tareas legítimas, por miedo a ser asociados con el derroche. Esto frena la adopción orgánica de tecnologías que, bien aplicadas, podrían optimizar procesos como la detección de fraudes en logística o la personalización de recomendaciones en AWS.

¿Hacia un «techlash» de la IA corporativa?

El fracaso de Amazon llega en un momento crítico: las grandes tecnológicas enfrentan presión de inversores para demostrar retorno tangible de sus apuestas en IA, no solo crecimiento en métricas de adopción. Con la SEC investigando a empresas como Nvidia por posibles exageraciones en sus informes sobre demanda de chips de IA, el caso de Kirorank podría ser la punta de lanza de un escrutinio más amplio. Si los reguladores comienzan a cuestionar si el gasto en IA se traduce en innovación o en wasteful computing (cómputo derrochador), compañías como Amazon tendrán que replantear no solo sus sistemas de incentivos, sino cómo comunican sus avances. La lección no es abandonar la IA, sino diseñar guardrails que eviten que la obsesión por los números ahogue su potencial real.

Referencia de contenido: consultar fuente original aquí