Wikipedia en alerta: IA traduce con errores y fuentes falsas en artículos publicados

Pantalla mostrando un artículo de Wikipedia con errores destacados en rojo por traducciones de IA con datos falsos y referencias inexistentes

Enciclopedia en riesgo: La IA aceleró traducciones en Wikipedia, pero a costa de introducir datos inventados, citas erróneas y referencias inexistentes que pusieron en jaque la credibilidad de la plataforma.

La inteligencia artificial ha revolucionado tareas cotidianas como redactar emails, resumir informes o traducir textos en segundos. Pero su velocidad esconde un peligro: los sistemas generativos pueden fabricar información, distorsionar fuentes o cometer errores que pasan desapercibidos. Cuando estos fallos afectan a una enciclopedia global como Wikipedia —con más de 6 millones de artículos en inglés y versiones en 300 idiomas—, el daño potencial es masivo. Eso es exactamente lo que ocurrió con un proyecto que usó IA para traducir contenidos a gran escala, generando artículos con datos falsos, citas inventadas y referencias manipuladas.

El proyecto que desató la polémica

Todo comenzó cuando editores voluntarios de Wikipedia revisaron traducciones recientes y detectaron inconsistencias alarmantes. Algunos textos incluían frases que no aparecían en las fuentes citadas, páginas de libros que no existían o referencias que no guardaban relación con el contenido. Según una investigación de 404 Media, estos errores eran parte de un iniciativa impulsada por la Open Knowledge Association (OKA), una organización sin fines de lucro que buscaba expandir el contenido de Wikipedia en idiomas minoritarios usando modelos de lenguaje para agilizar el proceso.

El problema no era menor: Wikipedia se basa en la verificabilidad y la neutralidad. Si las traducciones automáticas introducen errores, la enciclopedia pierde su esencia.

Casos concretos: de familias reales a datos inventados

Uno de los ejemplos más graves fue el borrador sobre la familia La Bourdonnaye, una dinastía de la nobleza francesa. La versión traducida citaba un libro y una página específica para explicar su origen, pero al verificar la fuente, el editor Ilyas Lebleu (usuario Chaotic Enby en Wikipedia) descubrió que:

  • La página referenciada no existía en el libro citado.
  • Había referencias intercambiadas entre secciones.
  • Frases enteras carecían de fuente.
  • Párrafos completos no tenían relación con el tema original.

Lebleu alertó a la comunidad: «No son errores menores, son inventos que distorsionan la historia«. El caso no fue aislado: otros editores encontraron problemas similares en artículos sobre ciencia, política y cultura.

Wikipedia 2

El proyecto de OKA prometía traducir miles de artículos al mes, pero la velocidad tuvo un costo: precisión.

¿Se publicaron los errores o se detectaron a tiempo?

La pregunta clave era si estos fallos llegaron a verse en artículos publicados o se corrigieron en fase de borrador. Según los registros:

  • Al menos un caso problemático se identificó antes de su publicación, lo que permitió corregirlo.
  • No hay datos públicos sobre cuántas traducciones con errores se colaron en la versión definitiva.
  • Editores experimentados, como Molly White (conocida por su trabajo en Wikipedia y Web3), advirtieron que «el sistema de revisión actual no está preparado para detectar fallos masivos generados por IA».

El riesgo es claro: si un artículo con datos falsos permanece publicado durante días o semanas, miles de lectores podrían tomar la información como verídica.

OKA: ¿contratistas o colaboradores?

La Open Knowledge Association (OKA), organización detrás del proyecto, describe en su web un modelo basado en estipendios mensuales para traductores que trabajan a tiempo completo. Sin embargo, la investigación de 404 Media reveló que:

  • Los editores que revisaron el proyecto concluyeron que se trataba de contratistas, no de colaboradores estables.
  • OKA pagaba por volumen de traducciones, lo que podría incentivar velocidad sobre calidad.
  • No había un límite claro de artículos por semana, pero sí presión por cumplir metas.

Wikipedia en alerta: IA traduce con errores y fuentes falsas en artículos publicados

OKA recibió US$1.2 millones en donaciones en 2023 para proyectos en Wikipedia.

Wikipedia actúa: nuevas reglas para frenar los errores

Ante la oleada de problemas, la comunidad de Wikipedia tomó medidas drásticas:

  • Los traductores vinculados a OKA que acumulen cuatro advertencias por contenido no verificable en seis meses serán bloqueados sin aviso si hay un nuevo caso.
  • El contenido añadido por un traductor bloqueado podrá eliminarse de forma preventiva, a menos que otro editor con buena reputación lo revise y avale.
  • Se creó un grupo de trabajo para auditar artículos traducidos con IA en los últimos 12 meses.

Además, OKA anunció que implementará una segunda revisión con IA para detectar errores antes de publicar, aunque esto generó escepticismo: «¿Una IA revisando a otra IA? El problema es estructural«, señaló un editor anónimo.

Cuando te pones tus nuevas gafas de Meta pasa algo más: todo lo que grabas lo registran en Kenia para entrenar a la IA

Más de 200 artículos traducidos por el proyecto fueron marcados para revisión manual.

«Los errores ocurren»: la defensa de OKA

Jonathan Zimmermann, fundador y presidente de OKA, reconoció los fallos pero defendió el proyecto: «Los traductores trabajan con pago por hora, no por artículo, y hay verificación humana». Sin embargo, admitió que:

  • «Los errores ocurren, como en cualquier proceso humano».
  • El sistema actual incluye revisión de fuentes, pero «no es infalible«.
  • Tras la polémica, OKA añadirá una capas adicional de revisión con IA y estudia incorporar revisión por pares.

Zimmermann insistió en que el objetivo es «democratizar el conocimiento«, pero críticos como la editora Molly White respondieron: «No se trata de cantidad, sino de confiabilidad. Si la IA introduce errores masivos, Wikipedia pierde su valor».

¿Puede la inteligencia artificial reemplazar la revisión humana en plataformas como Wikipedia? La respuesta, por ahora, es un no rotundo.

Referencia de contenido: consultar fuente original aquí