«AI Overviews de Google falla en 1 de cada 10 respuestas: ¿confiar o verificar?

Pantalla de Google mostrando un resumen de AI Overviews con datos incorrectos destacados en rojo y advertencia de 'verificar fuentes' en pequeño

Búsquedas con IA en Google: Los resultados ahora incluyen resúmenes generados por AI Overviews, pero su precisión sigue en entredicho.

Desde su lanzamiento en 2024, AI Overviews —el sistema de respuestas automáticas de Google basado en el modelo GeminiThe New York Times, 1 de cada 10 respuestas es incorrecta. Esto se traduce en cientos de miles de datos falsos difundidos por minuto en una plataforma usada por miles de millones de personas.

El estudio, realizado con apoyo de la startup Oumi (especializada en modelos de IA), evaluó la herramienta usando SimpleQA, un conjunto de más de 4,000 preguntas con respuestas verificables creado por OpenAI en 2024. Los resultados revelaron que, tras la actualización a Gemini 3, la precisión de AI Overviews mejoró del 85% al 91%. Sin embargo, ese 9% de errores sigue siendo crítico: extrapolado a escala global, significa decenas de millones de respuestas falsas al día.

Errores que generan desconfianza

El informe destaca casos concretos donde AI Overviews falló estrepitosamente. Por ejemplo:

  • Sobre la casa-museo de Bob Marley: La IA citó tres fuentes, pero dos no mencionaban la fecha y la tercera (Wikipedia) ofrecía dos años contradictorios. AI Overviews eligió el incorrecto.
  • Sobre Yo-Yo Ma y el Salón de la Fama de la Música Clásica: Aunque la IA mencionó correctamente el sitio oficial de la organización, negó la existencia misma del salón, a pesar de que es un reconocimiento real.

«AI Overviews de: Estos errores no son anecdóticos: reflejan un problema estructural. Google prioriza velocidad sobre precisión , usando el modelo Gemini Flash (más rápido pero menos confiable) en la mayoría de las consultas, en lugar del Gemini 3.1 Pro , más lento pero exacto. La compañía admite que, sin acceso a herramientas como la búsqueda web en tiempo real, sus modelos caen a tasas de veracidad del 60-80% .

Estos errores no son anecdóticos: reflejan un problema estructural. Google prioriza velocidad sobre precisión, usando el modelo Gemini Flash (más rápido pero menos confiable) en la mayoría de las consultas, en lugar del Gemini 3.1 Pro, más lento pero exacto. La compañía admite que, sin acceso a herramientas como la búsqueda web en tiempo real, sus modelos caen a tasas de veracidad del 60-80%.

¿Por qué la IA sigue equivocándose?

Evaluar la precisión de estos sistemas es un desafío en sí mismo. La naturaleza no determinista de la IA generativa implica que puede aciertar una pregunta y fallar la misma segundos después. Incluso las herramientas que miden estos errores, como las de Oumi, dependen de otros modelos de IA, que también pueden cometer fallos.

Google defiende sus resultados argumentando que un 90% de aciertos es un «buen promedio». Sin embargo, el problema no es solo estadístico: AI Overviews incentiva a los usuarios a aceptar sus resúmenes sin verificar las fuentes, los famosos enlaces azules que antes eran el sello de Google. La advertencia al final de cada respuesta —«La IA puede cometer errores, así que revisa bien las respuestas»— parece más un descargo de responsabilidad que una solución.

El dilema es claro: ¿confiar en la comodidad de una respuesta instantánea o recuperar el hábito de contrastar información? Mientras la IA avanza en capacidades metalingüísticas (como entender y manipular el lenguaje en niveles antes exclusivos de humanos), su fiabilidad sigue siendo un eslabón débil. Y en un mundo donde la desinformación se propaga a velocidad digital, el 10% de errores de Google podría tener consecuencias impredecibles.

Referencia de contenido: consultar fuente original aquí
Etiquetado: