OpenAI usa documentos laborales reales para entrenar su IA: riesgos y polémica

Persona revisando documentos confidenciales en una pantalla con advertencia de riesgos legales al entrenar inteligencia artificial con datos reales de empleos

Polémica en IA: OpenAI solicita a contratistas externos documentos reales de sus empleos para evaluar modelos de inteligencia artificial, generando preocupaciones legales y de privacidad.

La empresa, creadora de ChatGPT, busca establecer una línea base humana para comparar el rendimiento de sus sistemas de IA frente a profesionales en diversos sectores. Según documentos obtenidos por WIRED, OpenAI instruye a los contratistas a subir tareas reales de sus trabajos actuales o anteriores, incluyendo archivos como documentos de Word, PDF, presentaciones o repositorios de código.

«Hemos contratado a personas de distintas profesiones para recopilar tareas del mundo real que se asemejen a las que realizan en sus trabajos», señala un documento confidencial de OpenAI. La compañía permite incluso ejemplos inventados, siempre que reflejen escenarios laborales realistas.

Cada tarea debe incluir dos componentes: la solicitud (lo que un jefe o colega pide) y el entregable (el trabajo producido). Un ejemplo citado en la presentación de OpenAI describe un itinerario de viaje en yate para una familia adinerada, creado por un director de estilo de vida de una empresa de conserjería de lujo.

Riesgos legales y de privacidad

OpenAI advierte a los contratistas que eliminen información confidencial, propiedad intelectual y datos personales de los archivos subidos. Sin embargo, expertos señalan que este proceso podría exponer a la empresa a demandas por apropiación indebida de secretos comerciales.

Evan Brown, abogado especializado en propiedad intelectual, alerta: «El laboratorio de IA confía en sus contratistas para decidir qué es confidencial. Si se les escapa algo, ¿realmente revisan los laboratorios de IA cada detalle?». Los contratistas, por su parte, podrían violar acuerdos de confidencialidad con empleadores anteriores.

OpenAI menciona una herramienta llamada Superstar Scrubbing en ChatGPT, diseñada para ayudar a eliminar información sensible. No obstante, la efectividad de este método genera dudas entre los expertos.

El negocio detrás de los datos

La demanda de datos de alta calidad ha impulsado una subindustria lucrativa dentro del entrenamiento de IA. Empresas como Handshake AI (valorada en US$3.500 millones en 2022) y Surge (con una valoración de US$25.000 millones) gestionan redes de contratistas para laboratorios como OpenAI, Anthropic y Google.

OpenAI también ha explorado otras vías para obtener datos reales. Según una fuente anónima, la empresa mostró interés en adquirir documentos, correos electrónicos y comunicaciones internas de compañías en liquidación, siempre que se eliminara la información personal. El proyecto no prosperó por dudas sobre la efectividad de la depuración.

La estrategia refleja la carrera por desarrollar agentes de IA capaces de automatizar tareas empresariales complejas. Sin embargo, el uso de documentos laborales reales plantea interrogantes éticos y legales que podrían definir el futuro de la industria.

Referencia de contenido: consultar fuente original aquí
Etiquetado: