OpenAI y Anthropic revolucionan la programación con GPT-5.3-Codex y Claude Opus 4.6

Desarrollador usando IA para generar código autónomo con GPT-5.3-Codex y Claude Opus 4.6 en una pantalla con terminal y gráficos de rendimiento

IA para programadores: OpenAI y Anthropic lanzan modelos avanzados que redefinen el desarrollo de software con agentes autónomos y mayor eficiencia.

Cuando ChatGPT irrumpió en noviembre de 2022, OpenAI lideraba sin competencia. Sin embargo, en 2026, su posición ya no es la misma. Google ha conquistado al público con Nano Banana Pro, mientras Gemini avanza como alternativa sólida. ChatGPT ha perdido cuota en algunos mercados, y Anthropic se ha consolidado como la herramienta preferida entre desarrolladores.

Este jueves, la industria dio un giro clave con el lanzamiento casi simultáneo de GPT-5.3-Codex y Claude Opus 4.6, dos modelos diseñados para programación. La coincidencia refleja la feroz competencia por dominar el siguiente paso de la IA, donde los usuarios son los principales beneficiados.

GPT-5.3-Codex y Claude Opus 4.6: qué ofrecen a los desarrolladores

GPT-5.3-Codex, enfocado en agentes de programación, promete mejorar el rendimiento, el razonamiento y el conocimiento profesional. OpenAI asegura que es un 25% más rápido que versiones anteriores y está optimizado para tareas prolongadas, como investigación, uso de herramientas y ejecución compleja, sin perder el hilo de trabajo.

Uno de sus avances más destacados es su participación en su propio desarrollo. El equipo de OpenAI usó versiones tempranas del modelo para depurar el entrenamiento, gestionar despliegues y analizar resultados, acelerando los ciclos de investigación.

Además, GPT-5.3-Codex destaca en la creación autónoma de aplicaciones y juegos web. OpenAI ha publicado dos ejemplos accesibles: un juego de carreras con ocho mapas y un juego de buceo para explorar arrecifes.

Swe Bench Pro Public

Claude Opus 4.6, por su parte, mejora la planificación, autonomía y fiabilidad en grandes bases de código. Anthropic afirma que el modelo puede mantener tareas agénticas durante más tiempo, revisar y depurar su propio trabajo con mayor precisión.

Entre sus novedades, destaca una ventana de contexto de un millón de tokens en fase beta, que reduce la pérdida de información en procesos largos. También incluye pensamiento adaptativo, que ajusta automáticamente la profundidad del razonamiento según el contexto, y equipos de agentes que trabajan en paralelo dentro de Claude Code.

Opus 4 6

Mientras GPT-5.3-Codex aún no está disponible en API, Claude Opus 4.6 sí lo está, con un precio base de 5 dólares por millón de tokens de entrada y 25 dólares por millón de tokens de salida. Los prompts que superan los 200.000 tokens tienen un coste premium.

¿Quién lidera la carrera? Los datos comparables

Comparar GPT-5.3-Codex y Claude Opus 4.6 no es sencillo. Cada compañía elige evaluaciones que resaltan sus fortalezas, pero difieren en metodología y métricas, lo que complica una comparación directa. Sin embargo, hay dos benchmarks comparables: Terminal-Bench 2.0 y OSWorld.

Los resultados muestran un reparto de fortalezas. GPT-5.3-Codex alcanza un 77,3% en Terminal-Bench 2.0, superando el 65,4% de Opus 4.6, lo que sugiere mayor eficacia en flujos de trabajo en terminal. En cambio, Opus 4.6 lidera en OSWorld con un 72,7%, frente al 64,7% de GPT-5.3-Codex, destacando en interacción general con el sistema.

Google ha olido sangre con la IA, así que ha decidido gastarse en 2026 más que el PIB de 158 países del mundo

Estos modelos ya no se limitan a generar código. Ahora participan en procesos prolongados de análisis, ejecución y revisión, adaptándose a entornos profesionales reales. La elección entre uno u otro dependerá del tipo de tarea y las necesidades específicas de cada desarrollador.

OpenAI tiene un problema: Anthropic está triunfando justo donde más dinero hay en juego.

Referencia de contenido: consultar fuente original aquí