OpenAI lanza GPT-5.5: IA que supera a humanos en programación y tareas complejas
El nuevo modelo alcanza 82,7% en pruebas de programación y opera de forma más autónoma, aunque con mayor costo que su predecesor.
OpenAI presentó GPT-5.5, su modelo de inteligencia artificial más avanzado hasta la fecha, que marca un salto significativo en capacidades de programación y resolución autónoma de tareas complejas. El nuevo sistema supera consistentemente a su predecesor GPT-5.4 en múltiples métricas de rendimiento.
En el ámbito de la programación, GPT-5.5 alcanza un 82,7% en Terminal-Bench 2.0, una evaluación que mide flujos de trabajo complejos en línea de comandos, y un 58,6% en SWE-Bench Pro, que evalúa la resolución de problemas reales en repositorios de GitHub. Los ingenieros que probaron el modelo reportan que la IA comprende mejor la arquitectura de sistemas y puede identificar el origen de fallas, determinar dónde aplicar correcciones y evaluar el impacto en otras partes del código.
Una característica destacada es su capacidad para gestionar tareas de múltiples pasos de forma autónoma. Los usuarios pueden asignar proyectos complejos y desestructurados, y el modelo se encarga de planificar, usar herramientas, revisar su trabajo y continuar avanzando ante ambigüedades. En pruebas de productividad general, alcanza 84,9% en GDPval y 78,7% en OSWorld-Verified.
OpenAI clasificó las capacidades de ciberseguridad de GPT-5.5 como "Alta" dentro de su Marco de Preparación, el mismo nivel que sus capacidades biológicas y químicas. Esta clasificación refleja la capacidad del modelo para encontrar y explotar vulnerabilidades de manera más efectiva, lo que llevó a implementar clasificadores más estrictos para detectar usos de riesgo.
El modelo estará disponible para usuarios de planes Plus, Pro, Business y Enterprise, tanto en ChatGPT como en Codex. Aunque será más costoso que GPT-5.4, OpenAI argumenta que su mayor eficiencia en el uso de tokens compensa la diferencia de precio para la mayoría de usuarios.
Fuente original: Hipertextual
Este resumen fue generado con asistencia de IA y revisado editorialmente por Algoré.