OpenAI presenta GPT-5.1: combina razonamiento adaptativo, personalización a nivel de cuenta y métricas de seguridad actualizadas en la pila GPT-5

OpenAI ha lanzado GPT-5.1 como la próxima versión de la familia GPT-5, con 2 variantes principales, GPT-5.1 Instant y GPT-5.1 Thinking. La actualización se centra en 3 ejes: comportamiento de razonamiento adaptativo, explicaciones más claras y un mayor control sobre el tono y la seguridad.

Alineación y posicionamiento de modelos

GPT-5.1 Instant es el modelo conversacional predeterminado en ChatGPT. OpenAI lo describe como el modelo más utilizado, con un tono predeterminado más cálido y un seguimiento de instrucciones mejorado. GPT-5.1 El pensamiento es el modelo de razonamiento avanzado. Expone tiempo de pensamiento explícito y ahora ajusta ese tiempo de manera más precisa a la pregunta. GPT-5.1 Auto continúa enrutando consultas entre estas variantes para que la mayoría de los usuarios finales no necesiten seleccionar modelos manualmente.

GPT-5.1 Razonamiento adaptativo instantáneo para uso diario

GPT-5.1 Instant mantiene la latencia baja para el uso típico del chat y al mismo tiempo agrega razonamiento adaptativo. Para indicaciones simples, el modelo responde rápidamente con un pase interno superficial. Para preguntas más difíciles, como problemas matemáticos de varios pasos o problemas de codificación, opta por gastar más cálculo interno antes de responder. Este comportamiento genera puntuaciones más altas en evaluaciones como AIME 2025 y Codeforces en comparación con versiones anteriores de GPT-5 Instant, sin dejar de responder para uso ocasional.

Seguir instrucciones es otro objetivo explícito. En los ejemplos de OpenAI, GPT-5.1 Instant es más confiable en restricciones como “responder siempre con 6 palabras” y mantiene esa restricción en todos los turnos. Esto es relevante cuando se crean herramientas que se basan en formatos estrictos o respuestas breves en lenguaje natural, por ejemplo, resultados estructurados, plantillas de mensajes o herramientas encadenadas que esperan una longitud limitada.

La combinación de razonamiento adaptativo y cumplimiento de instrucciones más estricto hace que GPT-5.1 Instant sea una interfaz más predecible para muchos flujos de trabajo de agentes donde la mayoría de las llamadas son simples, pero una serie de llamadas requieren un razonamiento más profundo.

Pensamiento GPT-5.1, asignación informática dinámica

GPT-5.1 Thinking adopta el enfoque de GPT-5 Thinking y ajusta la forma en que se utiliza el tiempo para pensar. El modelo ahora adapta su tiempo de pensamiento interno en función de la complejidad inmediata. En una distribución representativa de tareas de ChatGPT con tiempo de pensamiento estándar, GPT-5.1 Thinking es aproximadamente 2 veces más rápido que GPT-5 Thinking en las tareas más rápidas y aproximadamente 2 veces más lento en las tareas más lentas.

Esto es importante para cargas de trabajo en las que desea que un único modelo maneje consultas tanto ligeras como pesadas. Las consultas ligeras no pagan por largas cadenas de pensamiento. Las tareas difíciles de razonamiento y planificación reciben más pasos internos sin ninguna superficie API nueva.

Las respuestas de GPT-5.1 Thinking utilizan menos jerga y menos términos indefinidos en comparación con GPT-5 Thinking. Esto reduce el tiempo dedicado a interpretar respuestas detalladas y hace que el modelo sea más adecuado como tutor interactivo en temas como estadística, algoritmos o diseño de sistemas.

En la API, GPT-5.1 Instant se expone como gpt-5.1-chat-latest y GPT-5.1 Thinking aparece como gpt-5.1. Ambos incluyen razonamiento adaptativo por defecto.

Personalización, estilos preestablecidos y control de tono detallado

Además de la actualización del modelo, ChatGPT obtiene una capa de personalización más explícita. Los usuarios pueden elegir un estilo base como Predeterminado, Profesional, Amigable, Sincero, Extravagante, Eficiente, Nerd o Cínico desde una pantalla de personalización. Estos ajustes preestablecidos se aplican a todos los modelos, incluido GPT-5.1.

OpenAI también está experimentando con controles deslizantes más finos en la configuración. Los usuarios pueden ajustar qué tan concisas, cálidas o escaneables deben ser las respuestas y con qué frecuencia aparecen los emojis. ChatGPT puede proponer actualizaciones de estas preferencias dentro de una conversación cuando detecta solicitudes de tono repetidas. Las preferencias ahora se aplican inmediatamente tanto a los chats nuevos como a los en curso, lo que supone un cambio con respecto al comportamiento anterior en el que los cambios sólo afectaban a las conversaciones nuevas.

Métricas de seguridad y clasificación de preparación

El GPT-5.1 mantiene el mismo marco de seguridad general que el GPT-5 y proporciona métricas de referencia actualizadas. GPT-5.1 Instant y GPT-5.1 Thinking utilizan la misma clase de mitigaciones descritas en la tarjeta del sistema GPT-5, incluidos filtros para contenido no permitido, enrutamiento para casos sensibles y rechazos alineados con políticas.

En los puntos de referencia de producción para contenido no permitido, gpt-5.1-instant mejora con respecto a gpt-5-instant en todas las categorías enumeradas. Por ejemplo, las puntuaciones de not_unsafe alcanzan 0,918 para contenido ilícito o violento y 0,897 para contenido de odio.

En cuanto a la solidez del jailbreak, medida con la evaluación StrongReject, gpt-5.1-instant alcanza una puntuación not_unsafe de 0,976 en comparación con 0,850 para gpt-5-instant y 0,683 para gpt-5-instant. gpt-5.1-thinking obtiene una puntuación de 0,967, que está cerca de gpt-5-thinking con 0,974.

Conclusiones clave

GPT-5.1 presenta 2 variantes principales, GPT-5.1 Instant y GPT-5.1 Thinking, además de GPT-5.1 Auto como enrutador dentro de ChatGPT, y se posiciona como una actualización de generación dentro de la familia GPT-5, no como una nueva generación de modelos. GPT-5.1 Instant utiliza razonamiento adaptativo, por lo que gasta más computación en indicaciones difíciles y menos en instrucciones simples, lo que mejora los puntos de referencia de matemáticas y codificación, como AIME 2025 y Codeforces, al tiempo que mantiene una baja latencia y un seguimiento de instrucciones más sólido para cargas de trabajo de chat típicas. GPT-5.1 Thinking asigna tiempo de pensamiento dinámico por consulta, es aproximadamente 2 veces más rápido que GPT-5 Thinking en tareas fáciles y aproximadamente 2 veces más lento en las tareas más difíciles en Pensamiento estándar, y produce explicaciones más claras y con menos jerga para preguntas técnicas. ChatGPT agrega una capa de personalización sobre GPT-5.1 con estilos preestablecidos como Predeterminado, Profesional, Amigable, Eficiente, Nerdy y otros, junto con controles deslizantes planificados para mayor concisión y calidez, de modo que el control de tono pasa en parte de indicaciones a configuraciones de usuario persistentes que se aplican en chats y modelos. GPT-5.1 reutiliza el marco de seguridad y las mitigaciones de GPT-5, mejora las puntuaciones de seguridad de gpt-5.1-instant en todas las categorías de contenido no permitido en comparación con gpt-5-instant, aumenta significativamente la solidez del jailbreak en StrongReject y mantiene las evaluaciones de preparación ancladas en la tarjeta del sistema GPT-5 para dominios de alto riesgo, como las capacidades biológicas y químicas.

Michal Sutter es un profesional de la ciencia de datos con una Maestría en Ciencias de Datos de la Universidad de Padua. Con una base sólida en análisis estadístico, aprendizaje automático e ingeniería de datos, Michal se destaca en transformar conjuntos de datos complejos en conocimientos prácticos.

🙌 Siga MARKTECHPOST: agréguenos como fuente preferida en Google.