Hoy, Openai introdujo dos nuevos modelos de razonamiento:OPERAI O3 y O4-Mini—Capando un avance significativo en la integración de entradas multimodales en procesos de razonamiento de IA.
OpenAI O3: razonamiento avanzado con integración multimodal
El OPERAI O3 El modelo representa una mejora sustancial sobre sus predecesores, particularmente en el manejo de tareas complejas entre dominios como las matemáticas, la codificación y el análisis científico. Una característica notable de O3 es su capacidad para incorporar entradas visuales directamente en su cadena de razonamiento. Esto significa que cuando se proporciona imágenes, como diagramas o notas escritas a mano, el modelo no solo las procesa superficialmente, sino que integra la información visual en su flujo de trabajo analítico, lo que permite respuestas más matizadas y conscientes del contexto. Esta capacidad se ve facilitada por el soporte del modelo para herramientas como el análisis de imágenes y la manipulación, lo que permite operaciones como el zoom y las imágenes giratorias como parte de su proceso de razonamiento.
O4-Mini: razonamiento eficiente para aplicaciones de alto rendimiento
Complemento de O3, el O4-Mini El modelo ofrece un equilibrio entre rendimiento y eficiencia. Optimizado para la velocidad y la rentabilidad, O4-Mini ofrece resultados notables, particularmente en tareas que involucran matemáticas, codificación y análisis visual. Ha superado a su predecesor, O3-Mini, en varias evaluaciones, por lo que es una opción ideal para aplicaciones que requieren capacidades de razonamiento de alto rendimiento y tiempo real.
Al igual que O3, O4-Mini también incorpora la característica innovadora del razonamiento con imágenes. Esto permite a los usuarios ingresar datos visuales, como gráficos o capturas de pantalla, y recibir análisis perspicaces que consideran la información textual y visual.
Integración de herramientas y razonamiento autónomo
Los modelos O3 y O4-Mini están diseñados para utilizar y combinar de forma autónoma varias herramientas dentro de ChatGPT, incluida la navegación web, la ejecución del código de Python, el análisis de imágenes y archivos, la generación de imágenes y las funciones de memoria. Esta integración permite que los modelos realicen tareas complejas de varios pasos con una intervención mínima del usuario, avanzando hacia sistemas de IA más autónomos capaces de ejecutar tareas en nombre de los usuarios.
Disponibilidad y acceso
A la fecha de lanzamiento, los usuarios de ChatGPT Plus, Pro y Team pueden acceder a O3, O4-Mini y O4-Mini-High a través del selector de modelos, reemplazando los modelos anteriores de O1, O3-Mini y O3-Mini-High. Los usuarios de la empresa y la educación obtendrán acceso dentro de una semana. Para los desarrolladores, ambos modelos están disponibles a través de la API de finalización de chat y las respuestas API, lo que facilita la integración de capacidades de razonamiento avanzado en varias aplicaciones.
La introducción de O3 y O4-Mini significa los esfuerzos continuos de OpenAI para mejorar las capacidades de razonamiento de IA, particularmente a través de la integración de entradas multimodales, allanando el camino para aplicaciones de IA más sofisticadas y con el contexto.
Mira el Detalles técnicos aquí. Además, no olvides seguirnos Gorjeo y únete a nuestro Canal de telegrama y LinkedIn GRsalpicar. No olvides unirte a nuestro 90k+ ml de subreddit.
Nikhil es consultor interno en MarktechPost. Está buscando un doble grado integrado en materiales en el Instituto Indio de Tecnología, Kharagpur. Nikhil es un entusiasta de AI/ML que siempre está investigando aplicaciones en campos como biomateriales y ciencias biomédicas. Con una sólida experiencia en la ciencia material, está explorando nuevos avances y creando oportunidades para contribuir.