Operai acaba de lanzar el mejor LLMS de peso abierto: GPT-OSS-120B (se ejecuta en una computadora portátil de alta gama) y GPT-OSS-20B (se ejecuta en un teléfono)

Operai acaba de enviar ondas sísmicas a través del mundo de la IA: por primera vez desde que GPT-2 llegó a la escena en 2019, la compañía está lanzando no uno, sino dos modelos de idiomas de peso abierto. Encontrarse GPT-OSS-120B y GPT-OSS-20B—Modelos que cualquiera puede descargar, inspeccionar, ajustar y ejecutar su propio hardware. Este lanzamiento no solo cambia el paisaje de IA; Detona una nueva era de transparencia, personalización y poder computacional en bruto para investigadores, desarrolladores y entusiastas en todas partes.

¿Por qué es este lanzamiento un gran problema?

Operai ha cultivado durante mucho tiempo una reputación tanto por las capacidades de modelos de asombrosa como para un enfoque similar a la fortaleza de la tecnología patentada. Eso cambió el 5 de agosto de 2025. Estos nuevos modelos se distribuyen bajo los permisivos Licencia Apache 2.0haciéndolos abiertos para uso comercial y experimental. La diferencia? En lugar de esconderse detrás de las API de la nube, alguien Ahora puede poner modelos de grado Operai bajo su microscopio, o ponerlos directamente a trabajar en problemas en el borde, en la empresa o incluso en dispositivos de consumo.

Conoce a los modelos: maravillas técnicas con músculo del mundo real

GPT-OSS-120B

  • Tamaño: 117 mil millones de parámetros (con 5.1 mil millones de parámetros activos por token, gracias a la tecnología de la mezcla de expertos)
  • Actuación: Puntos en el nivel de O4-Mini (o mejor) de OpenAi en puntos de referencia del mundo real.
  • Hardware: Funciona en una sola GPU de alta gama: piense en NVIDIA H100 o tarjetas de clase 80GB. No se requiere una granja de servidor.
  • Razonamiento: Cuenta con capacidades de la cadena de pensamiento y agente: ideal para la automatización de la investigación, la escritura técnica, la generación de códigos y más.
  • Personalización: Admite “esfuerzo de razonamiento” configurable (bajo, medio, alto), para que pueda marcar la energía cuando sea necesario o guardar recursos cuando no lo haga.
  • Contexto: Maneja hasta 128,000 fichas masivas, suficiente texto para leer libros completos a la vez.
  • Sintonia FINA: Construido para una fácil personalización e inferencia local/privada: no hay límites de tarifa, privacidad de datos completa y control total de implementación.

GPT-OSS-20B

  • Tamaño: 21 mil millones de parámetros (con 3.6 mil millones de parámetros activos por token, también mezcla de expertos).
  • Actuación: Se sienta directamente entre O3-Mini y O4-Mini en tareas de razonamiento, a la par de los mejores modelos “pequeños” disponibles.
  • Hardware: Se ejecuta en computadoras portátiles de grado al consumidor, con solo 16 GB de RAM o equivalente, es el modelo de razonamiento de peso abierto más potente que puede caber en un teléfono o PC local.
  • Móvil listo: Específicamente optimizado para ofrecer una IA privada en el dispositivo de baja latencia para teléfonos inteligentes (incluido el soporte de Snapdragon Qualcomm), los dispositivos de borde y cualquier escenario que necesite una inferencia local menos la nube.
  • Poderes de agente: Al igual que su gran hermano, 20B puede usar API, generar salidas estructuradas y ejecutar el código Python a pedido.

Detalles técnicos: Mezcla de expertos y cuantificación MXFP4

Ambos modelos usan un Mezcla de expertos (MOE) Arquitectura, solo activando un puñado de subredes “expertos” por token. El resultado? Los enormes parámetros cuenta con un modesto uso de memoria e inferencia de rayo-rápido, perfecta para el hardware de consumidores y empresas de alto rendimiento de hoy.

Añadir a eso Cuantización nativa de MXFP4encogiendo huellas de memoria modelo sin sacrificar la precisión. El modelo 120B encaja perfectamente en una sola GPU avanzada; El modelo 20B puede ejecutarse cómodamente en computadoras portátiles, escritorios e incluso hardware móvil.

Impacto del mundo real: herramientas para empresas, desarrolladores y aficionados

  • Para empresas: Implementación local para la privacidad y el cumplimiento de los datos. No más AI en la nube de cajas negras: los sectores financiero, de atención médica y legal ahora pueden poseer y asegurar cada parte de su flujo de trabajo LLM.
  • Para los desarrolladores: Libertad para jugar, afinar y extender. Sin límites de API, sin facturas de SaaS, solo IA pura y personalizable con control total sobre la latencia o el costo.
  • Para la comunidad: Los modelos ya están disponibles para abrazar Face, Ollama y más: van desde la descarga hasta el despliegue en minutos.

¿Cómo se acumula GPT-OSS?

Aquí está el pateador: GPT-OSS-20B es el primer modelo de peso abierto disponible gratuitamente que coincide con el rendimiento de los modelos comerciales de primer nivel como O4-Mini. La variante 20B no solo une la brecha de rendimiento para la IA en el dispositivo, sino que probablemente acelerará la innovación y empuje los límites de lo que es posible con los LLM locales.

El futuro está abierto (nuevamente)

GPT-OSS de OpenAI no es solo un lanzamiento; Es una llamada de clarón. Al hacer que el razonamiento de vanguardia, el uso de herramientas y las capacidades de agente estén disponibles para que cualquiera inspeccione e despliegue, Operai lanza la puerta a toda una comunidad de fabricantes, investigadores y empresas, no solo para usar, sino construir, iterar y evolucionar.


Mira el GPT-OSS-120B, GPT-OSS-20B y Blog técnico. No dude en ver nuestro Página de Github para tutoriales, códigos y cuadernos. Además, siéntete libre de seguirnos Gorjeo Y no olvides unirte a nuestro Subreddit de 100k+ ml y suscribirse a Nuestro boletín.


Asif Razzaq es el CEO de MarktechPost Media Inc .. Como empresario e ingeniero visionario, ASIF se compromete a aprovechar el potencial de la inteligencia artificial para el bien social. Su esfuerzo más reciente es el lanzamiento de una plataforma de medios de inteligencia artificial, MarktechPost, que se destaca por su cobertura profunda de noticias de aprendizaje automático y de aprendizaje profundo que es técnicamente sólido y fácilmente comprensible por una audiencia amplia. La plataforma cuenta con más de 2 millones de vistas mensuales, ilustrando su popularidad entre el público.