Presentamos más funciones de nivel empresarial para clientes de API

Para ayudar a las organizaciones a escalar su uso de IA sin extender demasiado sus presupuestos, agregamos dos nuevas formas de reducir costos en cargas de trabajo consistentes y asincrónicas:

  • Uso con descuento en rendimiento comprometido: Los clientes con un nivel sostenido de uso de tokens por minuto (TPM) en GPT-4 o GPT-4 Turbo pueden solicitar acceso al rendimiento aprovisionado para obtener descuentos que oscilan entre el 10% y el 50% según el tamaño del compromiso.
  • Costos reducidos en cargas de trabajo asincrónicas: Los clientes pueden utilizar nuestro nuevo API por lotes para ejecutar cargas de trabajo no urgentes de forma asincrónica. Las solicitudes de API por lotes tienen un precio del 50% de descuento sobre los precios compartidos, ofrecen límites de tarifas mucho más altos y devuelven resultados dentro de las 24 horas. Esto es ideal para casos de uso como evaluación de modelos, clasificación fuera de línea, resumen y generación de datos sintéticos.


Planeamos seguir agregando nuevas características enfocadas en seguridad de nivel empresarial, controles administrativos y gestión de costos. Para obtener más información sobre estos lanzamientos, visite nuestro Documentación API o ponte en contacto con nuestro equipo para discutir soluciones personalizadas para su empresa.