Implementación de modelos con puntos de conexión de AWS SageMaker: implementación paso a paso | por Farzad Mahmoodinobar

Implementación de modelos con puntos de conexión de AWS SageMaker: implementación paso a paso | por Farzad Mahmoodinobar | agosto de 2024

Un tutorial de 4 pasos sobre cómo crear un punto final de SageMaker y llamarlo.

Foto de Ayla Verschueren en Dejar de salpicar

En los experimentos offline, estamos acostumbrados a probar varios modelos de aprendizaje automático, entrenarlos o ajustarlos y luego usarlos para hacer predicciones (es decir, inferencias). Ahora imaginemos que nos gustaría ir más allá de la experimentación offline y brindarles a nuestros clientes acceso a nuestros increíbles modelos para que también puedan usarlos para hacer predicciones. En tales casos, podemos “implementar” nuestro modelo en un “punto final” de SageMaker. Luego, nuestros clientes pueden enviar sus solicitudes al punto final implementado y recibir predicciones en tiempo real. Estos puntos finales brindan ciertos beneficios, entre ellos:

Acceso: Un punto final es simplemente una dirección web donde se aloja (o implementa) el modelo. Por lo tanto, podemos usarlo como cualquier otra dirección web a la que podemos enviar la solicitud (es decir, la carga útil) y recibir una respuesta (es decir, la predicción del modelo).
Escalable: Una vez que se crea un punto de conexión, Amazon/AWS se encargará de dedicar los recursos computacionales necesarios para atender a nuestros clientes. Por ejemplo, supongamos que mi computadora portátil solo puede procesar 10 solicitudes por segundo, pero espero tener 10 000 solicitudes de clientes por segundo. AWS ampliará la escala del punto de conexión y proporcionará el hardware suficiente para admitir las 10 000 solicitudes.

Implementación de modelos con puntos de conexión de AWS SageMaker: implementación paso a paso | por Farzad Mahmoodinobar | agosto de 2024

ByEquipo de 7 minutos

Un tutorial de 4 pasos sobre cómo crear un punto final de SageMaker y llamarlo.

By Equipo de 7 minutos

Related Post

Anthropic Claude Sonnet 5 vs Sonnet 4.6 vs Opus 4.8: Comparación de puntos de referencia de codificación agente, precios de API y compensaciones entre costo y rendimiento

Agentes de IA crean áreas de juego virtuales para ayudar a los robots a obtener datos de entrenamiento cruciales | Noticias del MIT

OpenAI GPT-5.6 Sol, Terra y Luna ahora están disponibles de forma generalizada en Amazon Bedrock

You missed

España se enfrenta a Francia en un gran éxito del Mundial

Mamá juez dice que la familia recibe amenazas

Anthropic Claude Sonnet 5 vs Sonnet 4.6 vs Opus 4.8: Comparación de puntos de referencia de codificación agente, precios de API y compensaciones entre costo y rendimiento

El estreñimiento crónico puede comenzar cuando las bacterias intestinales alteran el sistema nervioso intestinal