En los experimentos offline, estamos acostumbrados a probar varios modelos de aprendizaje automático, entrenarlos o ajustarlos y luego usarlos para hacer predicciones (es decir, inferencias). Ahora imaginemos que nos gustaría ir más allá de la experimentación offline y brindarles a nuestros clientes acceso a nuestros increíbles modelos para que también puedan usarlos para hacer predicciones. En tales casos, podemos “implementar” nuestro modelo en un “punto final” de SageMaker. Luego, nuestros clientes pueden enviar sus solicitudes al punto final implementado y recibir predicciones en tiempo real. Estos puntos finales brindan ciertos beneficios, entre ellos:
- Acceso: Un punto final es simplemente una dirección web donde se aloja (o implementa) el modelo. Por lo tanto, podemos usarlo como cualquier otra dirección web a la que podemos enviar la solicitud (es decir, la carga útil) y recibir una respuesta (es decir, la predicción del modelo).
- Escalable: Una vez que se crea un punto de conexión, Amazon/AWS se encargará de dedicar los recursos computacionales necesarios para atender a nuestros clientes. Por ejemplo, supongamos que mi computadora portátil solo puede procesar 10 solicitudes por segundo, pero espero tener 10 000 solicitudes de clientes por segundo. AWS ampliará la escala del punto de conexión y proporcionará el hardware suficiente para admitir las 10 000 solicitudes.