Configuración de PyTorch con soporte para GPU en EC2 sin AMI preconfiguradas |  de Zachary Raicik |  marzo de 2024

Un enfoque rentable

Foto por Adi Goldstein en desempaquetar

Amazon Web Service (“AWS”) Elastic Compute Cloud (“EC2”) presenta una opción potente y escalable para la informática. Permite a los desarrolladores acceder a entornos informáticos virtuales equipados con unidades de procesamiento de alto rendimiento como GPU (Unidades de procesamiento de gráficos). Estas GPU aceleran el entrenamiento de modelos complejos de aprendizaje automático, permitiendo tareas que serían poco prácticas o extremadamente lentas en computadoras estándar. Esto es particularmente vital para los modelos de aprendizaje profundo, que requieren una potencia computacional sustancial para procesar grandes conjuntos de datos y realizar cálculos complejos.

Cuando activa una instancia EC2, AWS le ofrece la opción de configurar esa instancia desde cero o aprovechar una imagen de máquina de Amazon (AMI) prediseñada. Una AMI prediseñada es una plantilla que contiene una configuración de software (un sistema operativo, herramientas y aplicaciones) para un propósito específico. Por ejemplo, podría utilizar una AMI prediseñada y configurada para aprendizaje profundo.

Aunque las AMI prediseñadas son excelentes, no son gratuitas y pueden aumentar el costo de su instancia EC2. Durante un período de tiempo suficientemente largo, este aumento de costos puede llegar a ser significativo. Al configurar su instancia EC2 desde cero, no solo ahorra costos sino que también obtiene una comprensión más profunda del proceso de configuración y la capacidad de adaptar su entorno a sus necesidades específicas.

Recientemente tuve que configurar una instancia EC2 desde cero. Pasé muchas horas intentando reunir documentación de diversas fuentes. El resto de esta publicación detalla los pasos que tomé para configurar la máquina y, con suerte, puedo evitarle a alguien cierta confusión en el futuro.

Como descargo de responsabilidad, es posible que este tutorial no funcione de inmediato. Necesita una cuenta de AWS con los roles y permisos necesarios para crear una instancia EC2. Además, las cuentas de AWS no incluyen acceso estándar a máquinas GPU; es posible que deba enviar una aumento de solicitud de cuota para poder poner en marcha una instancia EC2 con una GPU. No dude en comunicarse si necesita ayuda.

Hay multitud de formas en las que puede interactuar con AWS, desde la consola de administración de AWS hasta terraform…