Cómo reducir el tiempo de ejecución de Python para tareas exigentes | de Jiayan Yin | noviembre de 2024

Técnicas prácticas para acelerar cargas de trabajo pesadas con optimización de GPU en Python

Foto por Mateo Schwartz en desempaquetar

Uno de los mayores desafíos que enfrentan los científicos de datos es el largo tiempo de ejecución del código Python cuando manejan conjuntos de datos extremadamente grandes o modelos de aprendizaje automático/aprendizaje profundo altamente complejos. Muchos métodos han demostrado ser eficaces para mejorar la eficiencia del código, como la reducción de dimensionalidad, la optimización del modelo y la selección de características; estas son soluciones basadas en algoritmos. Otra opción para afrontar este desafío es utilizar un lenguaje de programación diferente en determinados casos. En el artículo de hoy, no me centraré en los métodos basados ​​en algoritmos para mejorar la eficiencia del código. En lugar de eso, discutiré técnicas prácticas que son convenientes y fáciles de dominar.

Para ilustrar, usaré el conjunto de datos de venta minorista en línea, un conjunto de datos disponible públicamente bajo una licencia Creative Commons Attribution 4.0 International (CC BY 4.0). Puede descargar el conjunto de datos original. Datos minoristas en línea del repositorio de aprendizaje automático de la UCI. Este conjunto de datos contiene todos los datos de transacciones que ocurren entre un período específico para un comercio minorista en línea sin tienda registrado y con sede en el Reino Unido. El objetivo es entrenar un modelo para predecir si el cliente realizaría una recompra y se utiliza el siguiente código Python para lograr el objetivo.