Para implementar una canalización, normalmente hay un principal script, o un único punto de entrada que ejecuta todo el proceso. Por ejemplo, en un proceso de ciencia de datos, el punto de entrada del repositorio de código debe orquestar y ejecutar el proceso de datos, ingeniería de características, modelado y evaluación en secuencia.
A veces, es posible que necesite ejecutar diferentes tipos de canalizaciones o realizar ajustes ad hoc en la canalización.
Los ajustes pueden incluir omitir ciertas partes del código o ejecutar la canalización con diferentes parámetros. En ciencia de datos, podría haber un proceso de capacitación y puntuación o ciertas ejecuciones que requieran una actualización total o parcial de los datos.
El La solución trivial será crear múltiples scripts principales.. Sin embargo, esto dará como resultado la duplicación del código y será difícil mantener los múltiples scripts a largo plazo, dado que puede haber muchas combinaciones de ajustes. Una mejor solución es hacer que el script principal acepte argumentos.en forma de valores de parámetros o indicadores, y posteriormente ejecutar el tipo de canalización apropiado a través de la interfaz de línea de comandos (CLI).
Este artículo no detallará cómo su script principal decide usar los argumentos, pero presentará diferentes formas en las que puede pasar argumentos a su script principal: Puedes considerarlo como si tu script principal ahora fuera una función que acepta parámetros.! También explicaré los pros y los contras de cada método y proporcionaré ejemplos de código sobre cómo implementar los usos básicos y avanzados.
- Usando sysargv: La forma más sencilla
- Usando argparse: La forma más común
- Usando docoptos: Una forma alternativa
- Usando Typer: La forma más nueva y sencilla
La forma más sencilla de pasar argumentos.
Los argumentos se pueden pasar y leer directamente con sysargvlo que la convierte en la forma más sencilla de pasar múltiples argumentos.