Automatización de ETL para servidor SFTP con Python y SQL | por Mary Ara | agosto, 2024

Aprenda a automatizar un proceso diario de transferencia de datos en Windows, desde una base de datos PostgreSQL a un servidor remoto

Foto de Shubham Dhage en Dejar de salpicar

El proceso de transferencia de archivos de una ubicación a otra es, obviamente, un candidato perfecto para la automatización. Puede resultar abrumador hacerlo de forma repetitiva, especialmente cuando hay que realizar todo el proceso ETL (Extracción, Transformación y Carga) para varios grupos de datos.

Imagine que su empresa tiene sus datos en su almacén de datos y luego decide subcontratar parte de sus análisis a un proveedor externo de análisis de datos. Este proveedor ofrece un software de análisis a medida que mostrará paneles e informes para el equipo de producción central de su empresa.

Lo que esto implica es que usted, como ingeniero de datos, tendrá que transferir datos a este proveedor diariamente, cada hora, cada 30 minutos o cualquier otra frecuencia decidida por el contrato de subcontratación.

En este artículo se explica en detalle este proceso ETL que incluye una carga SFTP. Incorporaremos el Protocolo de transferencia segura de archivos (SFTP), que es un medio seguro para transferir archivos entre dos servidores remotos, cifrando los archivos mediante lo que se conoce como protocolo Secure Shell (SSH).