Ciencia de datos centrada en la nube: un enfoque moderno para analizar y modelar datos |  de Ben Chamblee |  noviembre de 2023

Una guía para utilizar la nube en cada paso del flujo de trabajo de la ciencia de datos

Foto por Myriams-Fotos en Piaxabay

La ciencia de datos es una de las industrias de más rápido crecimiento en el mundo y utiliza tecnología moderna y de vanguardia para mejorar la forma en que utilizamos los datos. Sin embargo, si ha trabajado en ciencia de datos, probablemente sepa que algún día inevitablemente se encontrará mirando una hoja de Excel. Y Excel no tiene nada de malo, simplemente no es el tipo de herramienta que esperarías usar cuando trabajas en una de las industrias más modernas.

Muchas organizaciones han comenzado a utilizar la infraestructura moderna de la nube, pero no en toda su extensión. Muchos científicos de datos se encontrarán extrayendo datos de un almacén de datos en la nube solo para entrenar un modelo en su sistema local. Eso tampoco tiene nada de malo, pero ¿qué pasaría si pudiéramos llevar todo el flujo de trabajo de la ciencia de datos a la nube? Bueno, ¡podemos!

Desde la limpieza de datos hasta la implementación de modelos, existe una herramienta basada en la nube que puede utilizar para modernizar su flujo de trabajo. En este artículo, repasaré cada paso del flujo de trabajo de la ciencia de datos y mostraré cómo se puede realizar la transición a la nube y brindaré algunos ejemplos a lo largo del camino. No dudes en saltarte esta opción si ya modernizaste parte de tu flujo de trabajo, pero si deseas una experiencia 100% de ciencia de datos en la nube; ¡Manténganse al tanto!

Recopilación y almacenamiento de datos en la nube

Lo más probable es que ya estés familiarizado con los beneficios de almacenar datos en la nube, pero en caso de que no lo sepas: ¡es fantástico! Almacenar sus datos en la nube le permite acceder a sus datos desde cualquier lugar con una conexión a Internet, integrarlos fácilmente con otros servicios en la nube, escalar su capacidad de almacenamiento tanto como necesite, crear copias de seguridad para la recuperación y muchas otras cosas muy útiles.

Ya sea que necesite o no un almacén de datos, un lago de datos o un almacenamiento de objetos, sus datos tendrán que vivir en algún lugar si desea implementarlos en otras aplicaciones. Hay toneladas de servicios que ofrecen almacenamiento de datos en la nube; algunos de los más populares incluyen:

  • AWS S3
  • Almacenamiento de blobs de Azure
  • Almacenamiento en la nube de Google
  • Hadoop