Una de las plataformas de datos basadas en la nube más populares, Snowflake, ahora incorpora funciones de modelado avanzadas y le di una oportunidad a la de pronóstico.
Hace unos meses (23 de noviembre), Snowflake anunció el lanzamiento de múltiples funciones nuevas en el espacio de modelado/LLM, bajo un marco llamado “Corteza”.
Desde mediados de diciembre, las dos primeras funcionalidades (Previsión y Detecciones de anomalías) se pusieron a disposición del público (Notas de la versión de Snowflake 7.44).
Por lo tanto, Snowflake continúa con su misión de ofrecer una plataforma de análisis de “ventanilla única” totalmente administrada para ayudar a los ciudadanos de datos a desbloquear valor de su patrimonio de datos, además de las funcionalidades habituales de almacén de datos dirigidas a los equipos de ingeniería de datos.
Estas funcionalidades les recordarán a algunos de ustedes el “Google BigQuery aprendizaje automático”los que se lanzaron por primera vez en agosto 2020 (¡sí, hace cuatro años!); ¡vamos a sumergirnos!
Previsión de visitas a la piscina de la ciudad local
Más allá de las emocionantes charlas y demostraciones personalizadas del Snowday ❄️, estaba ansioso por cargar un conjunto de datos de la vida real en Snowflake y ver cómo se desempeña Cortex en comparación con lo que un Data Citizen normal podría lograr con la simple combinación de Pandas y Scikit-Learn. .
Decidí utilizar las estadísticas de frecuentación de una piscina local cercana a mi casa (tuvieron la amabilidad de publicar los datos con un espíritu de “datos abiertos” y también porque soy un nadador habitual allí 🏊♂️).
Se trata de un conjunto de datos realmente interesante porque todos podemos imaginar intuitivamente todas las razones por las que fluctúa la frecuentación de una piscina pública:
- nadadores habituales frente a niños y familias que vienen a divertirse de vez en cuando,
- estaciones y temperatura,
- diferentes horarios de apertura durante la semana,
- periodo de festivos,
- lluvia o viento (¡o ambos!),
- etc.
Entonces, ¿cómo captaría un modelo de aprendizaje automático todos estos fenómenos?