Agregue una línea de SQL para optimizar sus tablas de BigQuery | de Matt Chapman

Agregue una línea de SQL para optimizar sus tablas de BigQuery | de Matt Chapman | diciembre de 2023

Agrupación: una forma sencilla de agrupar filas similares y evitar el procesamiento de datos innecesario

En mi artículo anterior, expliqué cómo optimizar consultas SQL usando particiones:

Ahora estoy escribiendo el continuación! (Broma de papá, ¿alguien?)

Este artículo analizará agrupamiento: otra poderosa técnica de optimización que puedes usar en BigQuery. Al igual que la partición, la agrupación en clústeres puede ayudarle a escribir consultas con mayor rendimiento que sean más rápidas y económicas de ejecutar. Si desea desarrollar su kit de herramientas SQL y desarrollar habilidades de ciencia de datos de nivel superior, este es un excelente lugar para comenzar.

En BigQuery, una tabla agrupada es una tabla que mantiene filas similares agrupadas en “bloques” físicos.

Por ejemplo, imagine una tabla llamada user_signups que realiza un seguimiento de todas las personas que registran una cuenta en un sitio web ficticio. Tiene cuatro columnas:

registration_date: la fecha en la que el usuario creó una cuenta
country: el país donde se encuentra el usuario
tier: el plan del usuario (“Gratis” o “Pago”)
username: el nombre de usuario del usuario

Si quisiéramos, podríamos agrupar la tabla por country para que los usuarios del mismo país se almacenen uno cerca del otro en la tabla:

Agregue una línea de SQL para optimizar sus tablas de BigQuery | de Matt Chapman | diciembre de 2023

ByEquipo de 7 minutos

Agrupación: una forma sencilla de agrupar filas similares y evitar el procesamiento de datos innecesario

By Equipo de 7 minutos

Related Post

Guía paso a paso para crear un canal completo de detección y redacción de PII con el filtro de privacidad OpenAI

Una implementación de codificación sobre la verificación de tipos de Pyright que cubre genéricos, protocolos, modo estricto, limitación de tipos y escritura moderna en Python

Defender la ciencia impulsada por la curiosidad | Noticias del MIT

You missed

Guía paso a paso para crear un canal completo de detección y redacción de PII con el filtro de privacidad OpenAI

África se está separando más rápido de lo que pensábamos, formando un nuevo océano: ScienceAlert

Candace Owens demandada por difamación por acusaciones de conspiración para asesinar a Charlie Kirk

“Desde que compré el yate, descubrí que soy bastante competitivo”.