GitHub es la Wikipedia del código. No todo lo que hay en GitHub puede darse por sentado, pero contiene la esencia y la historia de cómo se crean algunas de las mejores herramientas de software.
Sería una pena no tener una API para acceder a un recurso tan valioso. Afortunadamente, tenemos uno y se llama, sorprendentemente, API de GitHub.
Permítanme mencionar primero de qué no se trata este artículo. No hablaremos de comentarios de git ni de cómo utilizar git en el desarrollo de software.
Este artículo trata más sobre el uso de la API de GitHub con fines analíticos. El primer y más importante requisito para el análisis son los datos y GitHub tiene muchos de ellos.
La cantidad y variedad de información que podemos obtener de la API de GitHub es simplemente asombrosa. Además, es una API bien mantenida y documentada, por lo que no tendremos dificultades para obtener la información que necesitamos.
Podemos obtener muchos datos de la API de GitHub, como:
- Confirmaciones por solicitud de extracción
- Estructura de carpetas y archivos de un repositorio
- Número promedio de archivos editados por confirmación
- Datos basados en desarrolladores, como quién impulsó la mayor cantidad de confirmaciones en el último mes
- Datos basados en archivos como…