Estrellas de los Juegos Olímpicos de París 2024. Cómo utilizar los datos de Wikipedia para visualizar… | por Milan Janosov | agosto, 2024

Cómo utilizar los datos de Wikipedia para visualizar la popularidad de los mejores atletas y deportes olímpicos

Acabamos de presenciar tres semanas maravillosas de deportes durante los Juegos Olímpicos de 2024 en París, con millones de personas viendo las transmisiones y alentando a sus favoritos. Al mismo tiempo, vimos a nombres conocidos arrasar nuevamente y surgió la próxima generación de atletas de estadísticas.

Como científico de datos curioso, comencé a preguntarme cómo evoluciona la opinión colectiva detrás de estos temas: ¿cuáles son los deportes más populares y qué atletas están en ascenso? Luego, para respaldar esto con datos, decidí realizar una recopilación de datos exhaustiva de Wikipedia, que contenía tanto perfiles de Wikipedia como información sobre el recuento de visitas, y luego comparar la popularidad de diferentes deportes, así como de los mejores atletas. A continuación, encontrará mis resultados y todo el código Python necesario para reproducirlos.

Todas las imágenes fueron creadas por el autor.

Primero, visitemos el sitio de Wikipedia sobre los Juegos Olímpicos de Verano de 2024 y descarguémoslo usando la biblioteca de solicitudes. Luego, uso el paquete BeautifulSoup para extraer información del código HTML, es decir, la lista de todos los deportes de verano y sus enlaces a sitios Wiki. Para extraer los deportes, además, sigo mi manual…