Narración de datos con nubes de palabras animadas |  de Petr Korab |  noviembre de 2023

Una nube de palabras animada muestra frecuencias absolutas de n-gramas (secuencias contiguas de elementos de muestra de texto) a lo largo del tiempo como una secuencia de imágenes en un archivo de vídeo. Él Da mayor importancia a las palabras que aparecen con más frecuencia en un texto fuente. Cuanto más grande y en negrita se muestra el ngrama, con más frecuencia aparece en el texto. Se basa en la lógica intuitiva de las nubes de palabras clásicas y agrega una perspectiva temporal a la visualización.

Dado que hoy en día muchos conjuntos de datos de texto se recopilan como observaciones de texto durante múltiples períodos, visualizar los cambios en los datos a lo largo del tiempo supone un desafío particular. En lugar de hacer tablas o gráficos resumen para muchos períodos diferentes, preparemos un vídeo MP4 que cuente la historia, atraiga a la audiencia y dé un efecto “wow” a la presentación.

Este artículo describirá la generación de nubes de palabras animadas a partir de datos de texto en Python. A continuación se muestran algunas características únicas del Biblioteca animada de WordCloud:

  • Proporciona visualización de frecuencia de n-gramas de todos los idiomas del alfabeto latino.
  • Limpia el conjunto de datos de texto de puntuación, números y palabras vacías incluidas en el Listas NLTK de palabras vacías
  • Genera frecuencias de n-gramas anuales o mensuales.