Una nube de palabras animada muestra frecuencias absolutas de n-gramas (secuencias contiguas de elementos de muestra de texto) a lo largo del tiempo como una secuencia de imágenes en un archivo de vídeo. Él Da mayor importancia a las palabras que aparecen con más frecuencia en un texto fuente. Cuanto más grande y en negrita se muestra el ngrama, con más frecuencia aparece en el texto. Se basa en la lógica intuitiva de las nubes de palabras clásicas y agrega una perspectiva temporal a la visualización.
Dado que hoy en día muchos conjuntos de datos de texto se recopilan como observaciones de texto durante múltiples períodos, visualizar los cambios en los datos a lo largo del tiempo supone un desafío particular. En lugar de hacer tablas o gráficos resumen para muchos períodos diferentes, preparemos un vídeo MP4 que cuente la historia, atraiga a la audiencia y dé un efecto “wow” a la presentación.
Este artículo describirá la generación de nubes de palabras animadas a partir de datos de texto en Python. A continuación se muestran algunas características únicas del Biblioteca animada de WordCloud:
- Proporciona visualización de frecuencia de n-gramas de todos los idiomas del alfabeto latino.
- Limpia el conjunto de datos de texto de puntuación, números y palabras vacías incluidas en el Listas NLTK de palabras vacías
- Genera frecuencias de n-gramas anuales o mensuales.