Hoy en día, es fácil utilizar diferentes modelos de lenguajes grandes (LLM) a través de la interfaz web o la API pública. Pero, ¿podemos integrar perfectamente LLM en el proceso de análisis de datos y utilizar el modelo directamente desde Python o Jupyter Notebook? De hecho, podemos, y en este artículo mostraré tres formas diferentes de hacerlo. Como es habitual, todos los componentes utilizados en el artículo están disponibles de forma gratuita.
¡Entremos en ello!
1. IA de los pandas
La primera biblioteca de Python que voy a probar es IA de los pandas. Nos permite hacer preguntas sobre nuestro dataframe de Pandas en lenguaje natural. Como ejemplo de juguete, creé un pequeño marco de datos con todos los países de la UE y sus poblaciones:
import pandas as pddf = pd.DataFrame({
"Country": ['Austria', 'Belgium', 'Bulgaria', 'Croatia', 'Cyprus', 'Czech Republic', 'Denmark', 'Estonia', 'Finland',
'France', 'Germany', 'Greece', 'Hungary', 'Iceland', 'Ireland', 'Italy', 'Latvia', 'Liechtenstein', 'Lithuania',
'Luxembourg', 'Malta', 'Monaco', 'Montenegro', 'Netherlands', 'Norway', 'Poland', 'Portugal', 'Romania', 'Serbia',
'Slovakia', 'Slovenia', 'Spain', 'Sweden', 'Switzerland'],
"Population": [8_205000, 10_403000…