1sjxq99vtizfllzy6bg527g.png

Integración perfecta de Python, Pandas y LLM

12 minutos de lectura

hace 15 horas

Pandas, Imagen de Wang de piedradesempaquetar

Hoy en día, es fácil utilizar diferentes modelos de lenguajes grandes (LLM) a través de la interfaz web o la API pública. Pero, ¿podemos integrar perfectamente LLM en el proceso de análisis de datos y utilizar el modelo directamente desde Python o Jupyter Notebook? De hecho, podemos, y en este artículo mostraré tres formas diferentes de hacerlo. Como es habitual, todos los componentes utilizados en el artículo están disponibles de forma gratuita.

¡Entremos en ello!

1. IA de los pandas

La primera biblioteca de Python que voy a probar es IA de los pandas. Nos permite hacer preguntas sobre nuestro dataframe de Pandas en lenguaje natural. Como ejemplo de juguete, creé un pequeño marco de datos con todos los países de la UE y sus poblaciones:

import pandas as pd

df = pd.DataFrame({
"Country": ['Austria', 'Belgium', 'Bulgaria', 'Croatia', 'Cyprus', 'Czech Republic', 'Denmark', 'Estonia', 'Finland',
'France', 'Germany', 'Greece', 'Hungary', 'Iceland', 'Ireland', 'Italy', 'Latvia', 'Liechtenstein', 'Lithuania',
'Luxembourg', 'Malta', 'Monaco', 'Montenegro', 'Netherlands', 'Norway', 'Poland', 'Portugal', 'Romania', 'Serbia',
'Slovakia', 'Slovenia', 'Spain', 'Sweden', 'Switzerland'],
"Population": [8_205000, 10_403000…