En mi último artículo, compartí cómo usar MCP para integrar LLM en su flujo de trabajo completo de ciencia de datos. También mencioné brevemente otro.
Una habilidad es un paquete reutilizable de instrucciones y archivos de soporte opcionales. Ayuda a la IA a manejar un flujo de trabajo recurrente de manera más confiable y consistente. Como mínimo, necesita un archivo SKILL.md que contenga metadatos (nombre y descripción) e instrucciones detalladas sobre cómo debería funcionar la habilidad. La gente suele incluirlo con scripts, plantillas y ejemplos para lograr estandarización y precisión.
En este punto, es posible que se pregunte por qué utilizamos habilidades en lugar de simplemente escribir todo directamente en el contexto del Código Claude o del Códice. Una ventaja es que las habilidades ayudan a que el contexto principal sea más breve. Al principio, la IA solo necesita cargar los metadatos livianos; puede leer las instrucciones restantes y los recursos agrupados cuando decide que la habilidad es relevante. Puede encontrar una gran colección pública de habilidades en skills.sh.
Permítanme concretar la idea con un ejemplo sencillo.
Mi ejemplo: habilidad de visualización semanal
Contexto
He estado haciendo una visualización cada semana desde 2018; si tienes curiosidad, escribí sobre mi viaje en este artículo. Este proceso es muy repetitivo y normalmente me lleva alrededor de una hora cada semana. Por tanto, lo encontré un gran candidato para la automatización con habilidades.
Flujo de trabajo sin IA
Aquí está mi rutina semanal:
Encuentre un conjunto de datos que me interese. Los sitios web a los que suelo acudir en busca de inspiración incluyen Tableau Viz of the Day, Voronoi, Economics Daily de BLS, r/dataisbeautiful, etc. Abra Tableau, juegue con los datos, encuentre ideas y cree una visualización que cuente la historia de manera intuitiva. Publicarlo en mi sitio web personal.
Flujo de trabajo de IA
Si bien el paso de búsqueda del conjunto de datos sigue siendo manual, creé dos habilidades para automatizar los pasos 2 y 3:
Una habilidad de visualización de narraciones que analiza el conjunto de datos, identifica conocimientos, sugiere tipos de visualización y genera una visualización interactiva que es intuitiva, concisa y orientada a la narración. Una habilidad de publicación de visualización que publica la visualización en mi sitio web como HTML incrustado; no voy a compartir esta, ya que es muy específica de la estructura del repositorio de mi sitio web.
A continuación se muestra un ejemplo en el que activé la habilidad de visualización de narración en Codex Desktop. Utilicé el mismo conjunto de datos de Apple Health que la última vez, le pedí a Codex que consultara los datos de la base de datos de Google BigQuery y luego usara la habilidad para generar una visualización. Pudo generar información sobre el tiempo de ejercicio anual versus las calorías quemadas y recomendar un tipo de gráfico con razonamiento y compensaciones.
Todo el proceso tomó menos de 10 minutos, y aquí está el resultado: comienza con un titular basado en información valiosa, seguido de una visualización interactiva limpia, advertencias y la fuente de datos. He estado probando la habilidad con mis últimas visualizaciones semanales y puedes encontrar más ejemplos de visualización en el repositorio de habilidades.
Cómo lo construí realmente
Ahora que hemos visto el resultado, permítame explicarle cómo construí la habilidad.
Paso 1: comience con un plan
Como compartí en mi último artículo, primero me gusta establecer un plan con IA antes de implementarlo. Aquí comencé describiendo mi flujo de trabajo de visualización semanal y mi objetivo de automatizarlo. Discutimos la pila tecnológica, los requisitos y cómo debería ser un resultado “bueno”. Esto me lleva a mi primera versión de la habilidad.
Lo bueno es que no necesita crear el archivo SKILL.md manualmente; simplemente pídale a Claude Code o Codex que cree una habilidad para su caso de uso, y podrá iniciar la versión inicial por usted (activará una habilidad para crear una habilidad).
Paso 2: probar e iterar
Sin embargo, esa primera versión solo me brindó el 10% de mi flujo de trabajo de visualización ideal: podía generar visualizaciones, pero los tipos de gráficos a menudo eran subóptimos, los estilos visuales eran inconsistentes y la conclusión principal no siempre estaba resaltada, etc.
El 90% restante requirió mejoras iterativas. Aquí hay algunas estrategias que ayudaron.
1. Compartir mi propio conocimiento
Durante los últimos ocho años, he establecido mis propias mejores prácticas y preferencias de visualización. Quería que la IA siguiera estos patrones en lugar de inventar un estilo diferente cada vez. Por lo tanto, compartí mis capturas de pantalla de visualización junto con mi guía de estilo. La IA pudo resumir los principios comunes y actualizar las instrucciones de habilidades en consecuencia.
2. Investigar recursos externos
Hay muchísimos recursos en línea sobre un buen diseño de visualización de datos. Otro paso útil que tomé fue pedirle a AI que investigara mejores estrategias de visualización a partir de fuentes conocidas y habilidades públicas similares. Esto agregó perspectivas que yo mismo no había documentado explícitamente e hizo que la habilidad fuera más escalable y sólida.
3. Aprenda de las pruebas
Las pruebas son esenciales para identificar áreas de mejora. Probé esta habilidad con más de 15 conjuntos de datos diferentes para observar cómo se comportaba y cómo se comparaba su resultado con mis propias visualizaciones. Ese proceso me ayudó a sugerir actualizaciones concretas, como:
Estandarizar las opciones de fuente y el diseño Verificar las vistas previas de escritorio y móviles para evitar la superposición de etiquetas y anotaciones Hacer que los gráficos sean comprensibles incluso sin información sobre herramientas Preguntar siempre por la fuente de datos y vincularla en la visualización…
Puede encontrar la última versión de la habilidad de visualización de historias aquí. Siéntete libre de jugar con él y cuéntame si te gusta 🙂
Conclusiones para los científicos de datos
Cuando las habilidades son útiles
Mi proyecto de visualización semanal es solo un ejemplo, pero las habilidades pueden resultar útiles en muchos flujos de trabajo recurrentes de ciencia de datos. Son especialmente valiosos cuando tienes una tarea que surge repetidamente, sigue un proceso semiestructurado, depende del conocimiento del dominio y es difícil de manejar con un solo mensaje.
Por ejemplo, investigar el movimiento de la métrica X. Probablemente ya conozca los impulsores comunes de X, por lo que siempre comienza cortando por segmentos A/B/C y verificando las métricas del embudo D y E. Este es exactamente el proceso que puede empaquetar en una habilidad, por lo que la IA sigue el mismo manual analítico e identifica la causa raíz por usted. Otro ejemplo: suponga que planea realizar un experimento en la región A y desea verificar otros experimentos que se ejecutan en la misma área. En el pasado, buscaba palabras clave en Slack, buscaba en Google Docs y abría la plataforma de experimentación interna para revisar experimentos etiquetados con la región. Ahora, puede resumir estos pasos comunes en una habilidad y pedir a los LLM que realicen una investigación exhaustiva y generen un informe de experimentos relevantes con sus objetivos, duraciones, tráfico, estados y documentos.
Si su flujo de trabajo consta de varios componentes independientes y reutilizables, debe dividirlos en habilidades independientes. En mi caso, creé dos habilidades: una para generar la visualización y otra para publicarla en mi blog. Eso hace que las piezas sean más modulares y más fáciles de reutilizar en otros flujos de trabajo más adelante.
Las habilidades y el MCP funcionan bien juntos. Utilicé BigQuery MCP y la habilidad de visualización en un solo comando y generé con éxito una visualización basada en mis conjuntos de datos en BigQuery. MCP ayuda al modelo a acceder a las herramientas externas sin problemas y la habilidad le ayuda a seguir el proceso correcto para una tarea determinada. Por tanto, esta combinación es poderosa y se complementa.
Una nota final sobre mi proyecto de visualización semanal.
Ahora que puedo automatizar el 80% de mi proceso de visualización semanal, ¿por qué sigo haciéndolo?
Cuando comencé con este hábito por primera vez en 2018, el objetivo era practicar Tableau, que era la principal herramienta de BI utilizada por mi empleador. Sin embargo, el propósito ha cambiado con el tiempo: ahora utilizo este ritual semanal para explorar diferentes conjuntos de datos que nunca encontraría en el trabajo, agudizar mi intuición sobre los datos y mi narración, y ver el mundo a través de la lente de los datos. Entonces, para mí, no se trata realmente de la herramienta, sino del proceso de descubrimiento. Y es por eso que planeo seguir haciéndolo, incluso en la era de la IA.