Desde indicaciones ad hoc hasta flujos de trabajo de IA repetibles con Claude Code Skills

1. Introducción

flujo de trabajo funcionando una vez. Es mucho más difícil hacerlo repetible.

Solicitar ChatGPT o Claude para cada ejecución es rápido, pero los resultados son inconsistentes y difíciles de reproducir. Construir todo en Python o bloquear el flujo de trabajo mejora la confiabilidad, pero a menudo elimina la flexibilidad que hace que los LLM sean útiles para la exploración.

Una habilidad del Código Claude puede cerrar esta brecha. Preserva la flexibilidad del lenguaje natural, mientras que SKILL.md y los scripts incluidos proporcionan suficiente estructura para mantener el flujo de trabajo consistente.

Este enfoque funciona mejor para tareas que se repiten con pequeños cambios, donde las instrucciones en lenguaje natural son importantes y donde codificar todo agregaría complejidad innecesaria.

En mi artículo anterior, expuse cómo diseñar, crear y distribuir una habilidad de Claude Code desde cero. En este artículo, me centraré en un estudio de caso concreto para mostrar dónde una habilidad agrega valor real.

2. Caso de uso: investigación de clientes virtuales

El caso de estudio son las entrevistas personales de LLM: se utiliza un LLM para simular conversaciones con clientes para una investigación cualitativa.

La investigación de clientes es valiosa, pero costosa. Un estudio cualitativo realizado por una agencia especializada puede costar fácilmente decenas de miles de dólares.

Es por eso que cada vez más equipos recurren a los LLM como sustitutos. Podrías decirle a ChatGPT: “Eres una mujer de 25 años interesada en el cuidado de la piel” y luego pedir reacciones a un nuevo concepto. Este enfoque es rápido, gratuito y siempre está disponible.

Sin embargo, cuando intentas este enfoque en proyectos reales, surgen varios problemas. Reflejan las limitaciones fundamentales de las indicaciones ad hoc.

3. ¿Qué sale mal con las indicaciones ad hoc?

Es sencillo que un LLM interprete un personaje y responda preguntas. Los verdaderos problemas comienzan cuando intentas hacer que ese proceso sea repetible en múltiples personas, sesiones o proyectos.

Imagen por autor

En los flujos de trabajo de entrevistas personales, estos problemas aparecen rápidamente. Las respuestas en un chat compartido comienzan a anclarse en respuestas anteriores, los resultados se derivan hacia un medio genérico y el panel es difícil de reutilizar para pruebas posteriores o preguntas de seguimiento.

Es por eso que una mejor orientación por sí sola no resuelve el problema. La cuestión no es sólo la redacción. El flujo de trabajo en sí necesita estructura: definiciones estables de personas, diversidad deliberada y contextos de entrevista independientes.

4. De las indicaciones a una habilidad reutilizable

El paso clave no fue escribir un mensaje mejor. Se trataba de convertir un frágil flujo de trabajo de varios pasos en una habilidad reutilizable del Código Claude.

En lugar de repetir manualmente la configuración del panel, la generación de personajes y las instrucciones de seguimiento cada vez, ahora puedo activar todo el flujo de trabajo con un solo comando:

/persona genera 10 compradores de productos de cuidado de la piel de la Generación Z en EE. UU.

Desde la perspectiva del usuario, esto parece simple. Pero detrás de esa línea, la habilidad maneja el diseño de paneles, la generación de personajes, la validación y el empaquetado de resultados de manera repetible.

5. Qué se esconde detrás del comando

Ese único comando desencadena un flujo de trabajo, no solo un mensaje.
Detrás de escena, la habilidad hace dos cosas: define la estructura del panel y genera personajes de forma controlada. Esto nos permite realizar entrevistas virtuales en contextos aislados, de modo que los resultados puedan reutilizarse para pruebas o seguimientos posteriores.

Imagen por autor

5a. Trate a las personas como objetos estructurados

El primer cambio fue tratar a una persona como un objeto de datos estructurados, no solo como una línea de configuración conversacional. Este cambio hace que el flujo de trabajo sea más confiable y más fácil de analizar.

Un enfoque ingenuo suele verse así:

Eres un estudiante universitario de 22 años interesado en el cuidado de la piel. ¿Qué opinas de un concepto llamado “Crema Reparadora de Barrera”?

La personalidad aquí es vaga y, a medida que haces más preguntas, el personaje se desvía. En cambio, defino la persona como un objeto JSON:

Imagen por autor
Imagen por autor

Esta estructura nos permite precisar los atributos clave, para que la persona no se desvíe entre las preguntas. Dado que cada persona se almacena en un archivo JSON, puede volver a cargar el mismo panel para su próxima prueba de concepto o seguimiento.

5b. Diseñe la diversidad del panel desde el principio y valídela

El segundo cambio fue definir la diversidad del panel de clientes antes de permitir que el modelo de IA genere detalles de la persona.

Si simplemente le pide al LLM que genere 10 personas a la vez, no podrá controlar el saldo del panel. Las edades pueden agruparse demasiado estrechamente y las actitudes a menudo terminan sonando como pequeñas variaciones de la misma persona.

Así que diseñé la habilidad Claude Code para definir la combinación de actitudes desde el principio, luego generar personas dentro de esa estructura y, finalmente, validar el resultado después. Para un panel de cuidado de la piel de la Generación Z, eso podría significar una combinación planificada de devotos de la rutina, escépticos del cuidado de la piel, compradores preocupados por su presupuesto, cazadores de tendencias y compradores impulsados ​​por problemas.

Una vez establecidos los segmentos, la habilidad genera personas y luego valida la distribución tras generación.

Una elección de diseño más es importante a la hora de la entrevista: cada persona se desarrolla en un contexto aislado. Eso evita que las respuestas posteriores se basen en las anteriores y ayuda a preservar diferencias más marcadas en todo el panel.

6. Por qué una habilidad de Claude Code: no es un mensaje ni una biblioteca de Python

Las opciones de diseño anteriores se inspiraron en TinyTroupe, una biblioteca Python de Microsoft Research para la simulación de personajes multiagente impulsada por LLM. Una de sus ideas centrales es tratar a las personas como objetos en una configuración de múltiples agentes. Tomé prestado ese concepto, pero descubrí que usarlo como biblioteca de Python agregaba más fricción de la que quería para el trabajo diario. Entonces reconstruí el flujo de trabajo como una habilidad de Claude Code.

Una habilidad se adapta mejor a este flujo de trabajo que un mensaje o una biblioteca porque se encuentra en el punto medio entre flexibilidad y estructura.

comparación-flexible-estructurado
Imagen por autor
Imagen por autor

Según esta comparación, las ventajas de una habilidad del Código Claude se reducen a los puntos principales.

Sin facturación adicional. Las bibliotecas de Python que llaman a LLM, incluido TinyTroupe, requieren una clave API OpenAI o Claude separada, y hay que vigilar los costos de uso. Cuando todavía estás experimentando, ese pequeño medidor que corre al fondo crea fricción. Una habilidad de Claude Code se ejecuta dentro de la suscripción que ya tienes, por lo que escalar el panel de 10 a 20 personas no agrega gastos generales adicionales.

Los parámetros pasan como lenguaje natural. Con una biblioteca de Python, debes hacer coincidir la firma de la función, por ejemplo: factory.generate_person(context=”Un hospital en São Paulo”, rápido=”Crear un médico brasileño que ama a las mascotas”). Con una habilidad de Claude Code, puedes simplemente escribir:

/persona genera 10 compradores de productos de cuidado de la piel de la Generación Z en EE. UU.

Eso es suficiente.

SKILL.md actúa como barandilla. Las reglas para estructurar una persona, los pasos del diseño de diversidad y el flujo de trabajo general se encuentran en el archivo de instrucciones. No es necesario que vuelva a escribir el mensaje cada vez. Cualquiera que sea el tipo de usuario que escriba, el esqueleto del flujo de trabajo está protegido por la habilidad.

Así es como se ve en la práctica. Generar el panel requiere un comando en lenguaje natural:

/persona genera 10 compradores de productos de cuidado de la piel de la Generación Z en EE. UU.

Se generan y guardan diez personas diversas como objetos JSON estructurados. La distribución de segmentos y la distribución por edades se validan automáticamente. Luego, corriendo /persona pregunta ¿Qué es lo que más te frustra al elegir productos para el cuidado de la piel? entrevista a cada persona en un contexto independiente y ofrece una imagen completa de las frustraciones y necesidades del panel. Una demostración completa, que incluye pruebas de concepto y textos textuales, está disponible en la carpeta de demostración de GitHub.

7. Dónde encajan las habilidades de Claude Code y dónde no

Hay casos en los que una habilidad no es la herramienta adecuada. Las canalizaciones totalmente deterministas son mejores como código simple. La lógica que necesita auditoría o revisión regulatoria no se adapta bien a las instrucciones en lenguaje natural. Para una pregunta exploratoria única, simplemente preguntar en una ventana de chat está bien.

Una habilidad del Código Claude no se limita a instrucciones en lenguaje natural. También puedes incluir scripts de Python dentro de la habilidad. En la habilidad de persona, uso Python para la validación de la diversidad del panel y para agregar resultados. Esto le permite combinar las partes en las que desea el criterio flexible del LLM con las partes que deberían ser deterministas, todas en la misma habilidad. Eso es lo que lo diferencia de una plantilla de avisos.

La regla general es simple: cuando su flujo de trabajo necesita estructura pero la codificación completa sería demasiado pesada, una habilidad suele ser la adecuada.

8. Conclusión

Hay un término medio en el trabajo repetitivo de IA: demasiado inestable para indicaciones ad hoc, demasiado rígido para una biblioteca de Python. Una habilidad de Claude Code llena ese vacío, manteniendo la flexibilidad del lenguaje natural, mientras que SKILL.md y los scripts incluidos actúan como barreras de seguridad.

En este artículo, utilicé entrevistas de personas de LLM como estudio de caso y analicé las opciones de diseño clave detrás de ese flujo de trabajo: estructurar personas como objetos y diseñar la diversidad del panel desde el principio. Los conceptos centrales se inspiraron en la investigación TinyTroupe de Microsoft.

El SKILL.md completo, el código Python y una demostración detallada se encuentran en GitHub (claude-persona).

Conclusiones clave

Una habilidad de Claude Code se encuentra entre las indicaciones ad hoc y una biblioteca de Python. El equilibrio entre flexibilidad y barreras de seguridad lo convierte en una buena opción para empaquetar flujos de trabajo de IA que se repiten pero no son idénticos en cada ejecución. Las entrevistas de personas de LLM se vuelven mucho más confiables una vez que estructura las personas como objetos y diseña deliberadamente la diversidad a nivel de panel. Si tiene un flujo de trabajo de IA que es demasiado frágil como mensaje pero demasiado fluido para justificar una biblioteca, una habilidad de Claude Code podría ser la capa intermedia adecuada.

Si tienes preguntas o quieres compartir lo que creaste, encuéntrame en LinkedIn.

Referencias

claude-persona: github.com/takechanman1228/claude-persona TinyTroupe: github.com/microsoft/TinyTroupe Documento de TinyTroupe: Salem, P., Sim, R., Olsen, C., Saxena, P., Barcelos, R. y Ding, Y. (2025). TinyTroupe: un kit de herramientas de simulación de personas multiagente impulsado por LLM. arXiv:2507.09788 Cómo desarrollar una habilidad de Claude Code lista para producción: hacia la ciencia de datos: https://towardsdatascience.com/how-to-build-a-production-ready-claude-code-skill/