La ingeniería rápida se ha vuelto fundamental en el desarrollo de aplicaciones avanzadas impulsadas por modelos de idiomas grandes (LLM). Como las indicaciones han crecido en la complejidad, los componentes dinámicos incorporadores, múltiples roles, datos estructurados y formatos de salida variados, las limitaciones de los enfoques de texto no estructurados se han vuelto evidentes. Microsoft lanzado Lenguaje rápido de marcado de orquestación (POML)un nuevo marco de código abierto diseñado para brindar orden, modularidad y extensibilidad para provocar ingeniería para LLM.
¿Qué es poml?
Poml es un lenguaje de marcado inspirado en HTML/XML adaptado para crear indicaciones sofisticadas, mantenibles y reutilizables de IA. Proporciona un enfoque sistemático para:
- Definición de estructura rápida utilizando componentes y roles semánticos.
- Integrando diversos tipos de datos y recursos externos.
- Desacoplar contenido de la presentación con hojas de estilo.
- Habilitación de plantillas avanzadas y lógica variable para la generación de aviso dinámico.
- Apoyo a los desarrolladores con un ecosistema de herramientas robustas.
Características del núcleo
1. Marcado rápido estructurado
POML utiliza elementos claros y semánticos, como <role>, <task>y <example>– para definir las diversas secciones lógicas de un aviso. Este diseño modular hace que las indicaciones sean legibles, mantenibles y altamente reutilizables.
xml<poml>
<role>You are a science teacher.</role>
<task>Explain gravity using the image below.</task>
<img src="https://www.marktechpost.com/2025/08/13/microsoft-releases-poml-prompt-orchestration-markup-language/gravity_diagram.png" alt="Diagram of gravity" />
<output-format>
Use simple language and keep your answer under 50 words.
</output-format>
</poml>
Este enfoque elimina los problemas de formato frágiles a menudo vistos con “espagueti rápido” y fomenta la separación limpia de las responsabilidades.
2. Manejo de datos integral
Poml permite incrustar o hacer referencia a datos externos de varios tipos:
- Documentos de texto (
<document>) - Hojas de cálculo y mesas (
<table>) - Imágenes (
<img>) - Otros formatossegún sea necesario
Esto permite una integración perfecta de materiales de referencia, conjuntos de datos de instrucción y ayudas visuales, todo dentro de la solicitud.
3. Estilización de presentación desacoplada
Inspirado en CSS, POML admite un sistema de estilo que separa el contenido de las limitaciones de formateo y salida. Los estilos se pueden especificar en <stylesheet> bloques o con atributos en línea, lo que permite modificaciones fáciles sin tocar la estructura lógica del aviso.
Por ejemplo:
xml<output-format style="verbose">
Please provide a detailed, step-by-step explanation suitable for adults.
</output-format>
Esto minimiza el riesgo de inestabilidad de salida de LLM causada por ajustes de formato inadvertidos, y hace que A/B pruebe diferentes capas de presentación sin esfuerzo.
4. Motor de plantillas integrado
POML incluye un potente motor de plantilla incorporado que soporta:
- Variables:
{{ username }} - Bucles:
for x in data - Condicionales:
if ... else - Definiciones:
<let>
Este sistema dinámico faculta a los desarrolladores para generar indicaciones programáticamente y administrar variaciones complejas a escala.
5. Ecosistema de herramientas ricas
El lenguaje está respaldado por un conjunto de herramientas de desarrollador:
- VS Extensión del código: Proporciona resalte de sintaxis, autocompletación, documentación de desplazamiento, diagnóstico y vista previa en vivo del formato rápido y la lógica, que simplifica en gran medida la depuración y el desarrollo iterativo.
- SDK: POML ofrece bibliotecas para Node.js (TypeScript/JavaScript) y Python, lo que permite una fácil integración con flujos de trabajo existentes y marcos LLM populares.
La configuración con su proveedor de LLM preferido (por ejemplo, OpenAI, Azure) también es sencillo, lo que permite pruebas y implementación rápidas.
Ejemplo: Solicitud con referencia de imagen
Un mensaje de muestra para enseñar fotosíntesis a un niño podría parecer:
xml<poml>
<role>You are a patient teacher explaining concepts to a 10-year-old.</role>
<task>Explain the concept of photosynthesis using the provided image.</task>
<img src="https://www.marktechpost.com/2025/08/13/microsoft-releases-poml-prompt-orchestration-markup-language/photosynthesis_diagram.png" alt="Diagram of photosynthesis"/>
<output-format>
Start with "Hey there, future scientist!" and keep the explanation under 100 words.
</output-format>
</poml>
Este ejemplo demuestra cuán fácilmente POML integra el contexto visual y restringe el estilo de salida en una plantilla reutilizable.
Arquitectura técnica y filosofía
POML está diseñado para incorporar el concepto de “visión de la capa” que se encuentra en el desarrollo tradicional de frontend (arquitectura MVC). El marcado define la presentación, no la lógica comercial o el acceso a los datos, habilitando la separación limpia y facilitando las indicaciones de refactorización, las variaciones de prueba y garantizar la consistencia entre los flujos de trabajo de los agentes y las pruebas automatizadas.
Instalación y comenzar
POML es de código abierto (licencia MIT) y está disponible en GitHub. Puede:
- Instale la extensión de código VS desde el mercado
- Use el node.js (
npm install pomljs) o python (pip install poml) SDKS - Consulte lo detallado Documentación de poml para sintaxis, ejemplos y guías de integración.
Conclusión
Lenguaje rápido de marcado de orquestación (POML) Aporta estructura, escalabilidad y mantenimiento muy necesarias para impulsar la ingeniería para los desarrolladores de IA. Su sintaxis modular, manejo integral de datos, estilo desacoplado, plantillas dinámicas y rico ecosistema de integración lo posicionan como un estándar prometedor para orquestar aplicaciones LLM avanzadas.
Ya sea que esté construyendo un flujo de trabajo de múltiples agentes, depurar lógica rápida compleja o desarrollar módulos de IA reutilizables para la producción, POML ofrece una nueva base poderosa que está ganando rápidamente tracción en el ecosistema LLM.
Mira el Página de Github aquí. No dude en ver nuestro Página de Github para tutoriales, códigos y cuadernos. Además, siéntete libre de seguirnos Gorjeo Y no olvides unirte a nuestro Subreddit de 100k+ ml y suscribirse a Nuestro boletín.
Asif Razzaq es el CEO de MarktechPost Media Inc .. Como empresario e ingeniero visionario, ASIF se compromete a aprovechar el potencial de la inteligencia artificial para el bien social. Su esfuerzo más reciente es el lanzamiento de una plataforma de medios de inteligencia artificial, MarktechPost, que se destaca por su cobertura profunda de noticias de aprendizaje automático y de aprendizaje profundo que es técnicamente sólido y fácilmente comprensible por una audiencia amplia. La plataforma cuenta con más de 2 millones de vistas mensuales, ilustrando su popularidad entre el público.