Agenteql Le permite raspar cualquier sitio web con datos no estructurados definiendo la forma exacta de la información que desea. Le brinda resultados consistentes y estructurados, incluso de páginas con contenido dinámico o con frecuencia cambiando diseños.
En este tutorial, implementaremos un servidor MCP AgentQL dentro del escritorio de Claude, y usaremos las capacidades de visualización incorporadas de Claude para explorar los datos. Específicamente, rasparemos una página de resultados de búsqueda de Amazon para Libros de IAextrayendo detalles como precio, calificación y número de revisiones.
Paso 1: Configuración de dependencias
Nodo JS
Necesitamos NPX para ejecutar el servidor AgentQL, que viene con Node.js.
- Descargue la última versión de Node.js desde nodejs.org
- Ejecute el instalador.
- Deje todas las configuraciones de manera predeterminada y complete la instalación
Claude Desktop
Descargar Claude usando https://claude.ai/download.
API AGENTEQL
Crea tu tecla API AgentQL en dev.agentql.com/api-keys Y guárdelo de forma segura: lo necesitará más adelante en este tutorial.
Paso 2: Instalación de los paquetes
Una vez que se instale Node.js, abra su terminal y ejecute el siguiente comando:
npm install -g agentql-mcp
Paso 3: Configuración del servidor MCP
A continuación, configure Claude para conectarse a su servidor MCP. Abrir el Claude_desktop_config.json Archivo ubicado en el directorio de instalación de Claude utilizando cualquier editor de texto. Si el archivo no existe, puede crearlo manualmente. Una vez abierto, ingrese el siguiente código:
{
"mcpServers": {
"agentql": {
"command": "npx",
"args": ["-y", "agentql-mcp"],
"env": {
"AGENTQL_API_KEY": "<YOUR_API_KEY>"
}
}
}
}
Reemplace
Paso 4: Ejecutando el servidor
Una vez que se completa la configuración de MCP, su servidor debe aparecer en Claude. El servidor AgentQL incluye una sola herramienta potente, Extract_Web_Data, que toma una URL y una descripción del lenguaje natural de la estructura de datos que desea extraer.
Puede usar cualquier URL que desee raspar. Para este tutorial, utilicé una página de resultados de búsqueda de Amazon para libros de IA y le pedí a Claude que visualizara los datos extraídos. Claude proporciona un terminal interactivo donde genera código para procesar y visualizar los datos, y puede editar ese código según sea necesario. Una vez que se finalizó el código, Claude presentó un gráfico de barras con opciones interactivas para explorar precios, calificaciones, recuentos de revisión e incluso una gráfica de dispersión de precio versus calificación, junto con estadísticas de resumen clave.
Agentql se puede usar para raspar sitios web, y podemos conectarlo con otros servidores como noción o github para enviar automáticamente datos estructurados para la documentación, el seguimiento o la automatización adicional.
Esto hace que AgentQL sea una herramienta poderosa para convertir el contenido web no estructurado en ideas procesables, todo dentro de un flujo de trabajo de lenguaje natural simple.
Aquí hay una breve descripción de lo que estamos construyendo en MarkTechPost:
