Anthropic presenta la revisión de código a través de Claude Code para automatizar investigaciones de seguridad complejas utilizando bucles de razonamiento agentes avanzados de varios pasos

En la frenética carrera armamentista de la ‘IA para código’, hemos superado la era del glorificado autocompletado. Hoy, Anthropic apuesta por una visión más ambiciosa: el agente de IA que no solo escribe su texto estándar, sino que realmente comprende por qué su clúster de Kubernetes está gritando a las 3:00 a.m.

Con el reciente lanzamiento de Claude Code y sus capacidades de revisión de código de alto octanaje, Anthropic está señalando un cambio de “chatbot” a “colaborador”. Para los desarrolladores que se ahogan en una deuda técnica heredada, el mensaje es claro: el listón para un código “suficientemente bueno” acaba de subir mucho más.

El salto agente: más allá del análisis estático

La idea principal de esta actualización es la transición a la codificación agente. A diferencia de las herramientas tradicionales de pruebas de seguridad de análisis estático (SAST) que se basan en una coincidencia de patrones rígida, Claude Code opera como un agente con estado. Según los últimos puntos de referencia internos de Anthropic, el modelo ahora puede encadenar un promedio de 21,2 llamadas a herramientas independientes, como editar archivos, ejecutar comandos de terminal y navegar por directorios, sin necesidad de intervención humana. Eso es un aumento del 116% en autonomía en los últimos seis meses.

Esto significa que Claude no está mirando sólo un único archivo; es un razonamiento en todo su repositorio. Utiliza un archivo CLAUDE.md especializado (un “manual” para la IA) para comprender las convenciones específicas del proyecto, las dependencias de la canalización de datos y las peculiaridades de la infraestructura.

Dentro del motor de ‘Revisión de código’

Cuando ejecuta una revisión a través de Claude Code, el modelo no solo busca puntos y coma faltantes. Está realizando lo que Anthropic llama razonamiento de ciberseguridad de frontera.

Tome el piloto reciente con Firefox de Mozilla. En sólo dos semanas, Claude Opus 4.6 escaneó la enorme base de código del navegador y descubrió 22 vulnerabilidades. Lo más impresionante es que 14 de ellos fueron clasificados como de alta gravedad. Para poner esto en perspectiva: toda la comunidad global de investigación de seguridad generalmente informa alrededor de 70 errores de este tipo para Firefox en un año completo.

¿Cómo lo hace?

Razonamiento lógico sobre coincidencia de patrones: en lugar de buscar una cadena “mala”, Claude razona sobre algoritmos. En la biblioteca CGIF, descubrió un desbordamiento del búfer del montón al analizar la lógica de compresión LZW, un error que había evadido la tradicional fuzzing guiada por cobertura durante décadas. Verificación en varias etapas: cada hallazgo pasa por un ciclo de autocorrección. Claude intenta “refutar” su propio informe de vulnerabilidad para filtrar los falsos positivos que normalmente plagan las revisiones generadas por IA. Directivas de Remediación: No sólo apunta al incendio; te entrega el extintor. La herramienta sugiere parches específicos que los ingenieros pueden aprobar o iterar en tiempo real dentro de la CLI.

La pila técnica: MCP y modo de ‘aceptación automática’

Anthropic está impulsando el Protocolo de contexto modelo (MCP) como estándar sobre cómo estos agentes interactúan con sus datos. Al utilizar servidores MCP en lugar de acceso CLI sin formato para bases de datos confidenciales (como BigQuery), los equipos de desarrollo pueden mantener registros de seguridad granulares y, al mismo tiempo, permiten que Claude realice migraciones de datos complejas o depuración de infraestructura.

Una de las características clave más importantes que están causando sensación es el modo de aceptación automática (activado por Mayús+tab). Esto permite a los desarrolladores configurar bucles autónomos donde Claude escribe código, ejecuta pruebas e itera hasta que las pruebas pasan. Es una “codificación de vibraciones” de alta velocidad para la empresa, aunque Anthropic advierte que los humanos deberían seguir siendo los guardianes finales de la lógica empresarial crítica.

Conclusiones clave

El cambio hacia la autonomía agente: Hemos ido más allá de la simple finalización de código a la codificación agente. Claude Code ahora puede encadenar un promedio de 21,2 llamadas a herramientas independientes (edición de archivos, ejecución de comandos de terminal y navegación por directorios) sin intervención humana, un aumento del 116 % en autonomía en los últimos seis meses. Detección superior de vulnerabilidades: en un piloto histórico con Mozilla, Claude descubrió 22 vulnerabilidades únicas en Firefox en solo dos semanas. 14 eran de alta gravedad, lo que representa casi el 20% de los errores de alta gravedad que normalmente encuentra toda la comunidad de investigación global en un año completo. Razonamiento lógico frente a coincidencia de patrones: a diferencia de las herramientas SAST tradicionales que buscan cadenas de códigos “malos conocidos”, Claude utiliza un razonamiento de ciberseguridad de frontera. Identificó un desbordamiento del búfer de montón de décadas de antigüedad en la biblioteca CGIF mediante el análisis lógico de los algoritmos de compresión LZW, una hazaña que anteriormente había evadido la revisión humana experta y la fuzzing automatizada. Contexto estandarizado con CLAUDE.md y MCP: la integración profesional ahora se basa en el archivo CLAUDE.md para proporcionar a la IA ‘manuales’ específicos del proyecto y el Protocolo de contexto modelo (MCP) para permitir que el agente interactúe de forma segura con fuentes de datos externas como BigQuery o Snowflake sin comprometer credenciales confidenciales. El flujo de trabajo de ‘aceptación automática’: para el desarrollo de alta velocidad, el acceso directo Shift+Tab permite a los desarrolladores alternar al modo de aceptación automática. Esto permite un bucle autónomo donde el agente escribe código, ejecuta pruebas e itera hasta que se resuelve la tarea, transformando el rol del desarrollador de “escritor” a “editor/director”.

Consulte Detalles técnicos. Además, no dude en seguirnos en Twitter y no olvide unirse a nuestro SubReddit de más de 120.000 ML y suscribirse a nuestro boletín. ¡Esperar! estas en telegrama? Ahora también puedes unirte a nosotros en Telegram.

Max es un analista de inteligencia artificial en MarkTechPost, con sede en Silicon Valley, que da forma activamente al futuro de la tecnología. Enseña robótica en Brainvyne, combate el spam con ComplyEmail y aprovecha la IA a diario para traducir avances tecnológicos complejos en conocimientos claros y comprensibles.

Anthropic presenta la revisión de código a través de Claude Code para automatizar investigaciones de seguridad complejas utilizando bucles de razonamiento agentes avanzados de varios pasos

ByEquipo de 7 minutos

El salto agente: más allá del análisis estático

Dentro del motor de ‘Revisión de código’

La pila técnica: MCP y modo de ‘aceptación automática’

Conclusiones clave

By Equipo de 7 minutos

Related Post

Una implementación del kit de herramientas de gobernanza de agentes de Microsoft para el uso seguro de herramientas de agentes de IA con políticas, aprobaciones, registros de auditoría y controles de riesgos

StepFun lanza el paso 3.7 Flash: un modelo de lenguaje de visión MoE de 198 mil millones para agentes de codificación y flujos de trabajo de búsqueda

Una implementación de codificación en Loguru para diseñar tuberías de registro de Python robustas, estructuradas, concurrentes y listas para producción

You missed

Es posible que los tumores no se desarrollen aleatoriamente en todo el cerebro; las moscas de la fruta pueden ayudar a explicar el patrón

El aeropuerto de Bruselas simplificará los controles de seguridad « Euro Weekly News

Un jugador de béisbol de 12 años lucha por su vida después de un extraño accidente durante el calentamiento en Nueva Jersey

Por qué los estadounidenses han recurrido a los indultos presidenciales