Acceda a modelos antrópicos de Claude en India en Amazon Bedrock con inferencia global entre regiones

La adopción e implementación de la inferencia generativa de IA ha aumentado a medida que las organizaciones crean más cargas de trabajo operativas que utilizan capacidades de IA en la producción a escala. Para ayudar a los clientes a alcanzar la escala de sus aplicaciones de IA generativa, Amazon Bedrock ofrece perfiles de inferencia entre regiones (CRIS). CRIS es una característica poderosa que las organizaciones pueden utilizar para distribuir sin problemas el procesamiento de inferencia en múltiples regiones de AWS. Esta capacidad le ayuda a obtener un mayor rendimiento mientras construye a escala y ayuda a mantener sus aplicaciones de IA generativa receptivas y confiables incluso bajo cargas pesadas.

Nos complace presentar la inferencia global entre regiones para Amazon Bedrock y llevar los modelos Anthropic Claude a la India. Amazon Bedrock ahora ofrece Claude Opus 4.6, Claude Sonnet 4.6 y Claude Haiku 4.5 de Anthropic a través de la inferencia global entre regiones (CRIS) de Amazon Bedrock para clientes que operan en India. Estos modelos de frontera ofrecen una enorme ventana de contexto de 1 millón de tokens y capacidades de agente avanzadas, lo que permite que sus aplicaciones procesen grandes conjuntos de datos y flujos de trabajo complejos con una velocidad e inteligencia sin precedentes. Con este lanzamiento, los clientes que utilizan ap-south-1 (Mumbai) y ap-south-2 (Hyderabad) pueden acceder a los últimos modelos Claude de Anthropic en Amazon Bedrock mientras se benefician de la capacidad de inferencia global y de la inferencia de alta disponibilidad administrada por Amazon Bedrock. Con CRIS global, los clientes pueden escalar las cargas de trabajo de inferencia sin problemas, mejorar la resiliencia y reducir la complejidad operativa. En esta publicación, descubrirá cómo utilizar la inferencia global entre regiones de Amazon Bedrock para los modelos Claude en India. Lo guiaremos a través de las capacidades de cada variante del modelo Claude y cómo comenzar con un ejemplo de código para ayudarlo a comenzar a crear aplicaciones de IA generativa de inmediato.

Funcionalidad principal de la inferencia global entre regiones

La inferencia global entre regiones ayuda a las organizaciones a gestionar ráfagas de tráfico no planificadas mediante el uso de recursos informáticos en toda la capacidad de inferencia en las regiones comerciales de AWS (regiones distintas de las regiones de AWS GovCloud (EE. UU.) y las regiones de China) a nivel mundial. Esta sección explora cómo funciona la función de inferencia global entre regiones y los mecanismos técnicos que impulsan su funcionalidad.

Comprender los perfiles de inferencia

La inferencia global entre regiones se ofrece a través de perfiles de inferencia. Los perfiles de inferencia operan sobre dos conceptos clave:

Región de origen: la región desde la que se realiza la solicitud de API. Región de destino: una región a la que Amazon Bedrock puede enrutar la solicitud de inferencia.

Para utilizar modelos antrópicos, Amazon Bedrock ofrece perfiles de inferencia global listos para usar. Por ejemplo:

Opus 4.6: Soneto 4.6: Opus 4.5: <0/><0/><0/>

–’–


Página de descripción general del perfil de inferencia de Amazon Bedrock para Global Anthropic Claude Opus 4.6, que muestra su estado como Activo, ID del perfil de inferencia, tipo definido por el sistema y disponibilidad en todas las regiones comerciales de AWS.

–––
––

Página de configuración de Amazon Bedrock para configurar el registro de invocación de modelos, con CloudWatch Logs seleccionado como destino, todos los tipos de datos habilitados (texto, imagen, incrustación, video) y una nueva función de servicio creada denominada bedrock-model-invocation-logging-role.

Panel de observabilidad de CloudWatch GenAI que muestra las métricas de invocación del modelo de Amazon Bedrock durante 12 horas, incluido el recuento de invocaciones, la latencia, el recuento de tokens de entrada y salida por modelo y la distribución de solicitudes por rango de tokens de entrada.

Panel de control de invocaciones del modelo de observabilidad de CloudWatch GenAI que muestra 82 registros de invocaciones del 3 al 4 de marzo de 2026, con gráficos de recuento de errores que muestran picos de errores de clientes y servidores, y una tabla detallada de invocaciones individuales que incluyen latencia, recuentos de tokens e ID de modelos.

Página de almacenes de datos de eventos de AWS CloudTrail Lake que ilustra un flujo de trabajo de cuatro pasos: crear almacenes de datos de eventos, ejecutar consultas SQL,, opcionalmente, agregar integraciones y, opcionalmente, copiar eventos de seguimiento en Lake.

Paso 1 del asistente de configuración del almacén de datos de eventos de AWS CloudTrail Lake, que muestra los campos de configuración para el nombre de la tienda, la opción de precio (retención ampliable de un año seleccionada), el período de retención (1 año), el cifrado, la federación de consultas de Lake, la política de recursos y las etiquetas.

Asistente de configuración del almacén de datos de eventos de AWS CloudTrail Lake Paso 2 para elegir eventos, con los eventos de administración de AWS CloudTrail seleccionados, la recopilación de eventos simple habilitada, todos los eventos registrados y la captura de eventos de Insights desactivada.

Asistente de configuración del almacén de datos de eventos de AWS CloudTrail Lake Paso 3 (opcional) para enriquecer eventos, que muestra opciones para agregar hasta 50 claves de etiquetas de recursos y claves de condición global de IAM, y una casilla de verificación para expandir el tamaño del evento de 256 KB a 1 MB.

Revisión final del asistente de configuración del almacén de datos de eventos de AWS CloudTrail Lake que muestra Ampliar tamaño del evento como No habilitado, con un botón Crear almacén de datos de eventos para completar la configuración.

AWS CloudTrail Lake Query Editor que muestra un generador de consultas en lenguaje natural y una consulta SQL generada que recupera eventos de invocación del modelo de Amazon Bedrock, incluida la región de inferencia de adicionalEventData, con resultados de consulta de muestra mostrados.

Interfaz de consulta de AWS que muestra una consulta SQL que filtra eventos de invocación de Amazon Bedrock para el 6 de noviembre de 2025, con una tabla de resultados que muestra eventTime, awsRegion, inferenceRegion, eventName, userArn y requestId, destacando el enrutamiento de inferencia entre regiones.

Pavan Kumar Rao Navule

Odio Sudhanshu

—’—