La adopción e implementación de la inferencia generativa de IA ha aumentado a medida que las organizaciones crean más cargas de trabajo operativas que utilizan capacidades de IA en la producción a escala. Para ayudar a los clientes a alcanzar la escala de sus aplicaciones de IA generativa, Amazon Bedrock ofrece perfiles de inferencia entre regiones (CRIS). CRIS es una característica poderosa que las organizaciones pueden utilizar para distribuir sin problemas el procesamiento de inferencia en múltiples regiones de AWS. Esta capacidad le ayuda a obtener un mayor rendimiento mientras construye a escala y ayuda a mantener sus aplicaciones de IA generativa receptivas y confiables incluso bajo cargas pesadas.
Nos complace presentar la inferencia global entre regiones para Amazon Bedrock y llevar los modelos Anthropic Claude a la India. Amazon Bedrock ahora ofrece Claude Opus 4.6, Claude Sonnet 4.6 y Claude Haiku 4.5 de Anthropic a través de la inferencia global entre regiones (CRIS) de Amazon Bedrock para clientes que operan en India. Estos modelos de frontera ofrecen una enorme ventana de contexto de 1 millón de tokens y capacidades de agente avanzadas, lo que permite que sus aplicaciones procesen grandes conjuntos de datos y flujos de trabajo complejos con una velocidad e inteligencia sin precedentes. Con este lanzamiento, los clientes que utilizan ap-south-1 (Mumbai) y ap-south-2 (Hyderabad) pueden acceder a los últimos modelos Claude de Anthropic en Amazon Bedrock mientras se benefician de la capacidad de inferencia global y de la inferencia de alta disponibilidad administrada por Amazon Bedrock. Con CRIS global, los clientes pueden escalar las cargas de trabajo de inferencia sin problemas, mejorar la resiliencia y reducir la complejidad operativa. En esta publicación, descubrirá cómo utilizar la inferencia global entre regiones de Amazon Bedrock para los modelos Claude en India. Lo guiaremos a través de las capacidades de cada variante del modelo Claude y cómo comenzar con un ejemplo de código para ayudarlo a comenzar a crear aplicaciones de IA generativa de inmediato.
Funcionalidad principal de la inferencia global entre regiones
La inferencia global entre regiones ayuda a las organizaciones a gestionar ráfagas de tráfico no planificadas mediante el uso de recursos informáticos en toda la capacidad de inferencia en las regiones comerciales de AWS (regiones distintas de las regiones de AWS GovCloud (EE. UU.) y las regiones de China) a nivel mundial. Esta sección explora cómo funciona la función de inferencia global entre regiones y los mecanismos técnicos que impulsan su funcionalidad.
Comprender los perfiles de inferencia
La inferencia global entre regiones se ofrece a través de perfiles de inferencia. Los perfiles de inferencia operan sobre dos conceptos clave:
Región de origen: la región desde la que se realiza la solicitud de API. Región de destino: una región a la que Amazon Bedrock puede enrutar la solicitud de inferencia.
Para utilizar modelos antrópicos, Amazon Bedrock ofrece perfiles de inferencia global listos para usar. Por ejemplo:
Opus 4.6: Soneto 4.6: Opus 4.5: <0/><0/><0/>
‘
–’–
‘
—
‘
–
‘
–––––
‘
‘
”
‘