Presentación de la inferencia global entre regiones de Amazon Bedrock para los modelos Claude de Anthropic en las regiones de Medio Oriente (Emiratos Árabes Unidos y Bahrein)

Nos complace anunciar la disponibilidad de Claude Opus 4.6, Claude Sonnet 4.6, Claude Opus 4.5, Claude Sonnet 4.5 y Claude Haiku 4.5 de Anthropic a través de la inferencia global entre regiones de Amazon Bedrock para clientes que operan en Medio Oriente. Este lanzamiento ayuda a las organizaciones de Medio Oriente a acceder a los últimos modelos Claude de Anthropic en Amazon Bedrock y, al mismo tiempo, beneficiarse del enrutamiento de inferencia global y de alta disponibilidad a través de la red de AWS. Con la inferencia global entre regiones, puede escalar las cargas de trabajo de inferencia sin problemas, mejorar la resiliencia y reducir la complejidad operativa.

Para ayudarlo a lograr la escala de sus aplicaciones de IA, Amazon Bedrock ofrece perfiles de inferencia entre regiones, una característica poderosa que las organizaciones pueden utilizar para distribuir sin problemas el procesamiento de inferencia en múltiples regiones de AWS. Esta capacidad le ayuda a obtener un mayor rendimiento mientras construye a escala y ayuda a mantener sus aplicaciones de IA generativa receptivas y confiables incluso bajo cargas pesadas. Cuando invoca un perfil de inferencia entre regiones en Amazon Bedrock, su solicitud sigue una ruta de enrutamiento inteligente. La solicitud se origina en su región de origen donde realiza la llamada API y se enruta automáticamente a una de las regiones de destino definidas en el perfil de inferencia. La inferencia entre regiones opera a través de la red segura de AWS con cifrado de extremo a extremo para los datos en tránsito.

La distinción clave es que la inferencia entre regiones no cambia el lugar donde se almacenan los datos: los datos del cliente no se almacenan en una región de destino cuando se utiliza la inferencia entre regiones; los registros administrados por el cliente (como el registro de invocación de modelos), las bases de conocimiento y las configuraciones almacenadas permanecen exclusivamente dentro de la región de origen. La solicitud de inferencia viaja a través de la red global de AWS administrada por Amazon Bedrock y las respuestas se devuelven cifradas a su aplicación en la región de origen.

En esta publicación, analizamos cómo utilizar la inferencia global entre regiones en Amazon Bedrock para modelos antrópicos de Claude en el Medio Oriente. Lo guiamos a través de las capacidades de cada variante del modelo Anthropic Claude, las ventajas clave de la inferencia global entre regiones, incluida la resiliencia mejorada, casos de uso del mundo real que puede implementar y un ejemplo de código para ayudarlo a comenzar a crear aplicaciones generativas de IA de inmediato.

Claude Opus 4.6, Claude Sonnet 4.6, Claude Opus 4.5, Claude Sonnet 4.5 y Claude Haiku 4.5 de Anthropic en Amazon Bedrock

La última generación de modelos Claude de Anthropic ya está disponible en Amazon Bedrock en las regiones de Medio Oriente (EAU) y Medio Oriente (Bahréin). El nuevo Claude Opus 4.6 ofrece capacidades avanzadas a los clientes de Amazon Bedrock, incluido un rendimiento líder en la industria para tareas de agencia, proyectos de codificación complejos y flujos de trabajo de nivel empresarial que requieren un razonamiento profundo y confiabilidad. Claude Sonnet 4.6 equilibra la inteligencia con la velocidad y la rentabilidad para aplicaciones listas para producción y tareas de varios pasos. Claude Haiku 4.5 se centra en respuestas de baja latencia para casos de uso en tiempo real, como asistentes de inteligencia artificial y generación de contenido de gran volumen. Al combinar estos modelos con la inferencia global entre regiones, puede escalar dinámicamente sus cargas de trabajo de IA en todas las regiones mientras mantiene un rendimiento óptimo. Esto ayuda a las organizaciones a seleccionar el modelo adecuado para sus requisitos específicos, ya sea priorizando la inteligencia, la velocidad o el costo, mientras se benefician de un escalamiento fluido y una disponibilidad mejorada en toda la infraestructura global.

La siguiente tabla resume los modelos disponibles y sus regiones de origen y destino.

Modelo Región de origen Región de destino Opus antrópico 4.6 me-central-1 (EAU), me-south-1 (Bahrein) Regiones comerciales Soneto antrópico 4.6 me-central-1 (EAU), me-south-1 (Bahrein) Regiones comerciales Haiku antrópico 4.5 me-central-1 (EAU), me-south-1 (Bahrein) Regiones comerciales Soneto antrópico 4.5 me-central-1 (EAU), me-south-1 (Bahréin) Regiones comerciales Anthropic Opus 4.5 me-central-1 (EAU), me-south-1 (Bahréin) Regiones comerciales

Beneficios de la inferencia global entre regiones

A medida que se acelera la adopción de la IA generativa, los clientes requieren cada vez más la capacidad de escalar las cargas de trabajo de inferencia de manera confiable y al mismo tiempo mantener un rendimiento constante. La implementación de aplicaciones de IA generativa a gran escala a menudo implica gestionar restricciones de capacidad regionales, picos de tráfico y requisitos de disponibilidad. La inferencia global entre regiones de Amazon Bedrock aborda estos desafíos al permitir que las solicitudes de inferencia se enruten automáticamente a la región óptima dentro de un perfil de inferencia global predefinido, lo que ayuda a ofrecer múltiples ventajas:

Rendimiento mejorado durante los picos de demanda: para las organizaciones de Medio Oriente, la inferencia global entre regiones proporciona una resiliencia crítica durante los períodos pico regionales, como el Ramadán, los principales eventos comerciales o los horarios comerciales de alto tráfico. El sistema enruta automáticamente las solicitudes a regiones con capacidad disponible en toda la infraestructura global, lo que garantiza que sus aplicaciones mantengan el rendimiento incluso durante picos de tráfico inesperados. Este enrutamiento dinámico se realiza sin problemas y Amazon Bedrock administra completamente el enrutamiento del tráfico. Para las aplicaciones críticas para el negocio que prestan servicio a clientes en todo el CCG y la región MENAT en general, esto significa evitar costosos tiempos de inactividad o un rendimiento degradado que podría afectar los ingresos y la confianza del cliente. Transmisión segura de datos: Amazon Bedrock administra los datos transmitidos durante las operaciones entre regiones. Los datos se cifran en tránsito entre regiones, lo que ayuda a cumplir con los estrictos requisitos de seguridad y protección de datos importantes para las organizaciones de Medio Oriente. Estrategia simplificada para varias regiones: las organizaciones ya no necesitan diseñar manualmente implementaciones complejas para varias regiones. La inferencia global entre regiones ayuda a proporcionar resiliencia de nivel empresarial sin la sobrecarga operativa de administrar múltiples puntos finales regionales. Apoyo a una rápida transformación digital: a medida que las organizaciones de Medio Oriente aceleran sus iniciativas de transformación digital alineadas con visiones nacionales (como la Visión Saudita 2030 y la Estrategia de IA de los Emiratos Árabes Unidos), la inferencia global entre regiones proporciona la escalabilidad necesaria para respaldar proyectos ambiciosos de IA sin limitaciones de capacidad. Monitoreo optimizado: Amazon CloudWatch y AWS CloudTrail continúan registrando las entradas de registro en su región de origen de Medio Oriente, lo que brinda una vista centralizada del rendimiento de su aplicación. Esta observabilidad simplificada significa que sus equipos pueden monitorear y administrar aplicaciones de IA generativa utilizando herramientas familiares de AWS, independientemente de dónde se procesen las solicitudes a nivel mundial, lo que hace que el cumplimiento y la gestión operativa sean más sencillos. Flexibilidad de cuotas bajo demanda: la inferencia global entre regiones ayuda a eliminar las limitaciones de los límites de capacidad regionales individuales. Sus cargas de trabajo pueden acceder dinámicamente a recursos en toda la infraestructura global de AWS, lo que facilita el manejo de aplicaciones de gran volumen y picos repentinos de tráfico, comunes en la economía digital de rápido crecimiento de la Región.

Con esta capacidad ahora disponible para Claude Opus 4.6, Claude Sonnet 4.6, Claude Opus 4.5, Claude Sonnet 4.5 y Claude Haiku 4.5 de Anthropic en el Medio Oriente, las organizaciones de toda la región pueden crear y escalar aplicaciones de IA generativa con mayor confianza, sabiendo que pueden acceder a resiliencia y rendimiento de nivel empresarial.

Casos de uso de inferencia global

La disponibilidad de Claude Opus 4.6, Claude Sonnet 4.6, Claude Opus 4.5, Claude Sonnet 4.5 y Claude Haiku 4.5 de Anthropic a través de la inferencia global entre regiones desbloquea una amplia gama de casos de uso para clientes en Medio Oriente, que incluyen:

Copilotos empresariales y asistentes de IA que requieren alta disponibilidad y rendimiento consistente Flujos de trabajo agentes que organizan razonamientos complejos y uso de herramientas Herramientas de productividad para desarrolladores para generación, revisión y transformación de código Aplicaciones de participación del cliente que requieren escala elástica Análisis de datos y procesamiento de documentos avanzados

Gestión de cuotas

Para ver las cuotas predeterminadas para el rendimiento entre regiones cuando se utilizan perfiles de inferencia globales, consulte los valores de solicitudes de inferencia de modelo global entre regiones por minuto y tokens de inferencia de modelo global entre regiones por minuto en las cuotas de servicio de Amazon Bedrock.

Puede solicitar, ver y administrar cuotas para el perfil de inferencia global entre regiones desde la consola de Cuotas de servicio o mediante los comandos de AWS Command Line Interface (AWS CLI) en su región de origen.

Empezando

Para comenzar a utilizar Claude Opus 4.6, Claude Sonnet 4.6, Claude Opus 4.5, Claude Sonnet 4.5 o Claude Haiku 4.5 de Anthropic con inferencia global entre regiones (por ejemplo, la región me-central-1), complete los siguientes pasos:

Verifique que su rol o usuario de AWS Identity and Access Management (IAM) tenga los permisos necesarios para invocar modelos de Amazon Bedrock mediante un perfil de inferencia entre regiones. Invoque el modelo utilizando las API de Amazon Bedrock o los SDK de AWS:

importar boto3 importar json bedrock = boto3.client(‘bedrock-runtime’, region_name=”me-central-1″) model_id = “global.anthropic.claude-sonnet-4-6” respuesta = bedrock.converse( mensajes=[{“role”: “user”, “content”: [{“text”: “Explain cloud computing in 2 sentences.”}]}], modelId=model_id, ) print(“Respuesta:”, respuesta[‘output’][‘message’][‘content’][0][‘text’]) print(“Uso del token:”, respuesta[‘usage’]) print(“Total de tokens:”, respuesta[‘usage’][‘totalTokens’])

Puede monitorear el uso, el rendimiento y los costos a través de CloudWatch y AWS Cost Explorer para escalar sus aplicaciones a medida que crece la demanda.

Conclusión

Con el lanzamiento de Claude Opus 4.6, Claude Sonnet 4.6, Claude Opus 4.5, Claude Sonnet 4.5 y Claude Haiku 4.5 de Anthropic utilizando la inferencia global entre regiones de Amazon Bedrock, los clientes de Medio Oriente ahora pueden crear aplicaciones de IA generativas altamente escalables y resilientes sin la sobrecarga operativa de administrar la capacidad de inferencia regional. Estamos entusiasmados con este lanzamiento y esperamos ver cómo se utilizan estas capacidades para acelerar la innovación y ofrecer experiencias impactantes impulsadas por la IA en toda la región. Para obtener más información, consulte Introducción a la inferencia entre regiones en Amazon Bedrock.

Acerca de los autores

Hossam Basudan

Hossam Basudan es un arquitecto senior de soluciones especializado con sede en Dubai, Emiratos Árabes Unidos. Trabaja con clientes de AWS para capacitar e implementar de manera eficiente sus modelos básicos y de IA/ML a escala. Tiene experiencia en sistemas distribuidos y matemáticas aplicadas. A Hossam le apasiona la informática de alto rendimiento (HPC) para cargas de trabajo de IA a gran escala.

Sam Dabboussi

Sam Dabboussi es un especialista principal en comercialización con sede en Dubai y cuenta con más de una década de experiencia en ventas de tecnología y desarrollo empresarial. Ha ocupado puestos de liderazgo en empresas como Amazon Web Services, Qlik y Sophos, impulsando el crecimiento de los ingresos y las asociaciones estratégicas.

Saurabh Trikande

Saurabh Trikande es gerente senior de productos de Amazon Bedrock y Amazon SageMaker Inference. Le apasiona trabajar con clientes y socios, motivado por el objetivo de democratizar la IA. Se centra en los desafíos principales relacionados con la implementación de aplicaciones complejas de IA, la inferencia con modelos multiinquilino, la optimización de costos y hacer más accesible la implementación de modelos generativos de IA. En su tiempo libre, Saurabh disfruta hacer senderismo, aprender sobre tecnologías innovadoras, seguir TechCrunch y pasar tiempo con su familia.

Melanie Li

Melanie Li, PhD, es arquitecta sénior de soluciones especializada en IA generativa en AWS con sede en Sydney, Australia, donde se centra en trabajar con los clientes para crear soluciones utilizando herramientas de IA/ML de última generación. Ha participado activamente en múltiples iniciativas de IA generativa en APJ, aprovechando el poder de los LLM. Antes de unirse a AWS, el Dr. Li ocupó puestos de ciencia de datos en las industrias financiera y minorista.