Nos complace anunciar la disponibilidad de Claude Opus 4.6, Claude Sonnet 4.6, Claude Opus 4.5, Claude Sonnet 4.5 y Claude Haiku 4.5 de Anthropic a través de la inferencia global entre regiones de Amazon Bedrock para clientes que operan en Medio Oriente. Este lanzamiento ayuda a las organizaciones de Medio Oriente a acceder a los últimos modelos Claude de Anthropic en Amazon Bedrock y, al mismo tiempo, beneficiarse del enrutamiento de inferencia global y de alta disponibilidad a través de la red de AWS. Con la inferencia global entre regiones, puede escalar las cargas de trabajo de inferencia sin problemas, mejorar la resiliencia y reducir la complejidad operativa.
Para ayudarlo a lograr la escala de sus aplicaciones de IA, Amazon Bedrock ofrece perfiles de inferencia entre regiones, una característica poderosa que las organizaciones pueden utilizar para distribuir sin problemas el procesamiento de inferencia en múltiples regiones de AWS. Esta capacidad le ayuda a obtener un mayor rendimiento mientras construye a escala y ayuda a mantener sus aplicaciones de IA generativa receptivas y confiables incluso bajo cargas pesadas. Cuando invoca un perfil de inferencia entre regiones en Amazon Bedrock, su solicitud sigue una ruta de enrutamiento inteligente. La solicitud se origina en su región de origen donde realiza la llamada API y se enruta automáticamente a una de las regiones de destino definidas en el perfil de inferencia. La inferencia entre regiones opera a través de la red segura de AWS con cifrado de extremo a extremo para los datos en tránsito.
La distinción clave es que la inferencia entre regiones no cambia el lugar donde se almacenan los datos: los datos del cliente no se almacenan en una región de destino cuando se utiliza la inferencia entre regiones; los registros administrados por el cliente (como el registro de invocación de modelos), las bases de conocimiento y las configuraciones almacenadas permanecen exclusivamente dentro de la región de origen. La solicitud de inferencia viaja a través de la red global de AWS administrada por Amazon Bedrock y las respuestas se devuelven cifradas a su aplicación en la región de origen.
En esta publicación, analizamos cómo utilizar la inferencia global entre regiones en Amazon Bedrock para modelos antrópicos de Claude en el Medio Oriente. Lo guiamos a través de las capacidades de cada variante del modelo Anthropic Claude, las ventajas clave de la inferencia global entre regiones, incluida la resiliencia mejorada, casos de uso del mundo real que puede implementar y un ejemplo de código para ayudarlo a comenzar a crear aplicaciones generativas de IA de inmediato.
Claude Opus 4.6, Claude Sonnet 4.6, Claude Opus 4.5, Claude Sonnet 4.5 y Claude Haiku 4.5 de Anthropic en Amazon Bedrock
La última generación de modelos Claude de Anthropic ya está disponible en Amazon Bedrock en las regiones de Medio Oriente (EAU) y Medio Oriente (Bahréin). El nuevo Claude Opus 4.6 ofrece capacidades avanzadas a los clientes de Amazon Bedrock, incluido un rendimiento líder en la industria para tareas de agencia, proyectos de codificación complejos y flujos de trabajo de nivel empresarial que requieren un razonamiento profundo y confiabilidad. Claude Sonnet 4.6 equilibra la inteligencia con la velocidad y la rentabilidad para aplicaciones listas para producción y tareas de varios pasos. Claude Haiku 4.5 se centra en respuestas de baja latencia para casos de uso en tiempo real, como asistentes de inteligencia artificial y generación de contenido de gran volumen. Al combinar estos modelos con la inferencia global entre regiones, puede escalar dinámicamente sus cargas de trabajo de IA en todas las regiones mientras mantiene un rendimiento óptimo. Esto ayuda a las organizaciones a seleccionar el modelo adecuado para sus requisitos específicos, ya sea priorizando la inteligencia, la velocidad o el costo, mientras se benefician de un escalamiento fluido y una disponibilidad mejorada en toda la infraestructura global.
La siguiente tabla resume los modelos disponibles y sus regiones de origen y destino.
Modelo Región de origen Región de destino Opus antrópico 4.6 me-central-1 (EAU), me-south-1 (Bahrein) Regiones comerciales Soneto antrópico 4.6 me-central-1 (EAU), me-south-1 (Bahrein) Regiones comerciales Haiku antrópico 4.5 me-central-1 (EAU), me-south-1 (Bahrein) Regiones comerciales Soneto antrópico 4.5 me-central-1 (EAU), me-south-1 (Bahréin) Regiones comerciales Anthropic Opus 4.5 me-central-1 (EAU), me-south-1 (Bahréin) Regiones comerciales
Beneficios de la inferencia global entre regiones
A medida que se acelera la adopción de la IA generativa, los clientes requieren cada vez más la capacidad de escalar las cargas de trabajo de inferencia de manera confiable y al mismo tiempo mantener un rendimiento constante. La implementación de aplicaciones de IA generativa a gran escala a menudo implica gestionar restricciones de capacidad regionales, picos de tráfico y requisitos de disponibilidad. La inferencia global entre regiones de Amazon Bedrock aborda estos desafíos al permitir que las solicitudes de inferencia se enruten automáticamente a la región óptima dentro de un perfil de inferencia global predefinido, lo que ayuda a ofrecer múltiples ventajas:
Rendimiento mejorado durante los picos de demanda: para las organizaciones de Medio Oriente, la inferencia global entre regiones proporciona una resiliencia crítica durante los períodos pico regionales, como el Ramadán, los principales eventos comerciales o los horarios comerciales de alto tráfico. El sistema enruta automáticamente las solicitudes a regiones con capacidad disponible en toda la infraestructura global, lo que garantiza que sus aplicaciones mantengan el rendimiento incluso durante picos de tráfico inesperados. Este enrutamiento dinámico se realiza sin problemas y Amazon Bedrock administra completamente el enrutamiento del tráfico. Para las aplicaciones críticas para el negocio que prestan servicio a clientes en todo el CCG y la región MENAT en general, esto significa evitar costosos tiempos de inactividad o un rendimiento degradado que podría afectar los ingresos y la confianza del cliente. Transmisión segura de datos: Amazon Bedrock administra los datos transmitidos durante las operaciones entre regiones. Los datos se cifran en tránsito entre regiones, lo que ayuda a cumplir con los estrictos requisitos de seguridad y protección de datos importantes para las organizaciones de Medio Oriente. Estrategia simplificada para varias regiones: las organizaciones ya no necesitan diseñar manualmente implementaciones complejas para varias regiones. La inferencia global entre regiones ayuda a proporcionar resiliencia de nivel empresarial sin la sobrecarga operativa de administrar múltiples puntos finales regionales. Apoyo a una rápida transformación digital: a medida que las organizaciones de Medio Oriente aceleran sus iniciativas de transformación digital alineadas con visiones nacionales (como la Visión Saudita 2030 y la Estrategia de IA de los Emiratos Árabes Unidos), la inferencia global entre regiones proporciona la escalabilidad necesaria para respaldar proyectos ambiciosos de IA sin limitaciones de capacidad. Monitoreo optimizado: Amazon CloudWatch y AWS CloudTrail continúan registrando las entradas de registro en su región de origen de Medio Oriente, lo que brinda una vista centralizada del rendimiento de su aplicación. Esta observabilidad simplificada significa que sus equipos pueden monitorear y administrar aplicaciones de IA generativa utilizando herramientas familiares de AWS, independientemente de dónde se procesen las solicitudes a nivel mundial, lo que hace que el cumplimiento y la gestión operativa sean más sencillos. Flexibilidad de cuotas bajo demanda: la inferencia global entre regiones ayuda a eliminar las limitaciones de los límites de capacidad regionales individuales. Sus cargas de trabajo pueden acceder dinámicamente a recursos en toda la infraestructura global de AWS, lo que facilita el manejo de aplicaciones de gran volumen y picos repentinos de tráfico, comunes en la economía digital de rápido crecimiento de la Región.
Con esta capacidad ahora disponible para Claude Opus 4.6, Claude Sonnet 4.6, Claude Opus 4.5, Claude Sonnet 4.5 y Claude Haiku 4.5 de Anthropic en el Medio Oriente, las organizaciones de toda la región pueden crear y escalar aplicaciones de IA generativa con mayor confianza, sabiendo que pueden acceder a resiliencia y rendimiento de nivel empresarial.
Casos de uso de inferencia global
La disponibilidad de Claude Opus 4.6, Claude Sonnet 4.6, Claude Opus 4.5, Claude Sonnet 4.5 y Claude Haiku 4.5 de Anthropic a través de la inferencia global entre regiones desbloquea una amplia gama de casos de uso para clientes en Medio Oriente, que incluyen:
Copilotos empresariales y asistentes de IA que requieren alta disponibilidad y rendimiento consistente Flujos de trabajo agentes que organizan razonamientos complejos y uso de herramientas Herramientas de productividad para desarrolladores para generación, revisión y transformación de código Aplicaciones de participación del cliente que requieren escala elástica Análisis de datos y procesamiento de documentos avanzados
Gestión de cuotas
Para ver las cuotas predeterminadas para el rendimiento entre regiones cuando se utilizan perfiles de inferencia globales, consulte los valores de solicitudes de inferencia de modelo global entre regiones por minuto y tokens de inferencia de modelo global entre regiones por minuto en las cuotas de servicio de Amazon Bedrock.
Puede solicitar, ver y administrar cuotas para el perfil de inferencia global entre regiones desde la consola de Cuotas de servicio o mediante los comandos de AWS Command Line Interface (AWS CLI) en su región de origen.
Empezando
Para comenzar a utilizar Claude Opus 4.6, Claude Sonnet 4.6, Claude Opus 4.5, Claude Sonnet 4.5 o Claude Haiku 4.5 de Anthropic con inferencia global entre regiones (por ejemplo, la región me-central-1), complete los siguientes pasos:
Verifique que su rol o usuario de AWS Identity and Access Management (IAM) tenga los permisos necesarios para invocar modelos de Amazon Bedrock mediante un perfil de inferencia entre regiones. Invoque el modelo utilizando las API de Amazon Bedrock o los SDK de AWS:
Puede monitorear el uso, el rendimiento y los costos a través de CloudWatch y AWS Cost Explorer para escalar sus aplicaciones a medida que crece la demanda.
Conclusión
Con el lanzamiento de Claude Opus 4.6, Claude Sonnet 4.6, Claude Opus 4.5, Claude Sonnet 4.5 y Claude Haiku 4.5 de Anthropic utilizando la inferencia global entre regiones de Amazon Bedrock, los clientes de Medio Oriente ahora pueden crear aplicaciones de IA generativas altamente escalables y resilientes sin la sobrecarga operativa de administrar la capacidad de inferencia regional. Estamos entusiasmados con este lanzamiento y esperamos ver cómo se utilizan estas capacidades para acelerar la innovación y ofrecer experiencias impactantes impulsadas por la IA en toda la región. Para obtener más información, consulte Introducción a la inferencia entre regiones en Amazon Bedrock.