El modelo tabular grande NEXUS de Fundamental ya está disponible en Amazon SageMaker JumpStart

Hoy anunciamos compatibilidad con el modelo NEXUS de Fundamental en Amazon SageMaker AI. Con este lanzamiento, puede implementar un modelo básico (FM) diseñado específicamente para la predicción de datos tabulares. Este modelo ayuda a su empresa a generar predicciones deterministas y precisas a partir de datos estructurados en días en lugar de meses.

En esta publicación, le mostramos cómo comenzar con NEXUS en Amazon SageMaker JumpStart, recorrer el proceso de implementación y demostrar cómo ejecutar predicciones en sus conjuntos de datos empresariales.

¿Qué es NEXO?

NEXUS es un modelo básico desarrollado por Fundamental y creado para la predicción de datos tabulares. Los modelos de lenguaje grande (LLM) están diseñados para texto, y los enfoques tradicionales de aprendizaje automático (ML) requieren una amplia ingeniería de funciones y capacitación de modelos. NEXUS adopta un enfoque diferente. Está previamente entrenado en miles de millones de tareas de predicción del mundo real en conjuntos de datos estructurados, por lo que llega sabiendo cómo encontrar señales en sus datos.

Como modelo tabular grande, NEXUS está diseñado para el análisis de datos estructurados y ofrece estas innovaciones clave:

Arquitectura determinista: los LLM probabilísticos pueden proporcionar diferentes respuestas a consultas idénticas. NEXUS produce resultados consistentes y reproducibles para cada predicción individual. Comprensión tabular nativa: capacitado en miles de millones de tablas, NEXUS procesa de forma nativa números, categorías, fechas y texto no estructurado sin ingeniería de funciones manual. Razonamiento no secuencial: la mayoría de los modelos de IA predicen datos secuenciales (por ejemplo, la siguiente palabra o el siguiente píxel). NEXUS analiza relaciones multidimensionales en tablas empresariales. Por ejemplo, al predecir la deserción de clientes, NEXUS comprende cómo múltiples factores (frecuencia de transacciones, tickets de soporte e indicadores económicos) impactan la probabilidad de deserción.

¿Por qué los enfoques existentes no son suficientes?

Los datos empresariales más valiosos se encuentran en tablas como hojas de cálculo, sistemas de planificación de recursos empresariales (ERP), sistemas de gestión de relaciones con el cliente (CRM) y bases de datos relacionales. Muchas decisiones comerciales críticas dependen de las predicciones realizadas en función de estos datos. Sin embargo, las herramientas actuales tienen limitaciones importantes:

El aprendizaje automático tradicional requiere de 3 a 6 meses para que los equipos de científicos de datos creen, entrenen e implementen un modelo para un único caso de uso. Se enfrenta a un equilibrio constante entre calidad y cantidad de predicciones. Los LLM no son deterministas y producen diferentes respuestas en el mismo conjunto de datos. Pierden contexto numérico durante la tokenización, lo que genera resultados inexactos en datos estructurados y requiere barreras de seguridad complejas para mitigar estos problemas.

NEXUS está diseñado para datos tabulares y ofrece ventajas como las siguientes:

Invariancia de permutación: reconoce que cambiar el orden de las columnas no cambia el significado, lo que difiere de cómo los transformadores manejan los datos. Capacidad de mil millones de filas: procesa conjuntos de datos masivos sin truncamiento ni muestreo. Razonamiento entre esquemas: conecta automáticamente datos relacionados entre tablas dispares. Limpieza de datos autónoma: resuelve entradas incompletas (por ejemplo, NEXUS aún puede hacer predicciones incluso cuando faltan entradas).

Cómo funciona NEXUS en Amazon SageMaker AI

La siguiente figura ilustra el flujo de un extremo a otro para implementar y ejecutar predicciones con NEXUS en SageMaker AI.

NEXUS se ejecuta en una instancia de GPU dedicada, de un solo inquilino y aislada en la red dentro del entorno administrado por SageMaker AI. El flujo de trabajo consta de los siguientes pasos:

Suscríbase e implemente: suscríbase al paquete del modelo NEXUS en AWS Marketplace, luego impleméntelo como un punto final de inferencia administrado por SageMaker AI en una instancia ml.p5en.48xlarge (8 × GPU NVIDIA H200). Instale el SDK: instale el SDK de Python fundamental y conéctelo a su punto final de SageMaker. El SDK proporciona una API familiar compatible con scikit-learn con estimadores NEXUSClassifier y NEXUSRegressor. Cargue datos en Amazon S3: el SDK serializa sus datos tabulares y los carga en un depósito de Amazon Simple Storage Service (Amazon S3) en su cuenta. Entrene un modelo: llame a clf.fit(X_train, y_train) para entrenar. NEXUS maneja la limpieza de datos y la ingeniería de funciones automáticamente, sin necesidad de canalización manual. Generar predicciones: llame a clf.predict(X_test) para predicciones deterministas o a clf.predict_proba(X_test) para estimaciones de probabilidad. Los resultados se almacenan nuevamente en su depósito de Amazon S3.

Sus datos permanecen en su entorno de AWS durante todo este proceso. El punto final está aislado de la red y es de un solo inquilino, lo que hace que NEXUS sea adecuado para cargas de trabajo empresariales con datos confidenciales.

Comience con NEXUS en Amazon SageMaker AI

Para comenzar, navegue hasta Amazon SageMaker JumpStart, busque Fundamental NEXUS y elija entre las siguientes opciones:

Modelo base (preentrenado en más de 10B filas tabulares). Variantes específicas de la industria (finanzas, atención médica y manufactura).

Página de resultados de búsqueda de Amazon SageMaker JumpStart que muestra la lista de modelos Fundamental NEXUS.

Página de detalles del modelo JumpStart de Amazon SageMaker para Fundamental NEXUS, que muestra la descripción del modelo y las opciones de implementación.

Casos de uso empresarial que transforman industrias

Los datos tabulares son la columna vertebral de la toma de decisiones empresariales, desde los libros financieros hasta los registros de pacientes y los registros de la cadena de suministro. NEXUS está diseñado específicamente para estos datos y lo ayuda a pasar de datos estructurados sin procesar a predicciones de nivel de producción sin una extensa ingeniería de funciones o capacitación de modelos. Los siguientes son algunos casos de uso representativos en los que NEXUS puede crear valor.

Servicios financieros

Detección de fraude: analiza patrones de transacciones en millones de cuentas. Modelado de riesgo crediticio: procesa carteras de préstamos con extracción automatizada de características. Cumplimiento normativo: extrae datos estructurados de presentaciones regulatorias no estructuradas.

Cuidado de la salud

Coincidencia de ensayos clínicos: identifica pacientes elegibles a través de sistemas de registros médicos electrónicos (EHR). Descubrimiento de fármacos: analiza datos de ensayos biológicos para la detección de compuestos. Estratificación del riesgo del paciente: predice los riesgos de reingreso utilizando datos de series temporales de la unidad de cuidados intensivos (UCI).

Cadena de fabricación y suministro

Mantenimiento predictivo: pronostica fallas de equipos a partir de datos de sensores. Previsión de la demanda: anticipa las necesidades de inventario en las redes de distribución globales. Análisis de riesgos de proveedores: evalúa la confiabilidad de los proveedores utilizando el historial de adquisiciones.

Comercio minorista y comercio electrónico

Predicción de abandono: identifica clientes en riesgo mediante el historial de compras y el comportamiento de navegación. Precios dinámicos: optimiza los precios en función de los datos de la competencia y los niveles de inventario. Análisis de abandono de carrito: le ayuda a comprender por qué los clientes dejan artículos en los carritos en línea.

Por qué elegir NEXUS en Amazon SageMaker AI

Implementar un modelo es solo la mitad de la ecuación. La infraestructura en la que lo ejecuta determina la rapidez con la que puede pasar de la experimentación a la producción. SageMaker AI proporciona un entorno administrado, seguro y escalable para ejecutar NEXUS a escala empresarial. Juntos, NEXUS y AWS reducen el trabajo pesado indiferenciado para que sus científicos de datos puedan centrarse en los resultados comerciales en lugar de en la gestión de la infraestructura.

Tiempo de obtención de valor acelerado: los scripts y contenedores prediseñados reducen el tiempo de implementación. Eficiencia de costos: la infraestructura administrada de SageMaker AI reduce los gastos operativos. Escalabilidad: escala automáticamente a conjuntos de datos a escala de petabytes. Listo para el cumplimiento: cumple con los requisitos GDPR, HIPAA y SOC 2 de forma predeterminada. Aprendizaje continuo: integración nativa con Amazon SageMaker Pipelines para el reentrenamiento de modelos. Soporte multiplex: admite múltiples operaciones de ajuste y predicción en un único punto final de SageMaker AI, lo que elimina la necesidad de recursos dedicados para cada caso de uso.

Asociación estratégica con AWS

Fundamental ha firmado una asociación estratégica con AWS para acelerar la adopción empresarial:

Integración nativa: implemente NEXUS directamente desde AWS Marketplace. Infraestructura segura: se ejecuta en el entorno de nube seguro y compatible con AWS. Soporte empresarial: arquitectos de soluciones de AWS dedicados para orientación sobre la implementación.

Próximos pasos

¿Listo para transformar sus decisiones basadas en datos?

Conclusión

En esta publicación, mostramos cómo la compatibilidad con el modelo NEXUS en Amazon SageMaker AI le ayuda a desbloquear nuevos conocimientos a partir de sus activos de datos estructurados. Ya sea que esté prediciendo fallas de equipos, optimizando cadenas de suministro o detectando fraude financiero, NEXUS proporciona capacidades deterministas y escalables para sus cargas de trabajo de predicción empresarial.

Para obtener más información, consulte los siguientes recursos:

Sobre los autores

Vivek Gangasani

Vivek es líder mundial en arquitectura de soluciones, SageMaker Inference. Dirige la arquitectura de soluciones, la comercialización técnica (GTM) y la estrategia de productos salientes para SageMaker Inference. También ayuda a empresas y nuevas empresas a implementar y optimizar modelos GenAI y a crear flujos de trabajo de IA con SageMaker y GPU. Actualmente, se centra en desarrollar estrategias y contenidos para optimizar el rendimiento de la inferencia y casos de uso como flujos de trabajo Agentic, RAG, etc.

Hazim Qudah

Hazim es arquitecto de soluciones especializado en IA/ML en Amazon Web Services. Le gusta ayudar a los clientes a crear y adoptar soluciones de IA/ML utilizando tecnologías y mejores prácticas de AWS. Antes de ocupar su puesto en AWS, pasó muchos años realizando consultoría tecnológica con clientes de muchas industrias y geografías. ¡En su tiempo libre le gusta correr y jugar con sus perros!

Jimmy Shah

Jimmy es especialista principal de SageMaker AI en AWS. Es parte del equipo que lidera la gestión de productos salientes y la estrategia técnica de comercialización (GTM) para SageMaker AI, con un enfoque en el segmento de servicios financieros. Actualmente, se centra en el desarrollo de estrategias y contenidos para el ajuste y la implementación de SLM, IA agente y casos de uso de optimización de inferencia.