Hoy anunciamos compatibilidad con el modelo NEXUS de Fundamental en Amazon SageMaker AI. Con este lanzamiento, puede implementar un modelo básico (FM) diseñado específicamente para la predicción de datos tabulares. Este modelo ayuda a su empresa a generar predicciones deterministas y precisas a partir de datos estructurados en días en lugar de meses.
En esta publicación, le mostramos cómo comenzar con NEXUS en Amazon SageMaker JumpStart, recorrer el proceso de implementación y demostrar cómo ejecutar predicciones en sus conjuntos de datos empresariales.
¿Qué es NEXO?
NEXUS es un modelo básico desarrollado por Fundamental y creado para la predicción de datos tabulares. Los modelos de lenguaje grande (LLM) están diseñados para texto, y los enfoques tradicionales de aprendizaje automático (ML) requieren una amplia ingeniería de funciones y capacitación de modelos. NEXUS adopta un enfoque diferente. Está previamente entrenado en miles de millones de tareas de predicción del mundo real en conjuntos de datos estructurados, por lo que llega sabiendo cómo encontrar señales en sus datos.
Como modelo tabular grande, NEXUS está diseñado para el análisis de datos estructurados y ofrece estas innovaciones clave:
Arquitectura determinista: los LLM probabilísticos pueden proporcionar diferentes respuestas a consultas idénticas. NEXUS produce resultados consistentes y reproducibles para cada predicción individual. Comprensión tabular nativa: capacitado en miles de millones de tablas, NEXUS procesa de forma nativa números, categorías, fechas y texto no estructurado sin ingeniería de funciones manual. Razonamiento no secuencial: la mayoría de los modelos de IA predicen datos secuenciales (por ejemplo, la siguiente palabra o el siguiente píxel). NEXUS analiza relaciones multidimensionales en tablas empresariales. Por ejemplo, al predecir la deserción de clientes, NEXUS comprende cómo múltiples factores (frecuencia de transacciones, tickets de soporte e indicadores económicos) impactan la probabilidad de deserción.
¿Por qué los enfoques existentes no son suficientes?
Los datos empresariales más valiosos se encuentran en tablas como hojas de cálculo, sistemas de planificación de recursos empresariales (ERP), sistemas de gestión de relaciones con el cliente (CRM) y bases de datos relacionales. Muchas decisiones comerciales críticas dependen de las predicciones realizadas en función de estos datos. Sin embargo, las herramientas actuales tienen limitaciones importantes:
El aprendizaje automático tradicional requiere de 3 a 6 meses para que los equipos de científicos de datos creen, entrenen e implementen un modelo para un único caso de uso. Se enfrenta a un equilibrio constante entre calidad y cantidad de predicciones. Los LLM no son deterministas y producen diferentes respuestas en el mismo conjunto de datos. Pierden contexto numérico durante la tokenización, lo que genera resultados inexactos en datos estructurados y requiere barreras de seguridad complejas para mitigar estos problemas.
NEXUS está diseñado para datos tabulares y ofrece ventajas como las siguientes:
Invariancia de permutación: reconoce que cambiar el orden de las columnas no cambia el significado, lo que difiere de cómo los transformadores manejan los datos. Capacidad de mil millones de filas: procesa conjuntos de datos masivos sin truncamiento ni muestreo. Razonamiento entre esquemas: conecta automáticamente datos relacionados entre tablas dispares. Limpieza de datos autónoma: resuelve entradas incompletas (por ejemplo, NEXUS aún puede hacer predicciones incluso cuando faltan entradas).
Cómo funciona NEXUS en Amazon SageMaker AI
La siguiente figura ilustra el flujo de un extremo a otro para implementar y ejecutar predicciones con NEXUS en SageMaker AI.
NEXUS se ejecuta en una instancia de GPU dedicada, de un solo inquilino y aislada en la red dentro del entorno administrado por SageMaker AI. El flujo de trabajo consta de los siguientes pasos:
Suscríbase e implemente: suscríbase al paquete del modelo NEXUS en AWS Marketplace, luego impleméntelo como un punto final de inferencia administrado por SageMaker AI en una instancia ml.p5en.48xlarge (8 × GPU NVIDIA H200). Instale el SDK: instale el SDK de Python fundamental y conéctelo a su punto final de SageMaker. El SDK proporciona una API familiar compatible con scikit-learn con estimadores NEXUSClassifier y NEXUSRegressor. Cargue datos en Amazon S3: el SDK serializa sus datos tabulares y los carga en un depósito de Amazon Simple Storage Service (Amazon S3) en su cuenta. Entrene un modelo: llame a clf.fit(X_train, y_train) para entrenar. NEXUS maneja la limpieza de datos y la ingeniería de funciones automáticamente, sin necesidad de canalización manual. Generar predicciones: llame a clf.predict(X_test) para predicciones deterministas o a clf.predict_proba(X_test) para estimaciones de probabilidad. Los resultados se almacenan nuevamente en su depósito de Amazon S3.
Sus datos permanecen en su entorno de AWS durante todo este proceso. El punto final está aislado de la red y es de un solo inquilino, lo que hace que NEXUS sea adecuado para cargas de trabajo empresariales con datos confidenciales.
Comience con NEXUS en Amazon SageMaker AI
Para comenzar, navegue hasta Amazon SageMaker JumpStart, busque Fundamental NEXUS y elija entre las siguientes opciones:
Modelo base (preentrenado en más de 10B filas tabulares). Variantes específicas de la industria (finanzas, atención médica y manufactura).
Casos de uso empresarial que transforman industrias
Los datos tabulares son la columna vertebral de la toma de decisiones empresariales, desde los libros financieros hasta los registros de pacientes y los registros de la cadena de suministro. NEXUS está diseñado específicamente para estos datos y lo ayuda a pasar de datos estructurados sin procesar a predicciones de nivel de producción sin una extensa ingeniería de funciones o capacitación de modelos. Los siguientes son algunos casos de uso representativos en los que NEXUS puede crear valor.
Servicios financieros
Detección de fraude: analiza patrones de transacciones en millones de cuentas. Modelado de riesgo crediticio: procesa carteras de préstamos con extracción automatizada de características. Cumplimiento normativo: extrae datos estructurados de presentaciones regulatorias no estructuradas.
Cuidado de la salud
Coincidencia de ensayos clínicos: identifica pacientes elegibles a través de sistemas de registros médicos electrónicos (EHR). Descubrimiento de fármacos: analiza datos de ensayos biológicos para la detección de compuestos. Estratificación del riesgo del paciente: predice los riesgos de reingreso utilizando datos de series temporales de la unidad de cuidados intensivos (UCI).
Cadena de fabricación y suministro
Mantenimiento predictivo: pronostica fallas de equipos a partir de datos de sensores. Previsión de la demanda: anticipa las necesidades de inventario en las redes de distribución globales. Análisis de riesgos de proveedores: evalúa la confiabilidad de los proveedores utilizando el historial de adquisiciones.
Comercio minorista y comercio electrónico
Predicción de abandono: identifica clientes en riesgo mediante el historial de compras y el comportamiento de navegación. Precios dinámicos: optimiza los precios en función de los datos de la competencia y los niveles de inventario. Análisis de abandono de carrito: le ayuda a comprender por qué los clientes dejan artículos en los carritos en línea.
Por qué elegir NEXUS en Amazon SageMaker AI
Implementar un modelo es solo la mitad de la ecuación. La infraestructura en la que lo ejecuta determina la rapidez con la que puede pasar de la experimentación a la producción. SageMaker AI proporciona un entorno administrado, seguro y escalable para ejecutar NEXUS a escala empresarial. Juntos, NEXUS y AWS reducen el trabajo pesado indiferenciado para que sus científicos de datos puedan centrarse en los resultados comerciales en lugar de en la gestión de la infraestructura.
Tiempo de obtención de valor acelerado: los scripts y contenedores prediseñados reducen el tiempo de implementación. Eficiencia de costos: la infraestructura administrada de SageMaker AI reduce los gastos operativos. Escalabilidad: escala automáticamente a conjuntos de datos a escala de petabytes. Listo para el cumplimiento: cumple con los requisitos GDPR, HIPAA y SOC 2 de forma predeterminada. Aprendizaje continuo: integración nativa con Amazon SageMaker Pipelines para el reentrenamiento de modelos. Soporte multiplex: admite múltiples operaciones de ajuste y predicción en un único punto final de SageMaker AI, lo que elimina la necesidad de recursos dedicados para cada caso de uso.
Asociación estratégica con AWS
Fundamental ha firmado una asociación estratégica con AWS para acelerar la adopción empresarial:
Integración nativa: implemente NEXUS directamente desde AWS Marketplace. Infraestructura segura: se ejecuta en el entorno de nube seguro y compatible con AWS. Soporte empresarial: arquitectos de soluciones de AWS dedicados para orientación sobre la implementación.
Próximos pasos
¿Listo para transformar sus decisiones basadas en datos?
Conclusión
En esta publicación, mostramos cómo la compatibilidad con el modelo NEXUS en Amazon SageMaker AI le ayuda a desbloquear nuevos conocimientos a partir de sus activos de datos estructurados. Ya sea que esté prediciendo fallas de equipos, optimizando cadenas de suministro o detectando fraude financiero, NEXUS proporciona capacidades deterministas y escalables para sus cargas de trabajo de predicción empresarial.
Para obtener más información, consulte los siguientes recursos: