Frenzy: un método informático sin servidor con reconocimiento de memoria para clústeres de GPU heterogéneos

La Inteligencia Artificial (IA) ha ido logrando avances significativos con una trayectoria de crecimiento exponencial, incorporando grandes cantidades de datos y construyendo Modelos de Lenguaje Grande (LLM) más complejos. La formación de estos LLM requiere más potencia computacional y recursos para la asignación de memoria, el uso de energía y el hardware. Optimizar la utilización de la memoria para diferentes tipos y configuraciones de GPU es complejo. Decidir los tipos y la cantidad de GPU necesarias para entrenar un modelo específico se ha convertido en un proceso propenso a errores para los desarrolladores. Aparte de eso, es necesario programar de manera eficiente diferentes tareas de LLM en las GPU heterogéneas. La complejidad de los LLM hace imposible garantizar que la utilización de los recursos sea eficiente. Para abordar estos problemas, un equipo de investigadores ha desarrollado Frenzy, que automatiza la asignación y programación de recursos.

Los métodos tradicionales asignan recursos de GPU de forma estática sin adaptarse a los requisitos de memoria dinámica durante el entrenamiento. Las configuraciones deben realizarse manualmente, lo que sólo proporciona una adaptabilidad limitada a los diferentes tipos de GPU y sus capacidades de memoria. Esto conduce a una utilización subóptima de los recursos de hardware, lo que aumenta los costos y el tiempo de capacitación. Por lo tanto, es necesario un nuevo enfoque para combatir la asignación ineficiente de recursos, adaptarse a la heterogeneidad del hardware y aumentar la eficiencia de los LLM complejos.

El método propuesto, Frenzy, entrena LLM en clústeres de GPU heterogéneos. Las características clave de Frenzy incluyen:

Predictor de recursos conscientes de la memoria (MARP): MARP puede predecir el uso máximo de memoria analizando la arquitectura LLM.
Programación consciente de la heterogeneidad (HAS): HAS distribuye las tareas de LLM de manera eficiente entre diferentes GPU en función de su capacidad de memoria y potencia computacional.
Integración sin servidor: los desarrolladores no necesitan especificar los requisitos de GPU; este sistema puede hacer eso automáticamente.
Optimización dinámica de la memoria: el sistema monitorea continuamente el uso de la memoria y se evitan los cuellos de botella mediante la redistribución de las tareas que consumen mucha memoria.

Los experimentos demostraron que la precisión de la predicción del uso de la memoria de Frenzy supera el 92%. Redujo los gastos generales de programación 10 veces en comparación con los enfoques tradicionales. El tiempo promedio de finalización del trabajo también disminuyó entre un 12% y un 18%. Frenzy logra una asignación de recursos superior y se adapta dinámicamente a los clústeres de GPU.

En resumen, Frenzy aborda un cuello de botella crítico en la capacitación de LLM con un sistema sin servidor y con reconocimiento de memoria diseñado para clústeres de GPU heterogéneos. La programación dinámica de recursos y las optimizaciones basadas en la memoria producen aumentos significativos en eficiencia, escalabilidad y rentabilidad. Esta investigación representa un paso adelante hacia soluciones de capacitación LLM sostenibles y escalables al ofrecer un marco sólido para aprovechar de manera efectiva grupos de GPU heterogéneos. La adaptabilidad y el alto rendimiento de Frenzy establecieron un nuevo hito en la formación de LLM y abrieron una adopción más amplia en la investigación y la industria.

Verificar el Papel. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo y únete a nuestro Canal de telegramas y LinkedIn Grarriba. No olvides unirte a nuestro SubReddit de más de 60.000 ml.

🚨 Tendencias: LG AI Research lanza EXAONE 3.5: tres modelos bilingües de código abierto a nivel de inteligencia artificial de frontera que brindan un seguimiento de instrucciones incomparable y una amplia comprensión del contexto para el liderazgo global en la excelencia en inteligencia artificial generativa….

Afeerah Naseem es pasante de consultoría en Marktechpost. Está cursando su licenciatura en tecnología en el Instituto Indio de Tecnología (IIT), Kharagpur. Le apasiona la ciencia de datos y le fascina el papel de la inteligencia artificial en la resolución de problemas del mundo real. Le encanta descubrir nuevas tecnologías y explorar cómo pueden hacer que las tareas cotidianas sean más fáciles y eficientes.

🧵🧵 [Download] Informe de evaluación de vulnerabilidades de modelos de lenguaje grande (promovido)

Frenzy: un método informático sin servidor con reconocimiento de memoria para clústeres de GPU heterogéneos

ByEquipo de 7 minutos

By Equipo de 7 minutos

Related Post

Conozca OmniVoice Studio: una alternativa local de código abierto a ElevenLabs

Diseñe un canal RLVR multimodal completo con Open-MM-RL, indicaciones de visión y lenguaje, puntuación de recompensas y exportación GRPO

Guía paso a paso para crear y comparar el aprendizaje federado FedAvg y FedProx en CIFAR-10 sin IID con NVIDIA FLARE

You missed

Conozca las 10 principales startups europeas que impulsan el auge de la IA agente

Un posible accidente aéreo provoca una búsqueda de emergencia « Euro Weekly News

Debut en la alfombra roja de Queen Latifah y el hijo de Eboni Nichols

Ver doble con los propulsores de cohetes Artemis 2 foto del día del 26 de mayo de 2026