Serie de entrevistas sobre IA n.° 3: Explique el aprendizaje federado

Pregunta:

“Eres ingeniero de aprendizaje automático en una empresa de fitness como Fitbit o Apple Health.

Millones de usuarios generan datos sensibles de sensores todos los días: frecuencia cardíaca, ciclos de sueño, recuento de pasos, patrones de entrenamiento, etc.

Quiere crear un modelo que prediga riesgos para la salud o recomiende entrenamientos personalizados.

Pero debido a las leyes de privacidad (GDPR, HIPAA), ninguno de estos datos sin procesar puede salir del dispositivo del usuario.

¿Cómo entrenarías a un modelo así?

Al principio, entrenar un modelo en este escenario parece imposible; después de todo, no se pueden recopilar ni centralizar ninguno de los datos de los sensores del usuario. Pero el truco es este: en lugar de llevar los datos al modelo, llevas el modelo a los datos.

Utilizando técnicas como el aprendizaje federado, el modelo se envía al dispositivo de cada usuario, se entrena localmente con sus datos privados y solo se devuelven las actualizaciones del modelo (no los datos sin procesar). Luego, estas actualizaciones se agregan de forma segura para mejorar el modelo global y, al mismo tiempo, mantener la privacidad total de los datos de cada usuario.

Este enfoque le permite aprovechar conjuntos de datos masivos del mundo real sin violar las leyes de privacidad.

¿Qué es el aprendizaje federado?

El aprendizaje federado es una técnica para entrenar modelos de aprendizaje automático sin recopilar datos de usuario de forma centralizada. En lugar de cargar datos privados (como frecuencia cardíaca, ciclos de sueño o registros de entrenamiento), el modelo se envía a cada dispositivo, se entrena localmente y solo se devuelven las actualizaciones del modelo. Estas actualizaciones se agregan de forma segura para mejorar el modelo global, garantizando la privacidad y el cumplimiento de leyes como GDPR e HIPAA.

Existen múltiples variantes:

FL centralizado: un servidor central coordina la capacitación y agrega actualizaciones. FL descentralizada: los dispositivos comparten actualizaciones entre sí directamente, sin un único punto de falla. FL heterogéneo: Diseñado para dispositivos con diferentes capacidades informáticas (teléfonos, relojes, sensores IoT).

El flujo de trabajo es simple:

Se envía un modelo global a los dispositivos de los usuarios. Cada dispositivo entrena con sus datos privados (por ejemplo, las métricas de salud y estado físico de un usuario). Sólo las actualizaciones del modelo (no los datos) se cifran y se devuelven. El servidor agrega todas las actualizaciones en un nuevo modelo global.

Desafíos en el aprendizaje federado

Restricciones del dispositivo: los dispositivos de los usuarios (teléfonos, relojes inteligentes, rastreadores de actividad física) tienen una potencia de CPU/GPU limitada, poca RAM y dependen de la batería. El entrenamiento debe ser liviano, eficiente desde el punto de vista energético y programado de manera inteligente para que no interfiera con el uso normal del dispositivo.

Agregación de modelos: incluso después de entrenar localmente en miles o millones de dispositivos, todavía necesitamos combinar todas estas actualizaciones de modelos en un único modelo global. Técnicas como el promedio federado (FedAvg) ayudan, pero las actualizaciones pueden retrasarse, estar incompletas o ser inconsistentes según la participación del dispositivo.

Datos locales sesgados (datos no IID):

Los datos de fitness de cada usuario reflejan hábitos y estilos de vida personales:

Algunos usuarios corren a diario; otros nunca corren. Algunos tienen frecuencias cardíacas elevadas en reposo; otros tienen baja. Los ciclos del sueño varían drásticamente según la edad, la cultura y el patrón de trabajo. Los tipos de entrenamiento difieren: yoga, entrenamiento de fuerza, ciclismo, HIIT, etc.

Esto conduce a conjuntos de datos locales sesgados y no uniformes, lo que dificulta que el modelo global aprenda patrones generalizados.

Disponibilidad intermitente del cliente: muchos dispositivos pueden estar desconectados, bloqueados, con poca batería o no conectados a Wi-Fi. El entrenamiento solo debe realizarse en condiciones seguras (cargando, inactivo, Wi-Fi), reduciendo el número de participantes activos en cualquier momento.

Eficiencia de la comunicación: enviar actualizaciones de modelos con frecuencia puede agotar el ancho de banda y la batería. Las actualizaciones deben estar comprimidas, dispersas o limitadas a subconjuntos más pequeños de parámetros.

Garantías de seguridad y privacidad: aunque los datos sin procesar nunca salen del dispositivo, las actualizaciones deben cifrarse. Es posible que se requieran protecciones adicionales, como privacidad diferencial o agregación segura, para evitar la reconstrucción de patrones sensibles a partir de gradientes.

Soy graduado en ingeniería civil (2022) de Jamia Millia Islamia, Nueva Delhi, y tengo un gran interés en la ciencia de datos, especialmente las redes neuronales y su aplicación en diversas áreas.

🙌 Siga MARKTECHPOST: agréguenos como fuente preferida en Google.

Serie de entrevistas sobre IA n.° 3: Explique el aprendizaje federado

ByEquipo de 7 minutos

Pregunta:

¿Qué es el aprendizaje federado?

Desafíos en el aprendizaje federado

By Equipo de 7 minutos

Related Post

Google Cloud presenta el formato de conocimiento abierto (OKF): una especificación de descuento neutral para el proveedor para brindar a los agentes de IA un contexto seleccionado

En la teoría de juegos, los generalistas a veces ganan a los especialistas | Noticias del MIT

Recupera horas todos los días con agentes autónomos en Amazon Quick

You missed

Revelar su condición de VIH+ no es acoso criminal a su ex

Soource, con sede en Bolzano, recauda 3 millones de euros para ayudar a que el abastecimiento evolucione del modelo “copiloto” al “piloto automático”

Las playas de Grecia enfrentan nuevas protecciones « Euro Weekly News

Jelly Roll aclara el comentario de TikTok en medio del divorcio de Bunnie Xo