Por qué deberíamos centrarnos en la IA para las mujeres

La historia comenzó con una conversación que tuve con mi novia el domingo pasado. Ella, interesada en la investigación médica, mencionó que las mujeres a menudo están mal diagnosticadas por accidente cerebrovascular. A menudo hay muchos casos falsos negativos entre las mujeres porque la investigación inicial del accidente cerebrovascular se realizó principalmente en sujetos masculinos. Como resultado, los síntomas observados en las mujeres, a menudo diferentes de los observados en los hombres, no podrían reconocerse clínicamente.

Se ha observado un problema similar en el diagnóstico de cáncer de piel. Las personas con tonos de piel más oscuros tienen menos posibilidades de ser diagnosticados correctamente.

Ejemplos como estos muestran cómo el sesgo en la recopilación de datos y el diseño de la investigación puede conducir a resultados dañinos. Estamos viviendo en una era donde la IA está presente en casi todos los dominios, y es inevitable que los datos sesgados se alimenten a estos sistemas. Incluso he sido testigo de médicos que usan herramientas de chatbot como asistentes médicos mientras escribían recetas.

A partir de este aspecto, antes de que un sujeto o un tema se haya estudiado completamente entre diferentes grupos, como aquellos basados en el género o la raza, aplicar sus hallazgos incompletos a los sistemas de IA conlleva riesgos significativos, tanto científica como éticamente. Los sistemas de IA no solo tienden a heredar los sesgos cognitivos humanos existentes, sino que también pueden amplificar e afianzar involuntariamente estos sesgos dentro de sus estructuras técnicas.

En esta publicación, caminaré a través de un estudio de caso de mi experiencia personal: definir la temperatura óptima en un edificio de oficinas, considerando los diferentes niveles de confort térmico de hombres y mujeres.

Estudio de caso: comodidad térmica

Hace dos años, trabajé en un proyecto para optimizar la eficiencia energética en un edificio mientras mantenía la comodidad térmica. Esto planteó una pregunta esencial: ¿Qué es exactamente el confort térmico? En muchos edificios de oficinas o centros comerciales, la respuesta es una temperatura fija. Sin embargo, la investigación ha demostrado que las mujeres informan significativamente más insatisfacción que los hombres en condiciones térmicas similares (Indraganti y Humphreys, 2015). Más allá de la investigación científica seria, yo, junto con otras colegas femeninas, he informado que se sienten fríos durante las horas de oficina.

Ahora diseñaremos un experimento de simulación para mostrar cómo la inclusión de género es importante para definir la comodidad térmica, así como en otros escenarios del mundo real.

Imagen del autor: diagrama de flujo experimental

Configuración de simulación

Ahora simulamos dos poblaciones, malas y mujeres, con preferencias térmicas ligeramente diferentes. Esta diferencia puede parecer de pequeña importancia a primera vista, pero veremos que realmente se convierte en algo en el siguiente capítulo, donde presentamos un modelo de aprendizaje de refuerzo (RL) para aprender la temperatura óptima. Vemos qué tan bien el agente satisface a las ocupantes femeninas si el agente está capacitado solo en hombres.

Comenzamos con la definición de un modelo de confort térmico idealizado inspirado en el marco de voto medio predicho (PMV). A cada temperatura se le asigna una puntuación de comodidad definida como Max (0, 1-Dist / Zone), en función de qué tan cerca está su valor para el centro del rango de comodidad específico de género:

Hombres: 21–23 ° C (centrado a 22 ° C)
Hembras: 23–25 ° C (centradas a 24 ° C)

Por definición, cuanto más se mueva la temperatura del centro de este rango, más disminuye la puntuación de comodidad.

A continuación, simulamos un entorno simplificado similar a una habitación donde un agente controla la temperatura. Tres acciones posibles:

Disminuir la temperatura en 1 ° C
Mantener la temperatura
Aumentar la temperatura en 1 ° C

El entorno actualiza la temperatura en consecuencia y devuelve una recompensa basada en la comodidad.

El objetivo del agente es maximizar esta recompensa con el tiempo, y aprende la configuración de temperatura óptima para los ocupantes. Consulte el siguiente código para la simulación del entorno.

Agente RL: Q-Learning

Implementamos un método Q-Learning, permitiendo que el agente interactúe con el entorno.

Aprende una política óptima al actualizar una tabla Q, donde se almacenan las recompensas de comodidad esperadas para cada par de acciones estatales. El agente equilibra la exploración, es decir, intentar acciones aleatorias y explotación, es decir, elegir las acciones más conocidas, ya que aprende una estrategia de control de temperatura maximizando la recompensa.

class QLearningAgent:
    def __init__(self, state_space, action_space, alpha=0.1, gamma=0.9, epsilon=0.2):
        self.states = state_space
        self.actions = action_space
        self.alpha = alpha
        self.gamma = gamma
        self.epsilon = epsilon
        # Initialize Q-table with zeros: states x actions
        self.q_table = np.zeros((len(state_space), len(action_space)))

    def choose_action(self, state):
        if random.random() < self.epsilon:
            return random.choice(range(len(self.actions)))
        else:
            return np.argmax(self.q_table[state])

    def learn(self, state, action, reward, next_state):
        predict = self.q_table[state, action]
        target = reward + self.gamma * np.max(self.q_table[next_state])
        self.q_table[state, action] += self.alpha * (target - predict)

Actualizamos nuestra tabla Q permitiendo que el agente elija la acción más conocida basada en el entorno actual o una acción aleatoria. Controlamos la compensación con un pequeño epsilon, aquí, 0.2, representando el nivel de incertidumbre que queremos.

Entrenamiento y pruebas sesgadas

Como se prometió anteriormente, entrenamos al agente usando solo datos masculinos.

Dejamos que el agente interactúe con el entorno durante 1000 episodios, 20 pasos cada uno. Aprende gradualmente cómo asociar los niveles de temperatura deseados con puntajes de alta comodidad para los hombres.

def train_agent(episodes=1000):
    env = TempControlEnv(sex='male')
    agent = QLearningAgent(state_space=env.state_space, action_space=env.action_space)
    rewards = []

    for ep in range(episodes):
        state = env.reset()
        total_reward = 0
        for step in range(20):
            action_idx = agent.choose_action(state - env.min_temp)
            action = env.action_space[action_idx]
            next_state, reward, done = env.step(action)
            agent.learn(state - env.min_temp, action_idx, reward, next_state - env.min_temp)
            state = next_state
            total_reward += reward
        rewards.append(total_reward)
    return agent, rewards

El código muestra un proceso de capacitación estándar de Q-learning. Aquí hay una trama de la curva de aprendizaje.

Ahora podemos evaluar qué tan bien funciona el agente entrenado masculino cuando se coloca en un entorno de comodidad femenina. La prueba se realiza en el mismo entorno ambiental, solo con un modelo de puntuación de comodidad ligeramente diferente que refleja las preferencias femeninas.

Resultado

El experimento muestra el siguiente resultado:

El agente ha logrado una recompensa de confort promedio de 16.08 por episodio para la comodidad masculina. Vemos que aprendió con éxito a mantener temperaturas alrededor del rango de confort óptimo masculino (21–23 ° C).

El rendimiento del agente cayó a una recompensa promedio de 0.24 por episodio sobre comodidad femenina. Esto muestra que la política entrenada por los hombres, desafortunadamente, no puede generalizarse a las necesidades de comodidad femenina.

Imagen por autor: Diferencia de recompensa

Por lo tanto, podemos decir que dicho modelo, entrenado solo en un grupo, puede no funcionar bien cuando se aplica a otro, incluso cuando la diferencia entre grupos parece pequeña.

Conclusión

Este es solo un ejemplo pequeño y simple.

Pero podría resaltar un problema mayor: cuando los modelos de IA están entrenados en datos de solo uno o varios grupos, tienen algunos riesgos para no satisfacer las necesidades de los demás, incluso cuando las diferencias entre los grupos parecen pequeñas. Usted ve que el agente entrenado masculino anterior no satisface la comodidad femenina, y demuestra que el sesgo en los datos de capacitación se refleja directamente en los resultados.

Esto puede ir más allá del caso del control de la temperatura de la oficina. En muchos dominios como la atención médica, las finanzas, la educación, etc., si capacitamos modelos en algunos datos no representativos, podemos anticipar resultados injustos o dañinos para los grupos subrepresentados.

Para los lectores, esto significa cuestionar cómo se construyen los sistemas de IA a nuestro alrededor y presionando la transparencia y la equidad en su diseño. También significa reconocer las limitaciones de las soluciones de “talla única” y abogar por enfoques que consideren diversas experiencias y necesidades. Solo entonces AI puede servir realmente a todos de manera equitativa.

Sin embargo, siempre siento que la empatía es súper difícil en nuestra sociedad. Las diferencias en la raza, el género, la riqueza y la cultura hacen que sea muy difícil para la mayoría de nosotros permanecer en el lugar de otros. La IA, un sistema basado en datos, no solo puede heredar fácilmente los sesgos cognitivos humanos existentes, sino que también puede incrustar estos sesgos en sus estructuras técnicas. Los grupos ya menos reconocidos pueden recibir aún menos atención o, lo que es peor, ser marginados aún más.

Por qué deberíamos centrarnos en la IA para las mujeres

ByEquipo de 7 minutos

Estudio de caso: comodidad térmica

Configuración de simulación

Agente RL: Q-Learning

Entrenamiento y pruebas sesgadas

Resultado

Conclusión

By Equipo de 7 minutos

Related Post

Astryx de Meta trae una CLI y un servidor MCP a un sistema de diseño React de código abierto que los agentes pueden leer

Cómo dominar las entrevistas de comportamiento sobre datos y aprendizaje automático

Creación de datos de ajuste supervisados a partir de NVIDIA Open-SWE-Traces: análisis de trayectoria, análisis de parches, presupuestos de tokens y métricas de uso de herramientas

You missed

L Catterton de LVMH apunta a un acuerdo de Hyrox Fitness por valor de mil millones de dólares

Intenté biohackear mi embarazo

Nueva vida para la Plaza Histórica de La Mata – El Líder

Karathey Babu de Ravi Mohan bloquea su estreno en cines