La historia comenzó con una conversación que tuve con mi novia el domingo pasado. Ella, interesada en la investigación médica, mencionó que las mujeres a menudo están mal diagnosticadas por accidente cerebrovascular. A menudo hay muchos casos falsos negativos entre las mujeres porque la investigación inicial del accidente cerebrovascular se realizó principalmente en sujetos masculinos. Como resultado, los síntomas observados en las mujeres, a menudo diferentes de los observados en los hombres, no podrían reconocerse clínicamente.
Se ha observado un problema similar en el diagnóstico de cáncer de piel. Las personas con tonos de piel más oscuros tienen menos posibilidades de ser diagnosticados correctamente.
Ejemplos como estos muestran cómo el sesgo en la recopilación de datos y el diseño de la investigación puede conducir a resultados dañinos. Estamos viviendo en una era donde la IA está presente en casi todos los dominios, y es inevitable que los datos sesgados se alimenten a estos sistemas. Incluso he sido testigo de médicos que usan herramientas de chatbot como asistentes médicos mientras escribían recetas.
A partir de este aspecto, antes de que un sujeto o un tema se haya estudiado completamente entre diferentes grupos, como aquellos basados en el género o la raza, aplicar sus hallazgos incompletos a los sistemas de IA conlleva riesgos significativos, tanto científica como éticamente. Los sistemas de IA no solo tienden a heredar los sesgos cognitivos humanos existentes, sino que también pueden amplificar e afianzar involuntariamente estos sesgos dentro de sus estructuras técnicas.
En esta publicación, caminaré a través de un estudio de caso de mi experiencia personal: definir la temperatura óptima en un edificio de oficinas, considerando los diferentes niveles de confort térmico de hombres y mujeres.
Estudio de caso: comodidad térmica
Hace dos años, trabajé en un proyecto para optimizar la eficiencia energética en un edificio mientras mantenía la comodidad térmica. Esto planteó una pregunta esencial: ¿Qué es exactamente el confort térmico? En muchos edificios de oficinas o centros comerciales, la respuesta es una temperatura fija. Sin embargo, la investigación ha demostrado que las mujeres informan significativamente más insatisfacción que los hombres en condiciones térmicas similares (Indraganti y Humphreys, 2015). Más allá de la investigación científica seria, yo, junto con otras colegas femeninas, he informado que se sienten fríos durante las horas de oficina.
Ahora diseñaremos un experimento de simulación para mostrar cómo la inclusión de género es importante para definir la comodidad térmica, así como en otros escenarios del mundo real.
Configuración de simulación
Ahora simulamos dos poblaciones, malas y mujeres, con preferencias térmicas ligeramente diferentes. Esta diferencia puede parecer de pequeña importancia a primera vista, pero veremos que realmente se convierte en algo en el siguiente capítulo, donde presentamos un modelo de aprendizaje de refuerzo (RL) para aprender la temperatura óptima. Vemos qué tan bien el agente satisface a las ocupantes femeninas si el agente está capacitado solo en hombres.
Comenzamos con la definición de un modelo de confort térmico idealizado inspirado en el marco de voto medio predicho (PMV). A cada temperatura se le asigna una puntuación de comodidad definida como Max (0, 1-Dist / Zone), en función de qué tan cerca está su valor para el centro del rango de comodidad específico de género:
Hombres: 21–23 ° C (centrado a 22 ° C)
Hembras: 23–25 ° C (centradas a 24 ° C)
Por definición, cuanto más se mueva la temperatura del centro de este rango, más disminuye la puntuación de comodidad.
A continuación, simulamos un entorno simplificado similar a una habitación donde un agente controla la temperatura. Tres acciones posibles:
- Disminuir la temperatura en 1 ° C
- Mantener la temperatura
- Aumentar la temperatura en 1 ° C
El entorno actualiza la temperatura en consecuencia y devuelve una recompensa basada en la comodidad.
El objetivo del agente es maximizar esta recompensa con el tiempo, y aprende la configuración de temperatura óptima para los ocupantes. Consulte el siguiente código para la simulación del entorno.
Agente RL: Q-Learning
Implementamos un método Q-Learning, permitiendo que el agente interactúe con el entorno.
Aprende una política óptima al actualizar una tabla Q, donde se almacenan las recompensas de comodidad esperadas para cada par de acciones estatales. El agente equilibra la exploración, es decir, intentar acciones aleatorias y explotación, es decir, elegir las acciones más conocidas, ya que aprende una estrategia de control de temperatura maximizando la recompensa.
class QLearningAgent:
def __init__(self, state_space, action_space, alpha=0.1, gamma=0.9, epsilon=0.2):
self.states = state_space
self.actions = action_space
self.alpha = alpha
self.gamma = gamma
self.epsilon = epsilon
# Initialize Q-table with zeros: states x actions
self.q_table = np.zeros((len(state_space), len(action_space)))
def choose_action(self, state):
if random.random() < self.epsilon:
return random.choice(range(len(self.actions)))
else:
return np.argmax(self.q_table[state])
def learn(self, state, action, reward, next_state):
predict = self.q_table[state, action]
target = reward + self.gamma * np.max(self.q_table[next_state])
self.q_table[state, action] += self.alpha * (target - predict)
Actualizamos nuestra tabla Q permitiendo que el agente elija la acción más conocida basada en el entorno actual o una acción aleatoria. Controlamos la compensación con un pequeño epsilon, aquí, 0.2, representando el nivel de incertidumbre que queremos.
Entrenamiento y pruebas sesgadas
Como se prometió anteriormente, entrenamos al agente usando solo datos masculinos.
Dejamos que el agente interactúe con el entorno durante 1000 episodios, 20 pasos cada uno. Aprende gradualmente cómo asociar los niveles de temperatura deseados con puntajes de alta comodidad para los hombres.
def train_agent(episodes=1000):
env = TempControlEnv(sex='male')
agent = QLearningAgent(state_space=env.state_space, action_space=env.action_space)
rewards = []
for ep in range(episodes):
state = env.reset()
total_reward = 0
for step in range(20):
action_idx = agent.choose_action(state - env.min_temp)
action = env.action_space[action_idx]
next_state, reward, done = env.step(action)
agent.learn(state - env.min_temp, action_idx, reward, next_state - env.min_temp)
state = next_state
total_reward += reward
rewards.append(total_reward)
return agent, rewards
El código muestra un proceso de capacitación estándar de Q-learning. Aquí hay una trama de la curva de aprendizaje.
Ahora podemos evaluar qué tan bien funciona el agente entrenado masculino cuando se coloca en un entorno de comodidad femenina. La prueba se realiza en el mismo entorno ambiental, solo con un modelo de puntuación de comodidad ligeramente diferente que refleja las preferencias femeninas.
Resultado
El experimento muestra el siguiente resultado:
El agente ha logrado una recompensa de confort promedio de 16.08 por episodio para la comodidad masculina. Vemos que aprendió con éxito a mantener temperaturas alrededor del rango de confort óptimo masculino (21–23 ° C).
El rendimiento del agente cayó a una recompensa promedio de 0.24 por episodio sobre comodidad femenina. Esto muestra que la política entrenada por los hombres, desafortunadamente, no puede generalizarse a las necesidades de comodidad femenina.
Por lo tanto, podemos decir que dicho modelo, entrenado solo en un grupo, puede no funcionar bien cuando se aplica a otro, incluso cuando la diferencia entre grupos parece pequeña.
Conclusión
Este es solo un ejemplo pequeño y simple.
Pero podría resaltar un problema mayor: cuando los modelos de IA están entrenados en datos de solo uno o varios grupos, tienen algunos riesgos para no satisfacer las necesidades de los demás, incluso cuando las diferencias entre los grupos parecen pequeñas. Usted ve que el agente entrenado masculino anterior no satisface la comodidad femenina, y demuestra que el sesgo en los datos de capacitación se refleja directamente en los resultados.
Esto puede ir más allá del caso del control de la temperatura de la oficina. En muchos dominios como la atención médica, las finanzas, la educación, etc., si capacitamos modelos en algunos datos no representativos, podemos anticipar resultados injustos o dañinos para los grupos subrepresentados.
Para los lectores, esto significa cuestionar cómo se construyen los sistemas de IA a nuestro alrededor y presionando la transparencia y la equidad en su diseño. También significa reconocer las limitaciones de las soluciones de “talla única” y abogar por enfoques que consideren diversas experiencias y necesidades. Solo entonces AI puede servir realmente a todos de manera equitativa.
Sin embargo, siempre siento que la empatía es súper difícil en nuestra sociedad. Las diferencias en la raza, el género, la riqueza y la cultura hacen que sea muy difícil para la mayoría de nosotros permanecer en el lugar de otros. La IA, un sistema basado en datos, no solo puede heredar fácilmente los sesgos cognitivos humanos existentes, sino que también puede incrustar estos sesgos en sus estructuras técnicas. Los grupos ya menos reconocidos pueden recibir aún menos atención o, lo que es peor, ser marginados aún más.