El aprendizaje automático crea un mapa masivo de moléculas malolientes

Los científicos finalmente pueden predecir el olor de una sustancia química sin que un humano la huela

Para el olfato humano, el sulfuro de hidrógeno huele a huevos podridos y el acetato de geranilo a rosas. Pero el problema de adivinar cómo actuará una nueva sustancia química oler sin que alguien lo huela ha dejado perplejos durante mucho tiempo a los científicos de alimentos, perfumistas y neurocientíficos por igual.

Ahora, en un estudio publicado en Ciencia, los investigadores describen un modelo de aprendizaje automático que hace este trabajo. El modelo, llamado Mapa de Olores Principales, predijo los olores de 500.000 moléculas que nunca han sido sintetizadas, una tarea que a un ser humano le llevaría 70 años. “Nuestro ancho de banda para perfilar moléculas es órdenes de magnitud más rápido”, dice Emily Mayhew, científica de alimentos de la Universidad Estatal de Michigan, quien codirigió el estudio.

Un diagrama de dispersión muestra las coordenadas de los componentes principales 1 y 2 para aproximadamente 5.000 moléculas y resalta altas concentraciones de moléculas con las etiquetas
Crédito: Fuente: Versión modificada de un gráfico de “A Principal Odor Map Unified Diverse Tasks in Olfactory Perception”, de Brian K. Lee et al., en Ciencia, vol. 381; 1 de septiembre de 2023. (Reproducido con autorización).

El color de la luz se define por su longitud de onda, pero no existe una relación tan simple entre las propiedades físicas de una molécula y su olor. Un pequeño cambio estructural puede alterar drásticamente el olor de una molécula; por el contrario, las sustancias químicas pueden oler de manera similar incluso con diferentes estructuras moleculares. Los modelos anteriores de aprendizaje automático encontraron asociaciones entre las propiedades químicas de olores conocidos (llamados quimioinformáticos) y sus olores, pero el rendimiento predictivo era limitado.

En el nuevo estudio, los investigadores entrenaron una red neuronal con 5.000 olores conocidos para enfatizar 256 características químicas según cuánto afectan el olor de una molécula. En lugar de utilizar quimioinformática estándar, “construyeron la suya propia”, dice Pablo Meyer Rojas, biólogo computacional de IBM Research, que no participó en el estudio. “Dedujeron directamente las propiedades relacionadas con el olfato”, dice, aunque la forma en que el modelo llega a estas predicciones es demasiado compleja para que un ser humano la entienda.

El modelo crea un mapa gigante de olores, con las coordenadas de cada molécula determinadas por sus propiedades químicas. El modelo también predice cómo huele cada molécula para un humano, utilizando 55 etiquetas descriptivas como “herboso” o “amaderado”. Sorprendentemente, aparecieron odorantes de olor similar en grupos en el mapa, una característica que los mapas de olores anteriores no podían lograr.

Luego, el equipo comparó las predicciones de olores del modelo con los juicios de 15 humanos entrenados para describir nuevos olores. Las predicciones del modelo fueron tan cercanas como las de cualquier juez humano a las descripciones promedio del panel de los nuevos aromas. También podría predecir la intensidad de un olor y qué tan similares olerían dos moléculas, dos cosas para las que no fue diseñado explícitamente. “Fue una sorpresa realmente genial”, dice Mayhew.

La principal limitación del modelo es que puede predecir los olores de una sola molécula; En el mundo real de los perfumes y las apestosas bolsas de basura, los olores casi siempre son mezclas olfativas. “La percepción de la mezcla es la próxima frontera”, dice Mayhew. La gran cantidad de combinaciones posibles hace que predecir mezclas sea exponencialmente más difícil, pero “el primer paso es comprender cómo huele cada molécula”, dice Meyer Rojas.