Screenshot 2024 07 11 At 12.09.08 Am.png

Avances en representaciones químicas e inteligencia artificial en el descubrimiento de fármacos:

Los avances tecnológicos del siglo pasado, especialmente la revolución informática y el cribado de alto rendimiento en el descubrimiento de fármacos, han hecho necesario el desarrollo de representaciones moleculares legibles por ordenador y comprensibles en todas las disciplinas científicas. Inicialmente, las moléculas se representaban como diagramas de estructura con enlaces y átomos, pero el procesamiento computacional requería representaciones más sofisticadas. Se han desarrollado varias notaciones químicas para codificar estructuras moleculares, con ejemplos tempranos como la fórmula empírica, que proporciona la composición atómica pero no la conectividad ni la geometría. La llegada de las computadoras facilitó el almacenamiento y la modificación digitales rápidos de datos químicos, lo que llevó al desarrollo de notaciones legibles por máquina y algoritmos para la visualización en 2D y 3D. Las representaciones modernas, especialmente las desarrolladas desde la década de 1970, admiten moléculas pequeñas, macromoléculas y reacciones químicas, lo que mejora la eficiencia y la escalabilidad de la quimioinformática.

Aplicaciones de la IA en el descubrimiento de fármacos:

En el descubrimiento de fármacos impulsado por IA, las representaciones químicas desempeñan un papel crucial. Los gráficos moleculares, la representación legible por máquina más común, y varias otras notaciones se utilizan para codificar información estructural para el análisis computacional. Esta revisión destaca la importancia de estas representaciones en aplicaciones de IA, proporcionando ejemplos en los que las técnicas de IA, como los modelos de ML, se aplican a la quimioinformática y al descubrimiento de fármacos. La revisión es una guía esencial para investigadores y estudiantes de química, bioinformática y ciencias de la computación, que enfatiza la dependencia de la elección de la representación en la tarea específica. Si bien no es exhaustiva, la revisión dirige a los lectores a más literatura sobre aplicaciones de IA en quimioinformática, mostrando cómo las técnicas computacionales modernas están revolucionando el descubrimiento de fármacos al mejorar las capacidades de manejo y análisis de datos.

Introducción a las representaciones de gráficos moleculares:

Comprender los grafos moleculares es esencial para comprender las representaciones químicas que se utilizan en el descubrimiento de fármacos. Un grafo molecular asigna átomos a nodos y enlaces a aristas, representando moléculas de una manera estructurada. Estos grafos, definidos formalmente como una tupla de nodos (átomos) y aristas (enlaces), se pueden visualizar utilizando varios programas. Los nodos y las aristas suelen codificarse en matrices: una matriz de adyacencia para la conectividad, una matriz de características de nodos para la identidad de átomos y una matriz de características de aristas para la identidad de enlaces. Los algoritmos de recorrido de grafos garantizan un ordenamiento consistente de los nodos, lo que es crucial para generar representaciones fiables. Esta flexibilidad permite codificar información en 3D, lo que ofrece ventajas sobre las notaciones lineales.

Tablas de conexión y formatos de archivos MDL:

Las tablas de conexión (Ctabs) y los formatos de archivo MDL (ahora BIOVIA) son cruciales en la representación de gráficos moleculares. Las Ctabs constan de recuentos, átomos, enlaces, listas de átomos, Stext y bloques de propiedades, que describen de manera eficiente las estructuras moleculares al especificar detalles de átomos y enlaces. Evitan la representación explícita del hidrógeno, lo que reduce el tamaño del archivo. Los formatos MDL, creados sobre Ctabs, incluyen archivos Molfiles para moléculas individuales y se extienden a archivos SD, RXN, RD y RG para datos y reacciones adicionales. Estos formatos se utilizan ampliamente para el almacenamiento y la transferencia de información química sistemática y compacta, y admiten diversas aplicaciones de quimioinformática.

Notaciones contemporáneas: SMILES y InChI:

SMILES, desarrollado en 1988, es una notación intuitiva y popular para codificar estructuras moleculares. Asigna números a los átomos y recorre el gráfico molecular mediante una búsqueda en profundidad, lo que permite múltiples representaciones de la misma molécula. Se pueden designar SMILES únicos mediante la canonización. SMILES puede codificar la estereoquímica y otras estructuras complejas, pero tiene dificultades con los compuestos organometálicos y las sales iónicas. El Identificador Químico Internacional (InChI), introducido en 2006, proporciona una notación canónica estándar de código abierto con múltiples capas para una representación molecular detallada. Las InChIKeys ofrecen versiones únicas, buscables y en hash de InChI, lo que mejora la accesibilidad a la información química.

Resumen de representaciones químicas:

Las representaciones químicas abarcan varios métodos para modelar moléculas, reacciones y macromoléculas. Las claves estructurales como MACCS y CATS codifican la presencia de grupos químicos específicos. Las huellas dactilares hash como Daylight y ECFP utilizan funciones hash para representar patrones moleculares. Las reacciones se describen utilizando formatos como Reaction SMILES, RInChI y CGR. Las macromoléculas, incluidas las proteínas y los péptidos, utilizan notaciones y estructuras basadas en secuencias de repositorios como PDB. Estos diversos métodos facilitan el análisis y la predicción precisos en la informática química y el descubrimiento de fármacos.

Representaciones gráficas de moléculas y macromoléculas:

Las representaciones gráficas de moléculas, cruciales para la visualización y el análisis, incluyen representaciones en 2D y modelos en 3D. Las representaciones en 2D muestran estructuras esqueléticas, a menudo utilizando pautas estandarizadas de la IUPAC, pero aún enfrentan desafíos en el diseño y la representación. Herramientas como RDKit y CDK han mejorado las visualizaciones en 2D. Para las macromoléculas, las representaciones se centran en las estructuras de polímeros o péptidos, con herramientas como Pfizer Macromolecule Editor que ayudan a la visualización. Las representaciones en 3D, que utilizan software como Avogadro y PyMOL, incluyen modelos de bolas y palos, dibujos animados y de van der Waals, que facilitan los estudios de acoplamiento, interacciones proteína-ligando y estudios mecanísticos. Estas representaciones mejoran la comprensión de la quimioinformática y el descubrimiento de fármacos.


Revisar la Documento 1 y Documento 2. Todo el crédito por esta investigación corresponde a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo.

Únete a nuestro Canal de Telegram y LinkedIn Gr¡Arriba!.

Si te gusta nuestro trabajo, te encantará nuestro Boletin informativo..

No olvides unirte a nuestro Subreddit de más de 46 000 millones de usuarios


Sana Hassan, pasante de consultoría en Marktechpost y estudiante de doble titulación en el IIT Madrás, es un apasionado de la aplicación de la tecnología y la IA para abordar los desafíos del mundo real. Con un gran interés en resolver problemas prácticos, aporta una perspectiva nueva a la intersección de la IA y las soluciones de la vida real.