La célula es una fábrica bioquímica de inmensa complejidad. Como unidades fundamentales de la vida, las células recolectan energía del medio ambiente y la utilizan para sintetizar maquinaria molecular compleja, construir réplicas de sí mismas y moverse. Se trata de un truco de hace 4.000 millones de años que aún hoy desconcierta a los biólogos que luchan por comprender los procesos y principios en funcionamiento.
Para cambiar esto, los científicos han modelado células con varios niveles de detalle. Estos modelos pueden simular algunos procesos biomoleculares importantes en la síntesis de proteínas, como la transcripción y la traducción. Los modelos más avanzados pueden incluso predecir algunas de las características a gran escala de una célula bacteriana, su fenotipo, teniendo en cuenta el código genético del organismo.
Pero estos modelos apenas tocan la superficie al capturar la escala total y la complejidad de la maquinaria celular. Quizás el mayor desafío sea modelar la enorme variedad de procesos y vías biológicas a escalas que van desde el nivel atómico y molecular hasta el celular y tisular. Esta actividad es altamente no lineal, por lo que un pequeño cambio en las condiciones iniciales puede ser intrascendente o dar lugar a enormes diferencias en los resultados en escalas de tiempo que van desde picosegundos hasta horas o días.
Cambio de paso
Por supuesto, las mejoras en la potencia de procesamiento y la sofisticación algorítmica están mejorando gradualmente los modelos. Pero lo que les gustaría a los científicos informáticos y biológicos es un cambio radical que pueda superar estas mejoras.
Un paso de este tipo está ahora a la vista, dicen Charlotte Bunne de la Universidad de Stanford en Palo Alto y sus colegas. Este grupo dice que la inteligencia artificial tiene el potencial de modelar células con una resolución nunca antes vista y en una amplia gama de escalas.
Proponen construir una célula virtual de IA que pueda simular con precisión el comportamiento de células reales con tanta precisión que podrán predecir la respuesta celular a una amplia gama de estímulos, identificar posibles objetivos farmacológicos e incluso evaluar versiones virtuales de estos fármacos. Con este enfoque de IA, dicen, «está al alcance de la mano una comprensión predictiva integral de los mecanismos y las interacciones celulares».
Un ingrediente clave en el éxito de este novedoso enfoque es la disponibilidad de datos de entrenamiento. Ésa es un área en la que los bioinformáticos han florecido. «La escala de los datos biológicos sin procesar es innegable», dicen Bunne y compañía. Señalan el Sequence Read Archive, un depósito público de datos de secuenciación de ADN que actualmente contiene más de 14 petabytes de información, mil veces más de lo que se utilizó para entrenar ChatGPT.
La dificultad, por supuesto, está en elegir sabiamente los datos de entrenamiento de esta y otras fuentes. Es probable que gran parte de los datos de estas bases de datos sean redundantes o de valor limitado para fines de capacitación. Tampoco es probable que sea lo suficientemente diverso como para capturar toda la gama de comportamiento celular.
Esto se debe a que estas bases de datos están muy sesgadas hacia los organismos preferidos en los experimentos de laboratorio, como Escherichia coliratones y humanos. Esto inevitablemente creará un sesgo de especie en cualquier modelo de IA.
Bunne y sus colegas tienen claro que se necesitarán muchos más datos de una amplia gama de fuentes, incluidas secuencias de ADN, ARN y proteínas, sobre las ubicaciones espaciales de la actividad del transcriptoma y el proteoma y sobre la estructura del tejido, por nombrar sólo algunos.
Visión innovadora
Otro ingrediente importante será la estructura del propio modelo de IA. Bunne y sus compañeros proponen tres niveles interactivos que simularán la célula a nivel molecular, celular y multicelular. Cada nivel puede ser interrogado por instrumentos virtuales que producen una salida diseñada para el conocimiento humano o como entrada para otro instrumento virtual. De esta manera, los informáticos pueden diseñar experimentos para evaluar el comportamiento de las células en toda la gama de escalas. En esencia, será un laboratorio virtual de ciencia celular.
Por el momento, la célula virtual de IA es poco más que un brillo a los ojos de un grupo de investigadores, aunque influyente, que han comenzado a desarrollar sus planes. La ambición es tan grande que este trabajo no será posible gracias a los esfuerzos de uno o dos grupos de investigación. En cambio, en los próximos meses y años será necesario ver una colaboración significativa entre grupos del mundo académico, el gobierno y la industria.
Suele ser una tarea difícil de coordinar. Pero en este caso, hay mucho en juego como para ofrecer incentivos para todos. «La célula virtual de IA tiene el potencial de revolucionar el proceso científico, lo que conducirá a avances futuros en la investigación biomédica, la medicina personalizada, el descubrimiento de fármacos, la ingeniería celular y la biología programable», afirman Bune y compañía. Estaremos atentos para ver hacia dónde se dirige este proyecto y quiénes participan.
Ref: Cómo construir la célula virtual con inteligencia artificial: prioridades y oportunidades: arxiv.org/abs/2409.11654