Estilo de vida

La compañía de biotecnología tiene como objetivo crear “chatgpt de biología”, ¿tendrá éxito?

Los investigadores de Bascamp recopilan datos genéticos en Malta

Greg Vonel

Una compañía de biotecnología británica ha pasado la investigación de Basecamp en los últimos años en la recopilación de colecciones de datos genéticos de microbios que viven en entornos extremistas de todo el mundo, y especifica más de un millón de especies y alrededor de 10 mil millones de genes nuevos en ciencia. Afirma que esta enorme base de datos de la diversidad biológica del planeta ayudará a capacitar a “Chatgpt of Biology” que responderá preguntas sobre la vida en la Tierra, pero no hay garantía de que esto tenga éxito.

Yorg Overman En el Instituto Leibniz DSMZ en Alemania, que incluye uno de los cultivos microbianos más diversos del mundo, dice que el aumento de las secuencias genéticas de valor conocidas, pero puede no conducir a resultados útiles para cosas como el descubrimiento de drogas o química sin más información sobre los organismos vivos de los que se recopilaron. “No estoy convencido de que al final, la comprensión de los nuevos empleos realmente se acelerará al aumentar la fuerza bruta en el espacio de secuencia”, dice.

En los últimos años, los investigadores han sido testigos del desarrollo de una serie de modelos de aprendizaje automatizados capacitados para identificar patrones y predecir relaciones en medio de grandes cantidades de datos biológicos. El más famoso de estos AlfafoldQue puede predecir la estructura 3D de la proteína depende solo de los datos genéticos, y obtuvo creadores en Google Deepmind con el premio Nobel 2024 en química.

Si bien los modelos de “biología del gimnasio” se han vuelto más complicadas desde entonces, no han mejorado mucho, dice Francis Ding En la Universidad de California, Berkeley. Una de las razones puede ser la falta de datos de diversidad biológica. “Los modelos actuales en biología están entrenados en colecciones de datos que representan especies no pavimentadas (por ejemplo, Reajuste salarialElla dice: “Ratones y seres humanos), y estos modelos son peores en la predicción de características sobre secuencias de otras partes del árbol de la vida”.

Los investigadores comenzaron en Basecamp para abordar esta brecha de diversidad biológica. La creciente base de datos de la compañía ahora contiene muestras de más de 120 sitios en 26 países, según un informe La compañía fue publicada. Jonathan FeinEl principal funcionario científico de la compañía dice que los esfuerzos de ensamblaje se centraron en entornos duros desde los que no se han tomado muestras, desde agua fría debajo del hielo marino en el Ártico hasta las aguas termales en el bosque. “La mayoría de las muestras que buscamos son muestras primitivas: bacterias, microbios y virus”, dice Finn. “Sé que tenemos algunos hongos allí”.

El análisis genético de estas muestras reveló diferencias en los genes articulares globales casi a través del árbol de la vida; en consecuencia, la compañía estima que los datos contienen información de más de un millón de especies que no ocurren en los grupos de datos genéticos generales utilizados para capacitar a los modelos de biología de inteligencia artificial. Los investigadores dicen que esto contiene colectivamente alrededor de 9.8 mil millones de genes que han sido recientemente identificados, que es un aumento de 10 veces en el número total de genes conocidos, cada uno de los cuales codifica una proteína potencialmente útil.

“Al mostrar a estos modelos una gran parte de la naturaleza, deben tener una mejor comprensión de cómo hacer biología”, dice el finlandés. “Estamos tratando de construir una conversación a partir de la biología”.

A través de algunas estimaciones, alberga la tierra como Muchos billones de especies microbianasNada casi no se distingue. Por lo tanto, no es sorprendente que la compañía haya identificado mucha vida nueva. “Si exploras más, obtendrás más variables genéticas diferentes”, dice. Piezas de Leopold En el Wilcum Sanger Institute, Reino Unido.

Pero Basecamp depende de la idea de que todos los materiales nuevos pueden ser valiosos, y no están solos. “Esta es una de las cosas más emocionantes que he visto hace mucho tiempo”, dice. Nathan FryGenentech, una empresa de tecnología vital en los Estados Unidos. En general, dice que trabajar en modelos de inteligencia artificial para la biología se ha centrado en mejorar los algoritmos o generar más datos en laboratorios en lugar de salir realmente en el mundo y recopilar muestras.

Sin embargo, hay una razón para ser escéptico de que la base de datos conduzca a los modelos radicales mejorados que la compañía quiere. Para uno de ellos, aún no está claro en qué medida esta nueva diversidad de proteínas funciones valiosas y valiosas, como enzimas o proteínas de plástico que pueden reutilizarse para liberar genes. Las partes dicen: “Deben dejar en claro que esta abuela es de alguna manera útil”.

Además, si los nuevos genes difieren enormemente de aquellos que ya conocemos, Overmann no ve cómo las herramientas existentes pueden predecir fácilmente sus funciones, o cómo se pueden usar datos para entrenar un nuevo modelo. “No tienes idea de lo que hacen la mayoría de los genes”, dice. La compañía podría haber reunido un tesoro de nueva biología, pero sin más trabajo en los viejos laboratorios para comprender lo que existe, podría seguir siendo misterioso, incluso para la inteligencia artificial más fuerte.

Temas:

Fuente

Related Articles

Back to top button