Los ingenieros biomédicos de la Universidad de Duke han ideado un enfoque de aprendizaje automático para modelar las interacciones entre variables complejas en bacterias modificadas que de otro modo serían demasiado engorrosas para predecir. Sus algoritmos son generalizables a muchos tipos de sistemas biológicos.
En el nuevo estudio, los investigadores entrenaron una red neuronal para predecir los patrones circulares que crearía un circuito biológico integrado en un cultivo bacteriano. El sistema funcionó 30,000 veces más rápido que el modelo computacional existente.
Para mejorar aún más la precisión, el equipo ideó un método para volver a capacitar el modelo de aprendizaje automático varias veces para comparar sus respuestas. Luego lo usaron para resolver un segundo sistema biológico que es computacionalmente exigente de una manera diferente, mostrando que el algoritmo puede funcionar para desafíos dispares.
Los resultados aparecen en línea el 25 de septiembre en la revista. Comunicaciones de la naturaleza.
"Este trabajo fue inspirado por Google que muestra que las redes neuronales pueden aprender a vencer a un humano en el juego de mesa Go", dijo Lingchong You, profesor de ingeniería biomédica en Duke.
"Aunque el juego tiene reglas simples, hay demasiadas posibilidades para que una computadora calcule la mejor opción de manera determinista", dijo. "Me preguntaba si ese enfoque podría ser útil para hacer frente a ciertos aspectos de la complejidad biológica que enfrentamos".
El desafío que enfrentaron Usted y su asociado posdoctoral Shangying Wang fue determinar qué conjunto de parámetros podría producir un patrón específico en un cultivo de bacterias después de un circuito genético diseñado.
En trabajos previos, el laboratorio de You programó bacterias para producir proteínas que, dependiendo de los detalles del crecimiento del cultivo, interactúan entre sí para formar anillos. Al controlar variables como el tamaño del entorno de crecimiento y la cantidad de nutrientes proporcionados, los investigadores descubrieron que podían controlar el grosor del anillo, cuánto tiempo tardó en aparecer y otras características.
Al cambiar cualquier cantidad de docenas de variables potenciales, los investigadores descubrieron que podían hacer más, como causar la formación de dos o incluso tres anillos. Pero debido a que una sola simulación por computadora tomó cinco minutos, no resultó práctico buscar un resultado específico en cualquier espacio de diseño grande.
Para su estudio, el sistema constaba de 13 variables bacterianas, como las tasas de crecimiento, difusión, degradación de proteínas y movimiento celular. Solo calcular seis valores por parámetro llevaría una sola computadora más de 600 años. Ejecutarlo en un clúster de computadora paralelo con cientos de nodos podría reducir ese tiempo de ejecución a varios meses, pero el aprendizaje automático puede reducirlo a horas.
"El modelo que utilizamos es lento porque tiene que tener en cuenta los pasos intermedios en el tiempo a una velocidad lo suficientemente pequeña como para ser exactos", dijo You. "Pero no siempre nos interesan los pasos intermedios. Solo queremos los resultados finales para ciertas aplicaciones. Y podemos (volver a) descubrir los pasos intermedios si consideramos que los resultados finales son interesantes".
Para saltar a los resultados finales, Wang recurrió a un modelo de aprendizaje automático llamado red neuronal profunda que puede hacer predicciones de órdenes de magnitud de manera más rápida que el modelo original. La red toma las variables del modelo como su entrada, inicialmente asigna pesos aleatorios y sesgos, y escupe una predicción de qué patrón se formará la colonia bacteriana, omitiendo por completo los pasos intermedios que conducen al patrón final.
Si bien el resultado inicial no se acerca a la respuesta correcta, los pesos y sesgos se pueden modificar cada vez que se ingresan nuevos datos de entrenamiento en la red. Dado un conjunto de "entrenamiento" lo suficientemente grande, la red neuronal eventualmente aprenderá a hacer predicciones precisas casi siempre.
Para manejar las pocas instancias en las que el aprendizaje automático se equivoca, usted y Wang idearon una forma de verificar rápidamente su trabajo. Para cada red neuronal, el proceso de aprendizaje tiene un elemento de aleatoriedad. En otras palabras, nunca aprenderá de la misma manera dos veces, incluso si está entrenado en el mismo conjunto de respuestas.
Los investigadores entrenaron cuatro redes neuronales separadas y compararon sus respuestas para cada instancia. Descubrieron que cuando las redes neuronales entrenadas hacen predicciones similares, estas predicciones estaban cerca de la respuesta correcta.
"Descubrimos que no teníamos que validar cada respuesta con el modelo computacional estándar más lento", dijo You. "En su lugar, utilizamos la 'sabiduría de la multitud'".
Con el modelo de aprendizaje automático entrenado y corroborado, los investigadores se propusieron usarlo para hacer nuevos descubrimientos sobre su circuito biológico. En las 100.000 simulaciones de datos iniciales utilizadas para entrenar la red neuronal, solo una produjo una colonia bacteriana con tres anillos. Pero con la velocidad de la red neuronal, Usted y Wang no solo pudieron encontrar muchos más trillizos, sino que también determinaron qué variables fueron cruciales para producirlos.
"La red neuronal pudo encontrar patrones e interacciones entre las variables que de otro modo hubieran sido imposibles de descubrir", dijo Wang.
Como final de su estudio, You y Wang probaron su enfoque en un sistema biológico que funciona al azar. Resolver tales sistemas requiere un modelo de computadora para repetir los mismos parámetros muchas veces para encontrar el resultado más probable. Si bien esta es una razón completamente diferente para los largos tiempos de ejecución computacionales que su modelo inicial, los investigadores descubrieron que su enfoque aún funcionaba, lo que demuestra que es generalizable a muchos sistemas biológicos complejos diferentes.
Los investigadores ahora están tratando de usar su nuevo enfoque en sistemas biológicos más complejos. Además de ejecutarlo en computadoras con GPU más rápidas, están tratando de programar el algoritmo para que sea lo más eficiente posible.
"Entrenamos la red neuronal con 100,000 conjuntos de datos, pero eso podría haber sido excesivo", dijo Wang. "Estamos desarrollando un algoritmo donde la red neuronal puede interactuar con simulaciones en tiempo real para ayudar a acelerar las cosas".
"Nuestro primer objetivo era un sistema relativamente simple", dijo You. "Ahora queremos mejorar estos sistemas de redes neuronales para proporcionar una ventana a la dinámica subyacente de los circuitos biológicos más complejos".
Este trabajo fue apoyado por la Oficina de Investigación Naval (N00014-12-1-0631), los Institutos Nacionales de Salud (1R01-GM098642) y una beca David y Lucile Packard.
Uber está mejorando sus implementaciones de IoT en todo el mundo mediante la adopción de…
Obras de motor de materia y Bharti Airtel, un proveedor de servicios de telecomunicaciones ha…
En The Legend of Zelda: Breath of the Wild, los guardianes son una forma primitiva…
Muchos de nosotros nos enamoramos absolutamente de Wall-E, el personaje principal de una…
Dhruv Bhutani / Android AuthorityCada año, los fanáticos de los teléfonos inteligentes esperan con ansias…
Apple ha anunciado que Final Cut Pro finalmente llegará para el iPad. Tras años de…