El sistema se basaría en los historiales médicos, categorizando información e identificando patrones de una forma más eficiente.
El departamento de inteligencia artificial de la Universidad de Toronto intenta crear un sistema de aprendizaje profundo que pueda predecir la salud de un paciente. Sin embargo, los sistemas que almacenan los historiales médicos no están preparados para proporcionar la información necesaria para crear el avance propuesto.
Las personas visitan el médico por distintas razones y en diferentes momentos de su vida, esto crea datos arbitrarios que las redes neuronales artificiales tienen problemas para categorizar.
Duvenaud y sus colaboradores, de mano del Vector Institute, proponen rediseñar estas redes neuronales para permitir a la IA desarrollar prototipos, como el propuesto por la Universidad de Toronto.
Una red neuronal tradicional está construida por capas que trabajan juntas para buscar patrones en los datos que se les proporcionan. La propuesta de Duvenaud destruye estas capas. Para comprender lo que este proceso conlleva, primero debemos entender cómo funcionan las redes neuronales artificiales.
Las redes neuronales son la base del aprendizaje profundo
El proceso más común para entrenar una red neuronal artificial es archivar montones de datos etiquetados. Es decir, si quisiéramos crear un sistema que reconoce animales, lo que tendríamos que hacer es alimentar una red neuronal con fotos de animales que estén sincronizadas con sus correspondientes nombres. Una vez que todos estos datos están sincronizados, las fórmulas creadas para resolver este puzzle pueden ser utilizadas una y otra vez, para categorizar nuevos animales.
Sin embargo, una única fórmula que abarque el proceso completo de foto-nombre es demasiado amplia, por lo que generaría resultados poco exactos. Sería como utilizar una sola fórmula para diferenciar perros y gatos, podrías crear una formula basada en su tamaño o sus orejas, pero esto crearía falsos positivos y negativos, ya que no hay una regla general que los diferencie.
Aquí es dónde toman importancia las capas de la red neuronal. Dichas capas separan el proceso en distintos pasos. Por ejemplo, la primera capa podría recoger todos los pixels y, en base a una fórmula, seleccionar los que sean más relevantes para gatos y para perros. La siguiente capa podría construir patrones extraídos de estos grupos de pixels, y descifrar qué imágenes tienen largos bigotes u orejas. Las capas siguientes identificarán progresivamente características más complejas de los animales, hasta que la última capa decidirá en base a la acumulación de patrones. Este proceso, paso por paso, permite a las redes neuronales crear predicciones más precisas.
El concepto de capas ha sido de gran ayuda al campo de la IA. Aunque también ha sido un paso atrás, ya que si se busca un modelo que se transforma continuamente, se tendrá que dividir en diferentes pasos. Regresando al ejemplo del historial médico, eso significaría agrupar los historiales médicos en períodos temporales como meses o años, lo que sería muy inexacto. Por esto, la mejor forma de acercarse a la realidad es dividir los historiales en unidades más concretas, como días o incluso horas. Esta división llevada al extremo supondría la mejor red neuronal, con un infinito número de capas para registrar infinitesimales opciones diferentes.
¿Es esta idea práctica?
Si esto comienza a sonarte familiar, es porque este problema intentó solucionarse en el pasado con el cálculo. El odiado cálculo proporciona geniales ecuaciones para resolver estas infinitesimales opciones. En resumen, el cálculo se desarrolló para evitar la pesadilla de crear unidades que se encontrasen en constante cambio, es decir, para evitar lo que las redes neuronales artificiales suponen.
Pero la magia de Duvenaud y todos sus colaboradores resuelve este conflicto de la manera más obvia. Duvenaud ha propuesto reemplazar las capas neuronales con ecuaciones de cálculo. Esta propuesta eliminaría el sistema de red para convertirlo en un bloque denominado ODE (Ordinary differential equations).
Es bastante difícil comprender este concepto, pero Duvenaud utiliza una analogía para que los menos entendidos en la materia puedan comprender lo que supondrá este avance. Duvenaud considera un instrumento como un violín, con el que puedes deslizar tu mano sobre las cuerdas para tocar las diferentes notas; ahora consideramos uno como el piano, donde hay un número concreto de teclas para tocar las notas. Una red neuronal artificial tradicional es como un piano.
ODE cambiaría el sistema a un violín. En este nuevo sistema no es necesatio especificar un número concreto de capas (teclas) al comenzar el proceso. ODE permite establecer un nivel de exactitud, y el modelo encontrará la forma más eficiente de entrenarse, en base a ese margen de error que se ha establecido al comienzo.
El concepto aún no está listo para ser aplicado
Una desventaja es que las redes neuronales artificiales neuronales permiten saber cuánto tiempo le llevará entrenarse para cumplir sus objetivos, algo que no sería posible con el nuevo sistema ODE. El trabajo de Duvenaud es una prueba de la validez del concepto que, por desgracia, no está listo para ser aplicado todavía. Es una propuesta que debe ser puesta a prueba con diferentes experimentos y confirmada cuando podrá comenzar a utilizarse.
Se cree que la aplicación más eficiente de este sistema será, de momento, en sistemas basados en líneas temporales como los sistemas de salud.