Luis Tejerina es Economista de la División de Protección Social y Salud en la oficina de Honduras del Banco Interamericano de Desarrollo; Napoleón Cornejo es Director de investigación y desarrollo de Axiome Labs B.V; y Vladimir Aguiñada, Director de negocios de Axiome Labs B.V.
¿Sabías que uno de los síntomas de la tos es interactuar con más personas más veces? O que uno de los síntomas del resfriado común es llamar a tus amigos después del trabajo. A medida que utilizamos cada vez más tecnología en el día a día, dejamos huellas de información digital que pueden ser utilizadas para mejorar el bienestar público en formas que hace 10 años hubieran parecido ciencia ficción.
Por ejemplo, científicos de MIT han estudiado el comportamiento humano observado a través de los teléfonos celulares para predecir no solo si una persona está enferma, sino el tipo de problema de salud que tiene y si una zona geográfica puede ser vulnerable a una epidemia. Para esto se utiliza una técnica que mezcla herramientas estadísticas, sensores y programación conocida como aprendizaje automático o “machine learning” (ML). Analizando la interacción con los celulares ellos encuentran patrones que predicen el estado de salud de una persona (a quién llamamos, con qué frecuencia y cuánto nos movemos).
Las herramientas de machine learning han sido popularizadas por su uso en el sector privado en la mejora de sus servicios. Netflix y Amazon son empresas que utilizan algoritmos de ML en las recomendaciones que hacen de productos y servicios. Este tipo de algoritmos incrementaron su presencia en la cultura popular cuando Netflix anunció en 2006 un premio de US$1 millón para quien pueda mejorar el poder predictivo de sus recomendaciones en un 10%. Un análisis en Google trends nos muestra cómo la popularidad de esta tecnología ha aumentado en el tiempo.
Si bien los algoritmos de aprendizaje automático son matemáticamente sofisticados, están inspirados en la intuición. Si a la mayoría de las personas a las que les gusta la película A les gusta la película B, entonces puedo confiablemente recomendar la película B a una persona que le gustó la A pero no vio la B. De la misma manera si observo que el número de llamadas y el número de personas a las que se llama a lo largo del día están relacionadas con el estado de salud física y mental de una persona, puedo utilizar estos datos para predecir el estado de salud sin necesidad de una consulta médica.
El elemento clave para poder hacer este tipo de inferencia es una base de datos con suficientes observaciones y atributos de personas a las que les gusta la película A y B o una bitácora de actividad del celular y su estado de salud para “entrenar el algoritmo”. Un elemento adicional en los algoritmos de aprendizaje automático es que, a medida que se los utiliza, es posible retroalimentarlos para ajustarlos a la nueva información. Es decir, las máquinas adquieren la capacidad de aprender.
Huellas digitales para predecir estados de salud
El equipo a cargo de la investigación descrita al principio de este artículo ha desarrollado una aplicación que combina atención de especialistas con datos de teléfonos celulares y aprendizaje automático para identificar y tratar la depresión, el stress y la ansiedad. También se han desarrollado algoritmos para:
- Iniciativas que identifican caídas y el tipo de cada una. Así se tendrá un mecanismo de alerta para, por ejemplo, los adultos mayores.
- Iniciativas que entrenan algoritmos para el análisis de imágenes con mejores diagnósticos, por ejemplo, de cáncer.
- Iniciativas para aplicar técnicas de aprendizaje automático y análisis genético y desarrollar medicina personalizada.
Un análisis reciente encuentra que existen 106 compañías orientadas a aplicar algoritmos de aprendizaje automático al sector salud en las áreas de salud mental, asistentes virtuales, monitoreo de estilos de vida, manejo de hospitales y descubrimiento de nuevas medicinas. Sin embargo, el uso de aprendizaje automático puede ir mucho más allá del sector salud dependiendo de la información disponible para entrenar un algoritmo.
El entretenimiento, la salud, las posibilidades son infinitas
En Costa de Marfil y América Latina se han implementado algoritmos de aprendizaje automático para construir mapas de pobreza. Esta es una herramienta clave, pero es costosa de generar, para la política pública con base en la información de telefonía celular con niveles de precisión (predicciones correctas) de más de 70%.
En Dinamarca con información administrativa del sector educativo e información pública, se utilizaron algoritmos de aprendizaje automático con el propósito de predecir deserción escolar. El algoritmo implementado puede predecir la probabilidad de que un estudiante abandone la escuela secundaria con una precisión del 93.5%.
En República Dominicana, los algoritmos ya se implementan en el sector público con el propósito de identificar errores en las fichas socioeconómicas que se utilizan como puerta de entrada a los programas sociales. Así, cuando el algoritmo detecta un patrón extraño (una familia que declara tener un techo de adobe en un barrio de clase media, por ejemplo) se levanta una alerta para verificar la información.
Finalmente, en China se ha utilizado información de telefonía celular con el propósito de medir la actividad económica con alta desagregación geográfica y construir índices de desempleo, consumo y desempeño de empresas.
Machine Learning en América Latina
Dos fuerzas impulsan el uso de algoritmos de este tipo para mejorar la política pública en nuestra región. Por un lado, el diseño de herramientas fáciles de utilizar, el carácter abierto de muchas iniciativas y la creciente demanda por educación en el área de aprendizaje automático incrementan la oferta y bajan los costos de implementarla.
Por otro lado, a medida que los países fortalecen sus sistemas administrativos de información y se logra mayor uso de teléfonos inteligentes, incluso en sectores más pobres de la población, se incrementa la información disponible para entrenar algoritmos que mejoren la toma de decisiones. Un esfuerzo regional que sirva de catalizador para un mayor empuje en la implementación de esta tecnología en la región y logre acceso y generación de mayor información podría tener altos retornos al lograr que América Latina y el Caribe se conviertan en líderes en la adopción de la tecnología para el sector público.