Utilizan Twitter para predecir epidemias como la influenza
Por Ana Luisa Guerrero
Ciudad de México. 12 de abril de 2016 (Agencia Informativa Conacyt).- Los mensajes que se envían a través de la red social Twitter son utilizados como una fuente de información para realizar predicciones epidemiológicas.
Desde el Centro de Investigación en Matemáticas (Cimat), la doctora Leticia Ramírez Ramírez aplica modelos estadísticos y computacionales para predecir el número de casos durante brotes de influenza estacional. La metodología se propone para obtener predicciones en tiempo real, que es particularmente útil para planear los recursos y medidas de control a implementar con el objeto de combatir la propagación de infecciones.
Los datos oficiales confirmados de los sistemas públicos de salud se obtienen normalmente con un retraso, ya que éstos se dan una vez que se realizaron la extracción de muestras y análisis de laboratorio. Debido a esto es necesario complementar la información para poder realizar la predicción rápida y oportuna del número de casos futuros.
Doctora en Estadística por la Universidad de Waterloo, en Canadá, comparte con la Agencia Informativa Conacyt el proyecto que ejecuta para analizar el brote de influenza estacional en la región de Peel en Ontario, Canadá, y que ha desarrollado en colaboración con la doctora Yulia Gel, investigadora de la Universidad de Texas, en Dallas.
Explica que las redes sociales -en este caso los mensajes de Twitter- son una fuente alternativa de información que complementan los datos que provienen de los sistemas de vigilancia, a través de los cuales se puede utilizar el modelo estocástico de predicción bajo un escenario libre (sin intervención) o con control epidémico (como vacunación o cierre de escuelas).
“En términos estadísticos estimamos la distribución de las observaciones futuras, es decir, se delinean los escenarios futuros dadas las variables y se les asocia una medida de incertidumbre. Lo que hicimos con Twitter y con la información de los datos oficiales, es aplicar el modelo situándonos en un momento en el tiempo y, con base en la información de los individuos que han sido infectados y detectados a lo largo de las semanas anteriores, tenemos datos de cuántos futuros casos se pueden presentar basados en múltiples simulaciones”, detalla.
En entrevista, la también profesora asociada del Instituto Tecnológico Autónomo de México (ITAM) explica que para aplicar el modelo y la metodología de predicción se construyó una red de contactos individuales para estimar la transmisión de la infección entre las personas utilizando información sociodemográficas y la matrícula en escuelas en la región de Peel, cuya población es de un millón y medio de habitantes.
El análisis se realiza aplicando varias veces simulaciones Montecarlo (un método estadístico numérico no determinista) que arroja una probabilidad de transmisión, pues el hecho de que una persona esté en contacto con otra susceptible no siempre resulta en infección, por lo que se deben establecer los escenarios duros más plausibles.
Mensajes en Twitter
La investigación se centra en analizar los mensajes que se originan en la región y que están relacionados con la influenza, sin que estos sean necesariamente expresiones explícitas de tener la enfermedad, sino aquellos que incluyeran palabras clave relacionadas, como los síntomas o los medicamentos utilizados para su tratamiento.
“Se tiene una muestra de los tuits que ocurren en la región. Por la dirección IP se puede saber el lugar en que se originan y por el perfil del usuario se pueden conocer valores como edad o género. Los mensajes se clasifican en dos tipos: los tuits comunes y los que de alguna manera están relacionados con la actividad de influenza, por ejemplo aquellos que incluyan palabras como fiebre, dolor de cabeza y cuerpo o Tamiflú (medicamento)”, dice.
Es así que con el modelo estocástico de predicción extrae la información de la actividad real de influenza en la región a partir de la actividad en twitter de influenza, aunque los datos en la red social se relacionan más apropiadamente con los casos sospechosos o sintomáticos.
A través de los estudios, la doctora Leticia Ramírez ha detectado que sí existe una fuerte relación entre la información alternativa obtenida en la red social y los casos confirmados de influenza. Sin embargo destaca que en algunos estudios que desean relacionar la actividad de los mensajes de Twitter con algún evento en particular, se ha observado que el volumen de los mensajes es propenso a seguir algún otro tipo de variable; por ello destaca que debe considerarse que la relación entre la actividad de la red social y la enfermedad es dinámica y como tal debe ser modelada.
Investigación aplicada
Desde el año 2004, la doctora Leticia Ramírez trabaja los modelos epidemiológicos como parte de su tesis doctoral, y ese interés por analizar las redes se ha extendido al observar que tienen una aplicación con impacto social. “El modelo puede utilizarse para hacer predicciones de diversas enfermedades y es una buena alternativa para lugares que tienen sus sistemas de vigilancia en desarrollo”, indica.
El complementar la información con fuentes alternativas también lo está realizando con “la fiebre chikungunya, de la que no había historia amplia”. En este caso la enfermedad es transmitida a un ser humano por un mosquito portador. El modelo lo están proponiendo para el caso de República Dominicana utilizando datos oficiales de aquel país e información de búsquedas en México. “En el caso de República Dominicana utilizamos su sistema de vigilancia pero para estimar la población de mosquito se utilizó información de México, porque se buscaron las regiones que son más parecidas en cuanto a clima, y para estimar el volumen de mosquitos que hay seguimos la enfermedad del dengue aquí”, detalla.
Otro proyecto que está por iniciar será para la ciudad de Hong Kong, el cual representa un gran reto debido a que su densidad poblacional es de siete millones de habitantes. En ese proyecto contemplan utilizar las redes sociales que son más populares que Twitter así como buscadores como Google, además de que las palabras claves que incluirán serán en inglés, cantonés y mandarín debido a que la mayoría de la población es bilingüe.
“La investigación se realizará en colaboración con la Universidad de Hong Kong. Hace un par de años fuimos allá y hay un grupo de investigadores que se enfocan en modelos epidémicos, y ya habían hecho un modelo para la ciudad pero sin considerar las redes sociales, y nuestra propuesta les pareció muy novedosa para complementar la información que a veces es muy difícil conseguir”, concluye.
Esta obra cuyo autor es Agencia Informativa Conacyt está bajo una licencia de Reconocimiento 4.0 Internacional de Creative Commons.