¿Dónde está el Big Data?

Hace unos días leía en El País una entrevista con Noah Harari, autor de “Sapiens”. La gran ventaja de los humanos sobre los virus, decía, es la capacidad de intercambiar información. Un coronavirus en Corea y un coronavirus en España no pueden intercambiar consejos sobre cómo infectar a los humanos. Pero Corea puede enseñar a España lecciones valiosas sobre la pandemia.

Información. Vivimos en la sociedad de la información, y la promesa de la inteligencia artificial se basa en el Big Data. Enormes cantidades de información que alimentan a redes neuronales capaces de tomar decisiones más rápidas, acertadas y precisas que cualquier humano porque encuentran en los datos similitudes, diferencias y relaciones que a los humanos nos resultan desapercibidas.

La inteligencia artificial permite predecir con bastante precisión, a partir de datos triviales, las posibilidades de que el cliente de un banco devuelva su crédito o el riesgo de reincidencia de un delincuente. A partir de datos como la edad, la formación, el lugar de residencia, el estado civil, la historia laboral y hasta la estatura, la ciencia de los datos consigue encontrar correlaciones sorprendentes, y muchas veces nada intuitivas.

Estos días leo los periódicos con detalle y más a menudo de lo que sería saludable. Por eso me sorprende comprobar que la información disponible sobre los pacientes de la pandemia es escasa y rudimentaria. Por lo que parece, esta información se ha dejado exclusivamente en manos de los profesionales sanitarios. En los equipos de respuesta a la emergencia no hay ningún especialista en Data Science ni nadie que coordine la investigación desde el punto de vista de la tecnología de la información.

Una herramienta valiosa

No es difícil obtener una enorme cantidad de información sobre cada paciente. Por ejemplo la edad, ocupación, hábitos personales, nutrición, historia médica, pautas de medicación, analíticas, constantes vitales, evolución clínica. En términos técnicos, un Dataset bastante completo. Con este Dataset, una red neuronal bien entrenada puede proporcionarnos información muy valiosa, en términos de diagnóstico, pronóstico y tratamiento. ¿Puedo mandar a este paciente a casa, o es probable que su estado empeore? ¿Debo enviar a este otro a la UCI, o va a morir en todo caso? ¿Es este paciente un buen candidato para determinada medicación?

Los resultados pueden verse en pocos días y, a juzgar por otras aplicaciones de esta tecnología, es muy probable que proporcionen información inesperada, sobre todo porque es mucho lo que nos queda por aprender de este virus y esta enfermedad.

En el mundo, y también en España, hay muchas personas y organizaciones con los recursos y competencias para poner en funcionamiento un sistema de este tipo, que aproveche las tecnologías de Big Data, en tiempo récord. Un sistema que irá aprendiendo con cada nuevo dato que reciba, y que podrá ayudar a paliar en cierta medida la situación caótica que estamos viviendo. El coste económico no es muy alto, y la recogida de datos puede encomendarse a voluntarios.

¿Con quién tenemos que hablar para ponerlo en marcha?

Únete a la conversación

5 comentarios

  1. Javi, voy a «elevar» tus comentarios sobre el Big Data a responsables en Abbott… por si lo consideran relevante.
    Gracias por tu visión, una vez más muy adelantada a nuestro tiempo. Desde hace 40 años ya veíamos este tipo de «avances»… y no teníamos una bola de cristal.
    Gracias

    1. Gracias, Carlos. No me explico por qué no se está haciendo nada de análisis avanzado de datos en este momento. Sabemos el número de casos y de muertos, el desglose por edad y para de contar.

  2. Muy buena reflexión Javier. Me temo que a algo así se han acercado en Corea, Taiwan, Japón y China, pero ¿aquí?, ¡ja!

  3. Hola Javier. Sin duda que un banco de datos sería ideal. Seguramente el modelo ya lo usan las tarjetas de crédito y las oficinas impositivas de todos los gobiernos. Tal vez sea tiempo de aplicarlo a la Salud y a la programación de Educación y formación de trabajores ( de cualquier nivel)

    1. Gerardo, gracias por tu comentario. Lo del banco de datos, que ahora se llama «Dataset», es sólo el primer paso. Lo importante es el conocimiento que hay en día se puede extraer de esos datos con las redes neuronales y la inteligencia artificial.

Dejar un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.