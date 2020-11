Hasta hace un tiempo predecir el futuro parecía algo traído de los cabellos, hoy en día, gracias al desarrollo y a los avances de la tecnología, podríamos decir que no solo es posible sino una urgente necesidad, que es realizable gracias al uso de herramientas como la analítica de datos.

“Con ella es factible, por ejemplo, detectar y estimar zonas con alto riesgo de accidentalidad, permitiendo que fácilmente las autoridades competentes puedan explorar dichas zonas, con el objetivo de detectar los principales factores que contribuyen a incidencias, por ejemplo, falta de señalización, falta de semáforos, etc”, explica Elías Niño-Ruiz, director del Departamento de Ingeniería de Sistemas y director del Laboratorio de Matemáticas Aplicadas y Ciencias de la Computación de la Universidad del Norte.



Gracias a la analítica de datos, agrega, también es posible, por ejemplo, hacer una estimación de agentes contaminantes y altos niveles de polución en ciudades, identificando zonas de riesgo por altos volúmenes de material particulado, un proyecto que ha venido manejando el grupo de Matemáticas Aplicadas y Ciencias de la Computación de Uninorte con grupos de investigación de las universidades EAFIT y de Antioquia.



Pero, ¿qué es en esencia la analítica de datos? Esta es una sinergia de tres importantes áreas, según indica el doctor Niño-Ruiz: machine learning, experticia e ingeniería.



“Siendo conciso, machine learning provee modelos que parcialmente aprenden de los datos la dinámica que los gobiernan, la experticia es fundamental para llegar a conclusiones eficaces en lo observado y la ingeniería provee las herramientas tecnológicas que facilitan la manipulación de los datos en diferentes escalas”, comenta.



De acuerdo con el profesor su importancia radica “en que la acumulación de información a lo largo de los años, puede darnos insights en diferentes contextos. Podríamos considerar desde el tema de analítica urbana para ciudades inteligentes hasta estimación de enfermedades en pacientes. El espectro de la aplicación depende de los datos con que se cuenta”.



A nivel empresarial, agrega, la analítica de datos puede ser vista como una oportunidad para apoyar la transformación digital en donde procesos bien estructurados y rígidos son mapeados a toma de decisiones basadas en datos; a nivel salud, facilita el estudio de pandemias, su evolución, principales factores y, potencialmente, la cura.

Generación de valor



La gestión del conocimiento, que provee la analítica de datos, es un factor esencial en la concepción de instrumentos de política pública, por lo que su uso, señala el director del Departamento de Ingeniería de Sistemas de Uninorte, “es fundamental en la etapa de diagnóstico con el objetivo de comprender lo que está sucediendo en nuestro país”.



Adicionalmente, dice, aplicando estrategias de machine learning es posible detectar, por ejemplo, factores influyentes (o relevantes) en indicadores sociales como la pobreza. Si en los procesos de elaboración de políticas públicas se incorpora analítica de datos (y no solo análisis exploratorio de datos) el outcome de este proceso sería favorable para detectar las direcciones en las cuales dichas políticas deben ser elaboradas.



“Siendo puntual, métodos de aprendizaje supervisado (y no supervisado) nos darían una mejor radiografía de lo que está ocurriendo en Colombia. No es importante solo observar lo que los datos dicen sino lo que hay detrás de estos, y la manera de hacerlo es: analítica de datos”, recalca el experto.

En medio de la crisis sanitaria



La coyuntura generada por la Covid-19 ha significado importantes retos, uno de ellos: la recopilación de datos en búsqueda de obtener información relevante para lograr un manejo adecuado de la difícil situación por la que atraviesa el país y el mundo.



Así, comenta el doctor Niño-Ruiz, “la analítica de datos ha apoyado la segmentación de pacientes con el objetivo de establecer rutas de recuperación. Se ha identificado, por ejemplo, el comportamiento del virus SARS-Cov-2 en diferentes grupos etarios, género, y departamentos”.



Esta segmentación de pacientes, añade, ha sido crucial en los protocolos de recuperación en distintos países. En muchos de estos, los datasets- conjunto de datos tabulados- relacionados con casos de Covid-19 han sido liberados en repositorios abiertos como Kaggle, con el objetivo de facilitar el acceso a la información y su estudio por parte de investigadores a nivel mundial.



“En Colombia hay una buena iniciativa y existen repositorios, sin embargo, el nivel general en el que se encuentra la información dificulta su análisis específico, el cual podría salvar muchas vidas”, resalta.



Los retos



Colombia viene dando importantes pasos en el desarrollo de este tipo de herramientas tecnológicas con significativos avances, sin embargo, aún hay desafíos por resolver.



El principal reto, reconoce el doctor Niño-Ruiz, es la conectividad. Según cifras de MinTIC solo el 50% de los colombianos tenían acceso a Internet el año pasado mientras que este año, a mediados de junio, solo 6 de cada 10 colombianos tenían acceso al recurso; cifras que hace referencia solo a conectividad, más no a una buena conectividad.



Sin conectividad, argumenta, “no podemos garantizar el acceso a infraestructura que facilite el ciclo de vida de proyectos de analítica, sobre todo, en casos donde la manipulación de grandes volúmenes de información es necesaria. Por otra parte, también son importantes los cambios curriculares en diversos niveles de escolaridad, con el objetivo de transdisciplinariamente crear toda una cultura de manejo de datos”.



De otro lado, Colombia requiere formación pero tampoco existen significativas deficiencias, por lo que, entre otros, el doctor Niño-Ruiz ha venido apoyando el programa Data Science 4 All del gobierno nacional por medio del MinTIC.



“Los retos de este programa están estrictamente relacionados con necesidades reales emergentes de diferentes contextos de nuestro país. Mientras existan datos, será factible explorarlos con el objetivo de extraer información y comprender un poco más la dinámica de, por ejemplo, las empresas. Si esto es posible, entonces es factible mejorar procesos e incluso la toma de decisiones”, puntualiza el director del Departamento de Ingeniería de Sistemas y director del Laboratorio de Matemáticas Aplicadas y Ciencias de la Computación de Uninorte.



