Científicos de datos

ADN

ADN

Compartimos el artículo de Diario El Telégrafo en el que César Paz y Miño, Decano del Instituto de Investigaciones Biomédicas, habla sobre los científicos de datos.
Mira la noticia aquí

Es abrumadora la cantidad de datos que existe en el mundo; se calcula en 2,5 trillones de bytes. Como ejemplos, solo Netflix pone a disposición 100 millones de películas; son 230 mil artículos en las leyes ecuatorianas; hay 30 mil enfermedades descritas, 10 mil afecciones genéticas y 23 mil genes.

Toda esta información no cabe en una computadora ni es suficiente ser experto en computación para analizarla. Se necesitan entonces los llamados científicos de datos, nueva profesión que condensa una mezcla de informática, tecnología, negocios y ciencia.

Se calcula que el 80% de datos existentes no está procesado ni estandarizado. Así sucede con los recibos de compras sobre los que no se han realizado suficientes análisis para establecer políticas comerciales, sectorización de productos, etc.

También imágenes, videos, datos de sensores remotos y más, están esperando ser catalogados. Google tiene unas 600 personas sistematizando una diversidad de datos. En biomedicina o genética, la cantidad de información en una institución promedio excede su infraestructura tecnológica para almacenarla. La secuencia completa de un genoma humano ocupa 4 terabytes y el análisis de 100 individuos requiere un servidor gigantesco que solo tienen contados sitios en el mundo.

Tantos datos demandan  expertos para su análisis. No existe en las universidades del país una carrera que reúna las características de un científico de datos, que debe ser un híbrido entre tecnólogo y analista cuantitativo, sin descartar que tenga estudios en física, biología o ciencias sociales, con capacidad de extraer del ‘big data’ lo útil y discernir lo que sea importante para orientar una organización, un negocio o una investigación.

El científico de datos está a la cabeza de la lista de demanda de empleo y es de los perfiles mejor cotizados. Se piensa que la necesidad real de científicos de datos es del 20% en una institución. En las universidades se empieza  a hablar de bioinformáticos y quimioinformáticos que analicen los megadatos genómicos.

El Instituto de Investigaciones Biomédicas de la UDLA cuenta con profesionales especializados en extraer del big data los genes de predisposición a enfermedades como la preclampsia y eclampsia, esquizofrenia, celíacos, cánceres y genes de susceptibilidad al párkinson.

La tarea es enorme. Aunque en un inicio los científicos de datos se han asociado al rol de las empresas y al marketing, es claro que en ciencia son claves para el avance del conocimiento y son una buena respuesta al quehacer científico teórico y de bajo costo. (O)