Una de las expresiones más citadas en el terreno tecnológico de los últimos años es el Big Data. Es decir, ese gran volumen de datos, que crece de forma infinita en el universo informático y que puede volverse una masa de información inmanejable. Ese conjunto gigante de datos es utilizado por todo tipo de organizaciones y gobiernos, sirve para obtener ideas que conduzcan a mejores decisiones en los campos más variados, muy especialmente para realizar movimientos de negocios estratégicos. Y, claro, también se puede utilizar para el espionaje, la vigilancia como rutina, la venta de datos personales, el márketing, la invasión comercial dentro de la propia casa de uno. Al mismo tiempo, los expertos coinciden que el uso del Big Data será una herramienta fundamental en el futuro de los sistemas de salud, pues compartir los datos de pacientes e investigadores a nivel global puede ayudar a desarrollar programas de prevención más eficaces y generar estrategias nacionales y transnacionales estandarizadas tras la epidemia de Covid 19 que estamos sufriendo. La medicina y todos los campos de investigación que hoy la rodean y la nutren en plena pandemia, están conformando un cúmulo de información al mismo tiempo que la que multiplicaron los estados y las empresas en este lapso.
El Big Data es estudiado, analizado y abordado por la llamada ciencia de datos que es un campo interdisciplinario que aúna métodos científicos, procesos y sistemas para extraer conocimiento de datos hayan sido estructurados o no. Este concepto revolucionario concentra disciplinas y herramientas de análisis como la estadística, la minería de datos, el aprendizaje automático, y la analítica predictiva. El ganador del premio Turing 1988 (en ciencia de la computación), Jim Gray, la denominó “el cuarto paradigma” de la ciencia (los anteriores son: empírico, teórico y computacional). En este nuevo paradigma, los investigadores se apoyan en sistemas y procesos diferentes a los utilizados en el pasado, como modelos, ecuaciones, algoritmos, evaluación e interpretación de resultados.
El científico de datos Agustín Di Salvo asegura que en un mundo de ciudadanos científicos de datos, cada uno podría descargar la información disponible sobre un problema (crisis económica, aumento de productividad, pobreza), manipularla, analizarla y extraer conclusiones. Así dejaríamos de depender de quienes pre-digieren la información para sostener debates rigurosos sobre datos concretos. “La ciencia de datos es la puerta de entrada a un mundo como ese”, afirma.
En la Argentina tenemos un campo creciente de la industria de datos. El Sistema de Perfil de Riesgo (SIPER) de la AFIP evalúa los comportamientos de pago de los contribuyentes; el sistema de scoring del sistema bancario reúne los datos de movimientos que extrae la plataforma de transporte Cabify o la aplicación de tránsito Waze. También convivimos con el Big Data de las redes sociales como la que produce Facebook y que llega al extremo de manipular datos sobre elecciones políticas, o la minuciosa información que acumula la aplicación Tinder sobre las actitudes y elecciones sexoafectivas de sus usuarios. Por supuesto que se sospecha pero aún no hay certezas de que en esta zona del planeta estas informaciones no se cruzan. Es decir que la vida sexual o las decisiones políticas no influirían todavía en la evaluación que hacen los bancos cuando se pide un crédito, por ejemplo.
La pandemia del Covid-19 reinstauró el debate acerca de la recolección y procesamiento masivo de datos. Mark Zuckerberg, dueño del universo Facebook, remarcó que “el mundo enfrentó pandemias antes, pero esta vez tenemos una nueva superpotencia: la capacidad de recopilar y compartir datos para hacer el bien”. Ningún país llevó tan lejos esta máxima como China, que logró reducir el contagio y la propagación del virus –en una primera etapa- gracias a una rigurosa explotación y sistematización de datos recolectados mediante videovigilancia, el rastreo de teléfonos, y una serie de aplicaciones que cruzan datos sanitarios, georreferenciación y alertas en el celular sobre posibles contactos con infectados.
China está a la vanguardia de la videovigilancia y de la información que allí surge. El pensador de moda, el israelí Yuval Noah Harari sostiene que existe un control biológico, una “vigilancia subcutánea” para detener la epidemia. Por primera vez en la historia, hoy los gobiernos tienen la capacidad de monitorear a toda su población con sensores y algoritmos. China lo hizo al monitorear a la población a través de celulares y cámaras de reconocimiento facial. Si disponen de apps que advierten al portador de un celular que se encuentra cerca de un infectado, ¿acaso no podrían alertarnos de otros peligros? ¿Acaso las actitudes y datos de los portadores de esos celulares no serán luego empleados políticamente para saber cómo responden las emociones del electorado a ciertos estímulos? La famosa manipulación de masas. Recientemente, el Primer Ministro israelí Benjamin Netanhayu autorizó a la Agencia de Seguridad de su país a emplear tecnología antes restrictiva para combatir terroristas a rastrear enfermos de coronavirus; lo hizo a través de un “decreto de emergencia” que desestimó cualquier objeción de la oposición en el Parlamento.
El filósofo coreano alemán Byung-Chul Han señaló que en China “no hay ningún momento de la vida cotidiana que no esté sometido a observación. Se controla cada clic, cada compra, cada contacto, cada actividad en las redes sociales”.
La Inteligencia Artificial (parte fundamental del Big Data) es una aliada clave en la lucha contra el coronavirus porque nos permite enterarnos rápidamente de la existencia de un nuevo brote viral. “Sistemas como BlueDot y Metabiota –con algoritmos que procesan lenguaje natural para monitorear medios de comunicación e informes médicos oficiales– enviaron alertas a fines del año pasado acerca de un nuevo virus en China”, declaró Cecilia Danesi, investigadora y docente de la UBA en Inteligencia Artificial y Derecho. La IA también colabora en detectar el virus y sugerir un tratamiento.
El Big Data es un fenómeno tecnológico en pleno desarrollo e investigación que envuelve a todos los demás. Y allí se encuentran tanto los estados que se aprovechan de la información que tan fácil están recabando, las empresas que obtienen perfiles ideales de consumidores para su propio beneficio, pero también científicos que, como en el presente pandémico, se dedican a reunir información y hacerla crecer y aprovechar para el bien de la humanidad. Es deseable que el paso del coronavirus deje una enseñanza al respecto. Sin embargo, los poderes políticos y económicos llevan la delantera en el uso y manipulación de datos para lucro de una parte ínfima del planeta.
POR HÉCTOR PAVÓN