Esas cuestiones llamadas DATOS: Sobre la pirámide de la sabiduría o del conocimiento

Por  Dr. José Ariel Rementeria Piñones (jose.rementeria@usach.cl)

Departamento de Publicidad e Imagen – Académico

Facultad Tecnológica

------------------------------------------------------------------------------------

El término ‘datos’ está de moda, aparece en casi todas partes y no debe extrañar pues los datos son la base de una jerarquía denominada ‘Pirámide del Conocimiento’ o de la Información (Ackoff, 1989) los más atrevidos y elevados la llaman la ‘Pirámide de la Sabiduría’ sin embargo, tal pirámide depende de los simples datos. Entre dato y data no es solo una cuestión de género, el primero es un sustantivo y la otra es un verbo. Los hay para todos los gustos y gustas, si hay datos abiertos también están los cerrados, para que hablar de los datos verdaderos y los falsos (vulgarmente conocidos por fake news), y si seguimos hallaremos los datos distorsionados y por ende los torsionados. Llegando al meollo de la cuestión están los datos científicos, también están los no-científicos. Y los de ultratumba, los metadatos, datos sobre datos, esos que no se ven, pero ahí están, los crípticos llamados; código fuente. Los datos en ciencia han existido desde sus inicios y los científicos desde entonces saben la importancia de ellos. ¿Y de dónde vienen los datos? De ninguna parte, se construyen. Veamos ciertos aspectos de interés sobre los datos antes de intentar responder la consulta de; ¿Cómo se hacen esas cuestiones denominadas datos? Una definición de inicio, según el diccionario de la Real Academia Española (2020) dato es aquello que se da. Datum en latín, lengua en desuso, y significa; ‘aquello que es dado’, una verdadera falacia como lo veremos. Existe hasta una Ciencia de datos (Data Science), es una disciplina relativamente nueva y muy popular en los últimos años. Sin embargo, el término Ciencia de datos es más antiguo de lo esperado. El término se debe a Paul Naur que en 1960 lo usó para significar ‘procesamiento de datos’ en el sentido de la informática (Sundaresan, 2017) y en 1996 el doctor Hayashi utilizó Ciencia de datos en el título de una conferencia (Ueno, 2017). Actualmente, Ciencia de datos está estrechamente relacionado con los términos Minería de datos (Data Mining) que se dedica a descubrir conocimientos en bases de datos y se utilizan herramientas de la estadística e inteligencia artificial para analizar grandes colecciones digitales, conocidas como conjuntos de datos. La minería de datos se usa ampliamente en los negocios, en la investigación científica y en la seguridad ciudadana.

Con la Ciencia de datos está el Big Data, que son conjuntos de datos producidos por personas y/o máquinas que usan o están en Internet, son de tal magnitud que solo pueden almacenarse, analizarse, entenderse y usarse con la ayuda de herramientas y métodos especiales. También existen los Micro Data, información detallada sobre personas particulares, familias, grupos, poblaciones, que formaron parte de una observación de tipo científica.

En 1997 se publicó la primera revista titulada; Data Mining and Knowledge Discovery, entre 2002 y 2003 se lanzaron las primeras revistas de ciencia de datos: Data Science Journal y el Journal of Data Science, consolidando la ciencia de datos como una disciplina emergente.

Pirámide del Conocimiento o de la Información nada nos dice sobre el origen y construcción de los datos, ‘aquello que nos es dado’, es una falacia, los datos no son dados se tienen que extraer de eso que llamamos realidad a través de, al menos, dos acciones; observar y registrar, ambas pueden ser realizadas por personas o máquinas. Todo dato científico es construido por científicos u observadores, los datos son el núcleo de cualquier investigación, lo cual no significa que sean válidos y confiables. Los datos científicos, por su importancia, pasan por rigurosos filtros que tiene la ciencia, mientras tanto los datos son provisorios. Los datos científicos siempre son en grandes cantidades, casi siempre contienen errores, son redundantes, lo que nos dicen o lo que podemos ver, no son datos, es información que es el siguiente nivel en la pirámide o es conocimiento que viene después de la información y por último está la ansiada sabiduría. Por tanto; los datos científicos son una construcción, una interpretación y por ende símbolos que representan una porción de la realidad o de hechos, los datos no son la realidad, se fabrican en grandes magnitudes así se logra cierta calidad, contienen errores los que se eliminan, son redundantes por su importancia, y son la base de todo el conocimiento científico que tenemos de nuestro mundo y universo. Los datos científicos válidos y confiables pueden originar conocimientos válidos y confiables son necesarios, pero no suficientes para la generación de conocimiento científico verdadero. Los datos científicos provisorios, aquellos que no han pasado por los filtros de la validez y confiabilidad originan conocimiento científico provisorio, y los datos científicos con errores originan conocimiento científico erróneo o falso.

En la ciencia, como en todas las actividades humanas existen los atajos, a veces funcionan, en la ciencia por lo general los atajos fracasan, los fraudes por científicos es una realidad y más temprano que tarde se descubren. La ciencia es una actividad humana afecta a todas las virtudes y vicios de la humanidad. Sin embargo, en los momentos de crisis esperamos una respuesta de la ciencia y esperamos que sea la respuesta verdadera, la respuesta correcta. La ciencia verdadera se hace con datos verdaderos, la ciencia correcta se hace con los datos correctos, la ciencia honesta se hace con los datos honestos. Toda episteme, todo conocimiento científico, inicia y termina en una ontología, inicia y termina en la persona que construye dicho conocimiento científico.

El autor, José Ariel Rementeria Piñones, es Doctor en Ciencias de la Información. Académico del Departamento de Publicidad e Imagen, Facultad Tecnológica, Universidad de Santiago de Chile.

Bibliografía

Ackoff, Russell L. (1989). From data to wisdom. Journal of Applied Systems Analysis, 16:3-9.

Sundaresan, Neel. (2017, may 25). The history of data science. Huffpost, Quora. Recuperado desde https://www.huffpost.com/entry/the-history-of-data-scien_b_10116442

Ueno, Maomi. (2017). As the oldest journal of Data Science. Behaviormetrika, 44, 1–2. https://doi.org/10.1007/s41237-016-0011-7

 

“El contenido expresado en esta columna de opinión es de exclusiva responsabilidad de su autor y no representa necesariamente la posición de la Facultad Tecnológica de la Universidad de Santiago de Chile”.