Trazabilidad del dato

Hace unos años, en plena euforia por el dato, las empresas comenzaron a incorporar el concepto Big Data. Se empezó a gestar el paradigma Data-Driven, que muchas empresas adoptaron como base para la toma de decisión. Las compañías se lanzaron a una carrera por acumular datos, sobre los que poder tomar decisiones. En un modelo que buscaba sistematizar la toma de decisión de los procesos de negocio, en función del dato que manejaba la compañía.

Aunque hace unos años, el modelo Data-Driven era una opción, hoy en día es incuestionable que la mayoría de las empresas lo han adoptado de una manera u otra. El dato es el activo más importante para las compañías y aunque es una frase repetida muchas veces, no reduce lo más mínimo la certeza de esta afirmación. Una empresa que no base sus decisiones en datos, tiene muy complicado sobrevivir en una economía globalizada y en la que la información es un valor estratégico.

Aunque los datos son el combustible con el que funcionan las empresas, no todas le dan la importancia que deberían al dato. Entender que los datos no son activos estáticos, sino que se transforman y manipulan, que tienen su propio ciclo de vida y que es necesario que los procesos de negocio se adapten a ellos, es un reto para muchas empresas hoy en día. 

Conceptos como calidad, integridad, consistencia, unicidad u oportunidad, son claves para que las organizaciones puedan modelar sus procesos de toma de decisión en función de características y propiedades de los datos que manejan. Pero existe un concepto, que no está asociado directamente al dato y que recae por completo del lado de la compañía. Es la capacidad que tiene la organización para explicar el origen, transformación y uso que se realiza del dato, es decir la trazabilidad del dato. Sin un modelo de trazabilidad del dato, las organizaciones se enfrentan a problemas de integridad, consistencia o calidad de los datos. Al no disponer de información veraz sobre el ciclo de vida del dato, los procesos de toma de decisión pueden estar consumiendo datos que  no garanticen la suficiente confianza para la compañía.

¿Qué es la trazabilidad de los datos?

Podemos decir que la trazabilidad de los datos es la capacidad que tiene una organización, para entender el origen, la transformación y el uso que se hace de los datos. Es importante aclarar que la trazabilidad no es una propiedad del dato, como puede ser la integridad o la veracidad. Los procesos de trazabilidad del dato, están desarrollados por las organizaciones, en función de sus propias necesidades, para cumplir con requerimientos, tanto operativos de negocio, como regulatorios.

Un error común en las organizaciones, es asimilar el concepto de trazabilidad del dato, con el conocimiento de dónde está el dato. Este error genera una false sensación de conocimiento sobre la trazabilidad del dato y en muchas ocasiones, afectado a alguna de las propiedades del dato. Por ejemplo, pensar que conocemos que el dato está en un silo de información concreto, aumenta la confianza o calidad del dato, sin tener en cuenta aspectos tales como, quién introdujo el dato en el silo o cuantas veces se ha manipulado.

Los datos, no deberían ser confiables por que estén en un lugar de la organización, deben ser confiables, porque se puede explicar su origen y manipulación. De esta forma, los procesos de toma de decisión, pueden evaluar aspectos como la confiabilidad o calidad del dato.

Componentes del proceso de trazabilidad

El ciclo de vida del proceso de trazabilidad del dato consta de tres etapas fundamentales, las cuales abarcan desde la recolección de datos, hasta su uso y transformación. Aunque los procesos de trazabilidad de los datos, pueden incluir más fases o etapas en función de las necesidades de la organización y pueden llegar a ser mucho más complejos. Estas tres etapas ejemplifican de manera sencilla el ciclo de vida base para cualquier proceso de trazabilidad que queremos implementar en nuestra organización.

Etapa 1: Origen del dato

Esta etapa implica la identificación de manera clara y precisa del sistema, procesos o actor que genera o nos envía el dato. Es importante en esta etapa, no registrar únicamente el origen, sino capturar en la medida de los posible la información relacionada con las condiciones de generación del dato. Con ambas informaciónes, se puede establecer un modelo de catalogación para la credibilidad inicial del dato. Por tanto, para poder construir un proceso de trazabilidad confiable, es necesario tener seguridad, tanto del origen del dato, como el proceso de creación del mismo.

Aunque parece una etapa evidente y sencilla, en muchas ocasiones, las organizaciones pueden contestar la pregunta “¿De dónde viene el dato?”. Pero en muy pocas pueden asegurar las condiciones de generación del mismo. En estos casos, la confianza se base por entero en el origen, sin conocer nada más sobre los datos que se reciben.

Este esquema de confianza basado únicamente en el origen, presenta varios problemas, desde seguridad del dato, hasta integridad del mismo. La confianza no puede estar únicamente en identificar el origen, ya que entornos heterogéneos, en los que varias entidades de distinta índole, colaboran intercambiando datos, un problema de seguridad en uno de los participantes, puede generar una inyección de datos manipulados, en los procesos de las compañías.

Poder compartir entre los distintos participantes, evidencias sobre el tratamiento de los datos, permite construir un modelo más seguro y confiable de trazabilidad de los mismos. Ya que la confianza se construye, no en el proceso de recibir el dato, sino en el paso anterior, el de generación o manipulación del mismo, por parte del remitente.

Etapa 2: Transformaciones del dato

A lo largo de la vida del dato, raramente permanecen intactos, lo normal, es que los datos sean manipulados y transformados por los procesos de negocio de las compañías. Es crucial para la confianza en los procesos de trazabilidad, que se registren todas las operaciones que transforman el dato, con el objetivo de poder reconstruir su historial. Sin el histórico de transformaciones o manipulaciones, los datos pueden llegar a perder su integridad y/o confiabilidad.

Sin un historial de transformaciones del dato, poder aplicar KPIs o reproducir operaciones para garantizar un nivel de explicabilidad, es casi imposible. Este problema para poder entender cómo ha el dato se transforma, sin tener la capacidad de explicar dichas transformaciones, puede convertir al dato en un elemento opaco.

Poder registrar las transformaciones, permite conocer qué se hace con el dato, en que orden se han realizado las transformaciones y bajo qué condiciones o criterios. Lo importante no es saber qué procesos de negocio lo han transformando, sino cómo lo han transformado. De esta forma se generan modelos de trazabilidad del dato más transparentes, que ayudan a explicar el ciclo de vida del dato a lo largo del tiempo e identificar cómo los procesos participaron en su transformación.

Desde la perspectiva de la compañía, el registrar las transformaciones del dato, ayuda a implementar un modelo de explicabilidad del dato en un marco temporal explícito. Asociando de manera segura, el proceso de transformación con el tiempo en el que se produjo. A lo largo del ciclo de vida de un proceso de negocio, el cual se va transformando, poder explicar cómo dicho proceso ha impactado en el ciclo de vida del dato, es crucial para muchas organizaciones, que necesitan conocer, no solo el qué, sino el cómo y el cuándo.

Etapa 3: Uso del dato

Uno de los mayores errores que cometen las organizaciones cuando despliegan procesos de trazabilidad del dato, es pensar que una vez que sabemos de dónde viene el dato y cómo se transforma, el proceso ha finalizado. Conocer cómo se están utilizando los datos, las personas o procesos que los emplean y en la medida de lo posible, medir el impacto que dicho uso tiene en la organización, es parte del ciclo de vida del dato.

Registrar el uso del dato implica identificar a los consumidores finales. El mismo dato puede alimentar un informe ejecutivo, un cuadro de mandos o un modelo analítico. Sin una trazabilidad clara de todo el proceso, las organizaciones pueden perder la capacidad de evaluar el impacto real del dato. Por ejemplo, un dato válido para una prospección de clientes, puede no ser aceptable para una decisión en un proceso de cumplimiento.

Desde el punto de vista de la gobernanza, esta etapa transforma el dato de un activo informacional a un activo determinante para la toma de decisiones. Registrar el uso obliga a las compañías a reconocer que en función del uso que se haga del dato, estos tendrán un impacto real en los resultados y que dicho impacto tiene efectos reales que deben ser explicados.

Por último, esta fase genera un beneficio, que permite incrementar la calidad del dato, ya que vincula el dato con las personas o procesos que lo consumen, generando una relación entre el dato, su consumidor y el resultado que genera. Este modelo crea una relación de responsabilidad, en el que el dato no es activo manipulado de manera anónima, sino que existe un registro que  vincula al dato y a la persona o proceso que lo usa, asignando responsabilidad de forma explícita.

Datos dentro y fuera de la organización

En las organizaciones hay una falsa sensación de control, en que si el dato está dentro de las fronteras de mi organizaciones, la trazabilidad es fácil de implementar. Pero son raras las grandes compañías, que no tienen compartimentado sus procesos de negocio en distintos sistemas de información y aplicaciones, con sus propios silos de datos y proveedores de servicios SaaS externos. Al fin y al cabo, las grandes organizaciones suelen ser desde el punto de vista de los sistemas de información, un conjunto de muchas organizaciones más pequeñas, que están conectadas entre sí y que permiten cierto nivel de interoperabilidad.

Implementar un proceso de gestión de la trazabilidad del dato en una organización grande, presenta casi los mismos problemas que si lo hacemos sobre un consorcio de empresas más pequeñas. Cómo hemos visto en las secciones anteriores, tener un conocimiento sobre el origen del dato, cómo se transforma, quién y cuándo se usa, da a las compañías una ventaja competitiva a la hora de tomar decisiones. Y que el dato esté dentro de una gran organización, no garantiza que la trazabilidad sea la correcta, de hecho puede generar problemas de accesibilidad y confianza en los datos. 

La gestión de la trazabilidad ayuda a romper con la idea muy extendida en corporaciones, que los datos son propiedad de los departamentos, generando un conocimiento transversal a la organización sobre el uso del dato y estableciendo un esquema claro de responsabilidad sobre cada una de las etapas de su ciclo de vida.

En entornos corporativos, pensar que no se necesita una gestión de la trazabilidad del dato, provoca una falsa sensación de control sobre el dato y promueve la opacidad y manipulación de los mismos. Los actores no están obligados a explicar cómo se generan los datos, cómo se manipulan, cuándo y dónde se utilizan, lo que desemboca en la creación de silos ocultos a la organización, que se utilizan como base para la toma de decisiones. Con el consiguiente perjuicio para el rendimiento de los procesos de negocio y la toma de decisión. Además de los problemas de falta de aplicabilidad frente a auditorías o requerimientos regulatorios.

El esquema anterior muestra un ejemplo del ciclo de vida de un dato. El dato es compartido por distintos departamentos dentro de la organización, los cuales van registrando eventos sobre las transformaciones y uso que se van realizando sobre el dato. En todo momento, cualquiera de los otros participantes puede consultar la trazabilidad del dato, para obtener un historial completo de su ciclo de vida. Esta información ayuda a cada departamento a tomar decisiones que pueden ser explicadas en un futuro.

Datos fuera de la organización

Cuando hablamos de entornos en los que el dato procede de un actor externo a la organización, la trazabilidad del dato se vuelve crítica. Tomar decisiones sobre un dato, sin poder evaluar la calidad y confianza del mismo, es un riesgo enorme para cualquier organización. Desde problemas regulatorios o de contexto, hasta problemas relacionados con la seguridad e integridad del dato. Si dentro de la organización, poder garantizar la trazabilidad del dato se convierte en un ventaja, que permite a los procesos ser más confiables y explicables. Garantizar la confiabilidad y explicabilidad de los datos, cuando estos vienen de fuera de la organización, la trazabilidad del dato se vuelve prioritaria.

Aunque el ciclo de vida del proceso de trazabilidad, básicamente es el mismo, tanto si el dato es interno a la organización, como si el dato proviene del exterior, en este último caso, se debe garantizar la trazabilidad mediante evidencias que sean irrefutables. Ya no podemos pensar en una solución centralizada que registra evidencias del ciclo de vida del dato. La visibilidad de parte de la información que conforma la trazabilidad del dato y que ayuda a dar mayor confianza, no es accesible por los actores que están fuera de la organización. Crear un entorno de confianza entre actores, que tienen limitado el acceso a información de trazabilidad, es un reto para las compañías.

La siguiente figura muestra un ejemplo de dos organizaciones (X e Y) que comparte datos, mediante un proceso en el que el Departamento D de la organización X envía un dato al Departamento B de la organización Y.

En este ejemplo, el Departamento D de la organización X no implementa ningún proceso de accesibilidad a la trazabilidad de dato, para que el Departamento B de la organización Y pueda evaluar la confianza o calidad del dato que recibe. La trazabilidad del dato se rompe en este punto. Una solución sería establecer una forma para que ambas organizaciones puedan confiar en los datos que comparten. El siguiente esquema, muestra un ejemplo de la arquitectura de una solución que permita registrar los eventos relacionados con la trazabilidad del dato, para garantizar que dicha trazabilidad es confiable.

Este elemento intermedio, que permite el registro de parte de la información relacionada con la trazabilidad del dato, debería presentar una serie de características que permitan a ambas organizaciones construir un modelo de confianza sobre la solución de trazabilidad del dato. La tecnología Blockchain aporta estas características, gracias a cualidades como la inmutabilidad o la trazabilidad de los datos que maneja.

Conclusión

La trazabilidad del dato se ha transformado en uno de los pilares fundamentales del paradigma Data-Driven. En un contexto, en el los procesos de negocio se deben construir sobre datos confiables y de calidad, construir un modelo de trazabilidad del dato que garantice la capacidad de explicar el origen, la transformación y el uso de los datos, es crucial para cualquier organización.

A lo largo del artículo, se ha puesto de manifiesto que la trazabilidad no es una propiedad inherente del dato, sino una capacidad de la organización por construir un modelo claro, seguro y confiable que incremente el valor del dato. Además este modelo de trazabilidad, no debe quedar reducido a los datos gestionados de manera interna a la organización, debe poder traspasar dichas fronteras, para dar confianza a los datos procedentes del exterior de la compañía. Poder garantizar la trazabilidad de datos externos, es imprescindible para muchos de los entornos actuales, en los que las compañías comparten datos críticos para el negocio con socios o clientes.

Como veremos en el artículo siguiente, la tecnología blockchain es un habilitador perfecto para desarrollar modelos de trazabilidad del dato, tanto dentro del dominio de la organización, como en entornos heterogéneos, en los que distintas organizaciones comparten y transforman datos, por ejemplo en logística o Economía Circular.

José Mora

José Juan Mora Pérez – CTO

Últimas Noticias

Categorias

Trabaja con Nosotros

En Kolokium estamos siempre buscando talento, gente inquieta que no le tenga miedo a los retos, si quieres trabajar con tecnologías Blockchain.

INNOVACIÓN

COLABORAMOS EN INICIATIVAS PÚBLICO/PRIVADAS ORIENTADAS A EXPLORAR LAS POSIBILIDADES DE LA TECNOLOGÍA BLOCKCHAIN EN DISTINTOS HÁBITO INDUSTRIALES Y CORPORATIVOS
neotec

PRIOPS

El proyecto PRIOPS ha recibido el apoyo del CDTI por medio de su programa Neotec 2018, en el que se le ha concedido una subvención de 247.618 €

apia

APIA

Plataforma integral para la auditoría inteligente de obra civil basado en la captura y parametrización automática de identidades de obra en el modelo de información BIM y la certificación mediante Blockchain de su producción, financiado por el CDTI y cofinanciado por el FEDER

Consorcio: AZVI, EMERGYA, GRANT THORNTON Y KOLOKIUM
Plazo de ejecución: septiembre de 2018 a diciembre 2020
Presupuesto Total: 2.218.874,00€

k1

K 1

Framework para la generación y despliegue automatizado de smart contracts en arquitecturas distribuidas Ethereum e Hyperledger Fabric. Proyecto financiado con el apoyo

K1_FRAMEWORK PARA LA GENERACIÓN Y DESPLIEGUE AUTOMATIZADO DE SMART CONTRACTS EN LOS BLOCKCHAINS DE ETHEREUM E HYPERLEDGER del CDTI con fondos propios a través de la convocatoria INNOGLOBAL 2017 y apoyado por el Ministerio de Economía, Industria y Competitividad.

Consorcio: KOLOKIUM BLOCKCHAIN TECHNOLOGIES y GRUPO CADENA (Colombia)
Plazo de ejecución: octubre de 2017 a septiembre de 2019
Presupuesto KOLOKIUM: 381.440€

Logos Paravasis

PARAVASIS

PARAVASIS es un proyecto Subvencionado por el CDTI que ha sido apoyado por el Ministerio de Ciencia e Innovación, y que investiga en nuevas tecnologías para que haya una mejora sustancial en la flexibilidad y productividad del proceso de diseño y desarrollo de sistemas industriales complejos favoreciendo la personalización de nuevos productos intensivos en software y considerando además el mejor balance de tiempo, capacidad y coste, así como la seguridad.

Consorcio: Ghenova Digital, DHG, Integrasys, Cotesa, Capgemini Engineering, Optiva Media, Kolokium y Komorebi.

Plazo de ejecución: 01/10/2022 – 30/06/2025

Presupuesto Global: 5.364.425,00 €
Presupuesto Kolokium: 437.163,00 

Logos Valrec

VALREC

El objetivo principal del Proyecto VALREC es la investigación industrial y la demostrar nuevas soluciones avanzadas y de coste efectivo que garanticen un cierre de ciclos más eficiente y trazable (incremento de la confianza de materiales secundarios en el mercado) de grandes volúmenes de recursos materiales de construcción mayoritarios (principalmente hormigón, cerámico y yeso) a lo largo de toda la cadena de suministro de los mismos.
El proyecto VALREC “Soluciones innovadoras para fomentar la VALorización de RCD y la utilización de materiales Recuperados bajo criterios de Economía Circular en la CAM” ha sido subvencionado a través de la Convocatoria 2020 de las ayudas cofinanciadas por el Fondo Europeo de Desarrollo Regional para contribuir a la mejora de la Cooperación Público - Privada en materia de I+D+i mediante el apoyo a Proyectos de Innovación Tecnológica de efecto tractor elaborados por núcleos de innovación abierta en la Comunidad de Madrid, en el marco de la Estrategia Regional de Investigación e Innovación para una Especialización Inteligente (RIS3), dentro del Programa Operativo FEDER de la Comunidad de Madrid para el periodo 2014-2020.
Consorcio: SURGE AMBIENTAL (SURGE), VALORIZA SERVICIOS MEDIOAMBIENTALES (VSM), ADCORE, KOLOKIUM BLOCKCHAIN TECHNOLOGIES, ALLGAIER MOGENSEN, SODIRA IBERIA, SIKA, HORMICRUZ, GREEN BUILDING COUNCIL ESPAÑA (GBCe).
Plazo de ejecución: 17/11/2021 - 17/11/2023
Presupuesto Global: 4.063.243,14 €
Presupuesto Kolokium: 256.700,00 €

KOLBLM

Completa el formulario para descargar​

KOLBI

Completa el formulario para descargar​

KOLFSB

Completa el formulario para descargar