La necesidad de establecer la propiedad de los datos

Uno de los factores clave de éxito en implantaciones de iniciativas de Data Governance es el rol de data stewardship o "propiedad de los datos". La propiedad de los datos es la formalización de las responsabilidades que garantizan un control y un uso efectivo de los activos de los datos.

Los propietarios de los datos son usuarios de negocio, expertos en determinadas áreas temáticas designados como responsables para gestionar los datos en nombre de los demás usuarios. Estos representan los intereses de todas las partes involucradas, incluyendo pero no limitándose, a los intereses de sus propias áreas funcionales y departamentos protegiendo, administrando y reaprovechando los recursos de datos.

Estos perfiles deben tener una perspectiva de negocio para garantizar la calidad y el uso eficaz de los datos de la organización. El proceso de gobierno de los datos involucrará a los propietarios como participantes, pero además estos serán directamente responsables del éxito de la gestión de los datos en sus dominios.

En la práctica no existe un modelo "bala de plata" que encaje para todas las organizaciones. Básicamente existen cinco modelos de propiedad de los datos que las organizaciones pueden aplicar, siendo cada uno de estos modelos único, con sus propios pros y contras:

  • Modelo 1: propiedad por áreas temáticas. En este modelo cada propietario de los datos gestiona un área temática determinada, así pues el responsable de los datos de los clientes es diferente del responsable de los datos de productos, etc. En entornos grandes o complejos, puede existir más de un propietario para cada área temática. Este modelo funciona bien en compañías con múltiples departamentos que compartan los mismos datos.
     
  • Modelo 2: propiedad por funciones de negocio. En este caso el propietario de los datos se centra en los datos que un departamento o línea de negocio utiliza, como pueden ser los datos relacionados con marketing, finanzas, ventas, etc. Dependiendo del tamaño de la organización y complejidad en la administración de los datos puede ser que existan otros propietarios de datos por áreas temáticas, resultando un modelo híbrido con el anterior.
     
  • Modelo 3: propiedad por procesos de negocio. Para cada proceso de negocio se asigna un responsable de los datos, en este caso los propietarios de los datos son responsables sobre múltiples dominios de los datos o aplicaciones que participan sobre un determinado proceso de negocio. Nos encontramos ante un modelo muy efectivo para compañías con una orientación y una definición muy clara de sus procesos de negocio, en organizaciones en las que no existe una cultura de procesos o es inmadura este acercamiento no es la mejor elección.
     
  • Modelo 4: propiedad por sistemas TIC. Los responsables de los datos son asignados a las aplicaciones que generan los datos que utilizan. Este modelo es una manera de evangelizar el concepto de propiedad de los datos desde el departamento TIC a las distintas unidades de negocio. Los propietarios de los datos pueden comunicar el progreso de la iniciativa y mostrar como los datos no únicamente van mejorando a lo largo del tiempo, sino que además van afectando a los resultados del negocio.
     
  • Modelo 5: propiedad por proyectos. El asociar el concepto de propiedad de los datos a proyectos es una manera rápida y práctica de introducir la cultura de administración de los datos en la organización. De manera contraria al resto de modelos comentados anteriormente ésta es una medida temporal, que suele utilizarse como punto de partida para el establecimiento de otro modelo formal a largo plazo.

El decidir el modelo de propiedad de datos ideal para nuestra organización no es una tarea trivial en la que debemos plantearnos una serie de factores tales como:

  • Los perfiles y habilidades disponibles en la organización para la gestión de los datos.
  • La cultura de la compañía.
  • La reputación de la calidad de los datos.
  • La situación actual respecto a la propiedad de los datos.
  • El uso actual de métricas asociadas a la calidad de los datos.
  • Las necesidades de reutilización de los datos.