Más allá del modelo data driven. La implantación de un modelo de gobierno del dato es una disciplina integral: tecnológica, organizativa y procedimental. Un asesor externo puede desempeñar un papel fundamental en las fases de diseño, implantación, acompañamiento y mejora. Un rol que variará en función del nivel de madurez de las compañías y la complejidad del sistema de partida. Esto no es exclusivo del ámbito privado: las Administraciones Públicas muestran una sensibilidad cada vez mayor y están desarrollando el modelo de Espacio de Datos como respuesta a este reto.

Recurrir al tópico de que los datos (o la información que de ellos se extrae) son el petróleo del siglo XXI a menudo enmascara cuál es la situación real y los retos que deben acometer las organizaciones para explotar adecuadamente este potencial. Desde luego, lo que es evidente es que la barrera tecnológica no es el principal escollo. Hoy en día existe una amplia variedad de tecnologías y soluciones a precios extremadamente competitivos y que corren en los entornos clásicos de data warehouse y datalakes en todas sus modalidades (on-premise, cloud o híbridos).

Esta circunstancia facilita su adopción, aunque, paradójicamente, exige también un esfuerzo adicional de selección, adecuación y puesta en marcha. En esencia, el del dato es un mundo de toma de decisiones, donde se busca proporcionar información fiable (datos validados por la organización), de calidad evidenciable (concepto en el que nunca se pone la suficiente atención), en plazo y tiempo para que sea útil, y, por supuesto, con un coste tan reducido como sea posible.

El papel del asesor varía en función del nivel de madurez en el que se encuentren las empresas

La gran barrera es, sin duda, la dificultad de entender y comprender el dato que se tiene, asumiendo que es un activo en la organización y debe ser tratado como tal. Su valor existe en la medida en que forma parte de los procesos de la empresa, y exige una disciplina, organización, metodologías y tecnología que permitan alcanzar estos fines. Además, incluyamos en este coctel el impacto que tiene el uso de la inteligencia artificial y cómo podemos utilizarla como un activo más para tomar decisiones en las que se consumen y se generan nuevos datos.

El conocimiento del dato

Ante esta tesitura, resulta imprescindible coger un poco de aire, levantar la vista y reflexionar acerca de cómo y de qué manera podemos empezar a pasar de una organización que utiliza cuadros de mando y reporting a otra donde el dato es un argumento importante o incluso central.

La historia reciente en cuanto a este tipo de proyectos está repleta de decepciones: data warehouses que son casi imposibles de modificar por el impacto que tienen, data lakes con información que nadie sabe exactamente de dónde viene o para qué sirve, o modelos en cloud que arrastran estos mismos problemas.

La historia reciente en cuanto a este tipo de proyectos está repleta de decepciones

Estos proyectos, considerados de forma individual, han sido acertados en la mayoría de los casos, pero en el contexto actual suponen un freno al desarrollo de nuevas iniciativas tales como la incorporación de la inteligencia artificial.

En muchos casos, un elemento esencial —el conocimiento del dato— se tomó en cuenta de forma parcial. Se abordaron prácticas de calidad del dato (cuando se adoptaron) exclusivamente centradas en el proceso que se trataba, obviando el hecho de que los datos deben adquirir un contexto dentro de un plano mayor, de tal forma que la vista que posea cualquiera de los consumidores de datos sea la misma. En este contexto es donde podemos encontrar el germen del gobierno del dato. Las organizaciones deben dotarse de una disciplina capaz de abordar el ciclo de vida completo del dato desde el punto de vista empresarial, así como desde el de los mecanismos, la organización y las herramientas necesarias para este fin.

El asesor y el nivel de madurez

El papel de un asesor en este proceso resulta crucial, ya que posee una visión integral del problema y del abanico de soluciones, y cuenta con una metodología clara y precisa que permite a la organización de dotarse de los conocimientos específicos para el desarrollo de su trabajo. Las aproximaciones que se realizan pueden ser muy variadas y dependen en última instancia del grado de madurez de las compañías.

Las organizaciones deben dotarse de una disciplina capaz de abordar el ciclo de vida completo del dato desde el punto de vista empresarial

Nivel 0. Normalmente no requieren un gobierno del dato propiamente dicho. Sus necesidades de información quedan cubiertas por productos estándar o con las capacidades de autoservicio que proporcionan ahora diferentes fabricantes. El nivel de complejidad es reducido y, por lo general, no existe una necesidad elevada.

Nivel 1. Existe la conciencia de que es necesario abordarlo, pero no existe ninguna de las estructuras que pueden soportar este proceso más allá de un área de reporting o de business intelligence clásico.

Nivel 2. La organización tiene el proceso en marcha, se ha empezado a dotar de los mecanismos adecuados y ha abordado ya algunos procesos internos sobre herramientas y soluciones específicas.

Nivel 3. La oficina del dato está constituida, dotada de un plan estratégico con alineamiento de dirección y focalizada en mejorar y en efectuar aportaciones a negocio.

El papel del asesor varía en función del grado de madurez en el que se encuentren las empresas. En el primer nivel lo razonable es abordar una auditoría de su sistema actual y enfrentar el proyecto con un modelo técnico y funcional para obtener, al menos, un blueprint tecnológico y otro de negocio. En esta fase es razonable también formular una propuesta de arquitectura de datos que permita definir cuál es el modelo más conveniente: datamart, datalake, cloud data o datamesh.

En el primer nivel lo razonable es abordar una auditoría del sistema actual y enfrentar el proyecto con un modelo técnico y funcional

Una vez alcanzada una madurez aceptable, el proceso se debe centrar en las áreas de negocio, en el desarrollo de un plan estratégico adecuado, en definir el plan de migración de los sistemas ya existentes —siempre a partir del modelo seleccionado— y analizar cómo impacta la inteligencia artificial en el modelo y la compañía. Existen diferencias sustanciales entre un modelo data driven simple, orientado al desarrollo de visiones transversales, o uno complejo, basado en modelos funcionales, que implicaría un cambio de paradigma fundamental en la forma de abordar los proyectos.

El dato como servicio

La evolución tecnológica y funcional abre un camino para el apoyo en el último nivel de madurez. El ciclo de vida del dato se empareja con su homólogo en la parte de inteligencia artificial, lo que permite ir hacia los conceptos de fábrica de datos o dato como servicio, en los que los consumidores y productores de información se organizan en comunidades —pub/subs— de tal forma que la información “persigue” a los usuarios finales que previamente han autorizado el acceso al dato.

Este modelo, ya en marcha en el ámbito privado, tiene su reflejo en las iniciativas de Espacios de Datos para la Administración Pública, y más concretamente en la visión de open data. Bajo este modelo se ofrecería al consumidor un abanico de datos y su actualización permanente. Incluso, se constituye un algorithm-market destinado a proporcionar acceso a un conjunto de algoritmos asociados a sus datasets con la finalidad de apoyar al tejido empresarial, científico, docente, etc.

La figura del asesor externo, en la mayoría de los casos, se torna crítica pues proporciona conocimientos, experiencia y solidez a la hora de acompañar en el tránsito por los diferentes niveles de madurez de gobierno del dato.