La calidad del dato

B+ dataCleanser

766
Son evidentes las enormes posibilidades que se abren, tanto para los individuos como para las empresas, a partir del big data. No obstante, el auténtico potencial de este avance tecnológico solo puede alcanzarse si la materia prima que se emplea en el proceso tiene calidad. Es decir, los datos o la información con la que se ha de trabajar sea simple y esté perfectamente depurada. Si no se cumple esta premisa, los sistemas pueden poblarse de datos que ofrecen una imagen distorsionada de la realidad que queramos abordar o gestionar. Y esta disfunción tiene efectos adversos en la cuenta de resultados.

Según ponen de manifiesto diversos estudios, en 2010 se generaron y almacenaron en las empresas, a nivel mundial, más de 6.500 petabytes de datos (≈6.500 millones de gigabytes), con la particularidad de que su origen es múltiple y que los flujos de carga no están unificados, lo que hace prácticamente imposible poder detectar errores en la información que resulta consolidada. Desde hace muchos años, la industria tecnológica ha tratado de desarrollar aplicaciones para gestionar la información, pero quizás nunca antes como ahora se ha conseguido alcanzar un estándar de gestión tan sofisticado y eficaz, capaz además de reducir de forma drástica los costes de transformación y gestión de la misma.

En la práctica, las empresas se encuentra en su día a día con errores en los datos maestros, duplicidades de información o detalles incompletos, que redundan en análisis defectuosos de los datos y, lo que es peor, en estrategias y planificaciones condenadas al fracaso por partir de premisas erróneas. Desde un punto de vista puramente tecnológico, esta disfunción se traduce en una mayor complejidad en el proceso de consolidación de la información entre los nuevos sistemas y los existentes. Desde el punto de vista del negocio, lo más frecuente es tropezar con una ineficiencia de los procesos que deriva en una disminución de los ingresos, amén de incurrirse en unos costes incontrolados. En definitiva, estamos hablando de una pérdida de confianza en la información que nos proporcionan las distintas áreas de la empresa y, por tanto, en una pérdida de perspectiva para el negocio.

B+ dataCleanser ayuda a consolidar la información de clientes, proveedores y materiales

Basado en SAP Data Services

Conscientes de que el pilar fundamental para acometer cualquier proceso de transformación digital en la empresa pasa por depurar la información y tener unos datos maestros correctos, la suite The Techedge B+ Suite incorpora la herramienta B+ dataCleanser. Se trata de una solución basada en tecnología SAP, en concreto SAP Data Services, que facilita tres funciones fundamentales a la hora de trabajar con datos: la extracción, transformación y carga en cualquier sistema y dispositivo.

Desde Techedge hemos incorporado sobre el producto base varias capas de funcionalidades que dan respuesta a necesidades reales que hemos detectado a partir de nuestra experiencia a la hora de acometer proyectos de digitalización en diferentes sectores de actividad. Esta forma de concebir el desarrollo de soluciones tecnológicas aporta valor a las empresas, en la medida en que posibilita implementaciones más rápidas y asequibles.

La primera de ellas consiste en facilitar la extracción de información desde diversas fuentes y sistemas, con el fin de consolidarla en cualquier plataforma de gestión de la empresa, ya sea un ERP, un CRM o un data warehouse, y tanto de soluciones SAP como de cualquier otra firma. A partir de esta función, el siguiente paso consiste en proceder a la depuración o transformación de los datos a través de cuatro procedimientos que resuelve esta solución: data cleanse, address cleanse, geocoding y matching.

Data cleanse y address cleanse proporcionan transformaciones (en múltiples idiomas) de calidad de datos, lo que permite mejorar y completar la calidad de la información. Por ejemplo, se encarga de limpiar números de teléfono, direcciones de correo electrónico, DNI, nombres propios o direcciones postales. Todo ello redunda en un alto grado de calidad en los datos maestros. Además, en un orden práctico, tiene efectos positivos en los resultados de campañas de marketing directo, en la optimización de las rutas de reparto o en la planificación de la estrategia comercial, haciendo posible la segmentación del mercado mediante el cruce de datos con indicadores demográficos.

B+ dataCleanser permite también la geocodificación de direcciones, de forma tanto directa como inversa, mediante la asignación a cada dato de unas coordenadas de longitud y latitud. De esta manera, se abren nuevas posibilidades para la puesta en marcha de una estrategia analítica en todos los procesos de la empresa, tanto en lo que respecta a la organización logística como al marketing (convertido ahora en geomarketing), con posibilidad real de seleccionar clientes potenciales según determinadas zonas de influencia o la evaluación estratégica de regiones y zonas.

Por último, proporciona transformaciones que permiten identificar y asociar registros que representan una misma entidad o que están duplicados, completando aquellos que presentan carencias de información, como errores ortográficos o tipográficos, abreviaturas, acrónimos o fallos cometidos al introducir los datos en el sistema. Estos procesos de “deduplicación” son imprescindibles no solo para eliminar registros y datos redundantes, sino también para proyectos de consolidación de fuentes de información y enriquecimiento de datos, o integración y consolidación de información existente en diferentes bases de datos y/o sistemas de información.

Se abren nuevas posibilidades en cuanto a la estrategia analítica

Sector distribución

Uno de los proyectos más ambiciosos que hemos desarrollado en el campo de la gestión de datos ha sido el realizado para diversas compañías de distribución en España. Estas empresas contaban con varios distribuidores, clientes todos ellos en la práctica, que cada noche enviaban a la compañía un fichero con la información relativa a las transacciones realizadas en los diferentes puntos de venta. Después de consolidarla, cargaban esta información en su CRM o data warehouse. El reto provenía de la gran cantidad de datos registrados y de los defectos que registraban en forma de datos redundantes o duplicados, ya que en numerosas ocasiones a un mismo cliente se le asignaba un nombre diferente en el sistema.

En el proyecto nos encargamos de la extracción, transformación y carga de los datos en los sistemas destino, a fin de que el equipo comercial pudiera acceder a ellos en una tableta y así obtener informes en tiempo real sobre un mapa. Gracias a B+ dataCleanser, fue posible identificar de forma gráfica la estructura de sus ventas por áreas geográficas y detectar importantes incidencias. Por ejemplo, se advirtió que la venta de algunos distribuidores descendía en determinadas áreas urbanas.

La incorporación al producto de capacidades de geolocalización y visualización de calles permitió a alguna de estas compañías descender más al detalle y estudiar la configuración de las vías donde se había producido una caída significativa de las ventas. En todas ellas se daba el mismo denominador común: eran zonas peatonales y de difícil acceso para los camiones que efectuaban el reparto, lo que suponía una barrera discriminatoria para esos puntos de venta. Sencillamente, era más cómodo y rápido para ellos centrarse en los puntos de venta sin problemas de accesibilidad, incluso al precio de otorgar una oportunidad a otros operadores del mercado que estuviesen dispuestos a superar este obstáculo con tal de ganar cuota de mercado.

A partir de este análisis, se introdujeron medidas correctivas en sus estrategias comerciales y en la fuerza de ventas. Una vez corregida la situación, las ventas se incrementaron.