Historias de éxito: Record Linkage

Introducción

Una de las formas que tenemos en Damavis de ayudar a nuestros clientes es a través de la implantación de soluciones de Record Linkage. Este tipo de procesos permite encontrar registros que se refieren a la misma entidad pero que se encuentran en distintas fuentes de datos.

Gracias al Record Linkage es posible integrar, unificar y vincular registros presentes en diferentes fuentes de datos, que carecen de identificadores únicos, para crear relaciones entre aquellos que comparten una misma propiedad.

Situación actual

Nuestro cliente es una empresa de distribución hotelera, con más de 400 mil alojamientos por todo el mundo, que necesita sincronizar los datos en el máster de hoteles con más de 30 proveedores diferentes. 

Además, al tratarse de proveedores diferentes, cada uno de ellos reporta la información de forma distinta, haciendo necesario que esa información se gestione para procesarla en el maestro principal de hoteles. 

Hasta este momento, este proceso se realizaba de forma manual por un equipo de personas que se encargaba de comprobar y extraer los datos de los proveedores para cotejarlos con el máster y poder así sincronizar la información.

El reto

Una vez analizado el contexto de la empresa y sus necesidades, trabajamos codo a codo con el cliente para determinar de qué forma podíamos mejorar los procesos y la operativa de la compañía, además de aportar un valor añadido.Así pues, acordamos que lo más conveniente era implementar un modelo de Machine Learning que ayudara al equipo que, hasta el momento, procesaba los datos diariamente y de forma manual, a ser más ágiles y efectivos en esta tarea.

La solución

Para la automatización del procesamiento y la sincronización de la información en el máster principal de hoteles, desarrollamos un modelo de Machine Learning que recogía los datos, interpretaba la información conjunta de todos los proveedores y aprendía a identificar los inputs para saber si se trataba del mismo hotel o de diferentes alojamientos en cada uno de los proveedores.

De esta forma, un proceso totalmente autónomo era capaz cada día, tras recibir las nuevas actualizaciones, de tomar decisiones relativas a: 

  • si los datos pertenecían a un hotel ya existente en la base de datos y, en ese caso, saber cuál era; 
  • si era un hotel que aún no estaba en la base de datos y, por tanto, había que crear su ficha con toda la información ya recogida; 
  • o si se trataba de un input totalmente nuevo que llegaba y ofrecía la información suficiente como para saber si varios de los registros que existían en la base de datos pertenecían al mismo hotel, en cuyo caso, habría que combinarlos.

Los resultados

La principal ventaja para el cliente tras la implementación de este modelo fue la automatización de un proceso que se estaba realizando manualmente hasta el momento. 

Por otra parte, este modelo de Machine Learning lograba ofrecer una alta fiabilidad en las decisiones que tomaba, lo que se traduce en una mayor eficacia y eficiencia para el equipo de trabajo.

Esto repercutió en un importante ahorro de costes para la organización y también de tiempo para el equipo encargado de esta tarea, pues únicamente tenían que supervisar un modelo que ya tomaba decisiones de forma autónoma, ayudándoles así a simplificar el proceso para que pudieran invertir sus recursos en otras áreas.

De esta forma, guiamos a nuestro cliente hacia la adopción de un enfoque Data Driven, la toma de decisiones basada en lo que dicen los datos.

Vídeo

Echa un vistazo al caso real explicado por David Martín, CEO en Damavis, en nuestro canal de YouTube:

David Martín
David Martín
Artículos: 16