Durante el 2020, en el contexto de la maestría que estoy realizando, publicamos en el Journal of Data and Information Quality de la ACM, un paper sobre Data Profiling en bases de datos de grafos.
El proceso de redacción y corrección del paper nos llevó un año y medio aproximadamente, donde recibimos varias sugerencias de cambios por parte de los revisores que ayudaron a mejorar significativamente el trabajo.
El objetivo del artículo es revisar y organizar diferentes técnicas y métodos que pueden ser aplicados en un Data Profiling sobre una base de datos de grafos.
Es el primer paper que publico, por lo que fue un lindo hito durante un año tan particular.
Les dejo el abstract por más detalles:
Property Graph databases are being increasingly used within the industry as a powerful and flexible way to model real-world scenarios. With this flexibility, a great challenge appears regarding profiling tasks due to the need of adapting them to these new models while taking advantage of the Property Graphs’ particularities. This article proposes a set of data profiling tasks by integrating existing methods and techniques and an taxonomy to classify them. In addition, an application pipeline is provided while a formal specification of some tasks is defined.
El link a la publicación es el siguiente: https://dl.acm.org/doi/fullHtml/10.1145/3409473
Actualmente, con el objetivo de realizar mi tesis de maestría, estoy investigando sobre alguna de las técnicas y métodos mencionados en el artículo, en particular, en el área de dependencias funcionales.
Hasta la próxima!
Excelente Sofi! Muy interesante! Felicitaciones! gracias por compartirlo :)