Crédito:CC0 Public Domain
Los lagos de datos permiten agregar información a un sistema sin preprocesamiento o modelado. Compare esto con una base de datos convencional donde los datos deben entregarse de una manera mucho más refinada y formal. Por tanto, un lago de datos ofrece una velocidad de entrada mucho más rápida. Sin embargo, como muestra una investigación de Brasil, aunque un lago de datos conserva el nivel de granularidad más alto de los datos, esa flexibilidad útil también puede ser problemática. "Si no se gestiona, es fácil perder el control del repositorio debido al volumen que contiene y su crecimiento, "explica el equipo.
Los investigadores explican además que los lagos de datos no tienen la semántica de una base de datos convencional, pero si bien esto puede ser ventajoso para evitar ciertos tipos de sesgos al volver a extraer y analizar los días, significa que comprender el contenido del lago de datos puede convertirse en una tarea bastante engorrosa. Esta, el equipo sugiere, tal vez ha socavado la adopción y el uso generalizados de lagos de datos en el entorno corporativo y ha obstaculizado la aceptación de esta útil herramienta debido a ciertos conceptos erróneos sobre cómo podrían usarse en los esfuerzos de ciencia de datos.
El equipo ahora ha recurrido a modelos de gestión del conocimiento para ayudarlos a abordar los problemas asociados con el uso del lago de datos y enriquecer los datos que flotan dentro para mejorar la usabilidad de la información. También agregan que a través del uso de una plataforma de portal de datos y metadatos asociados, razonan que su enfoque proporcionaría un fácil acceso al lago de datos manteniendo y aumentando su utilidad y evitando su denigración en un llamado pantano de datos.