Een data lake betreft een vorm van dataopslag waarbij data afkomstig van meerdere bronnen initieel in ruwe vorm wordt opgeslagen. Op grond van deze ruwe data kan bijvoorbeeld data verrijkt worden, kunnen gecombineerde analyses worden uitgevoerd, of processen worden aangesloten die gebruik maken van de gecombineerde data.
Data lakes worden veelal genoemd als versneller op gebieden zoals data science en machine learning. Ondanks de aantrekkelijke gedachte van alle data centraal op één plaats, is de afgelopen jaren duidelijk geworden dat data lakes geen magische oplossingen zijn. Organisaties zoals Gartner en Forrester bevestigen al een aantal jaren dat een opvallend aantal implementaties geheel of gedeeltelijk mislukt zijn door verkeerde verwachtingen en/of foutieve keuzes.
Reageer op dit bericht