Opinie - Verschillen Data Warehouse Architecturen

Een datawarehouse is een database waarin data uit verscheidene systemen wordt ingeladen om analyses uit te voeren en rapportages te maken die uit de aparte gegevensbronnen niet mogelijk zijn. Er zijn echter verschillende smaken..

De definitie van een data warehouse afkomstig van Bill Inmon, één van de grondleggers van datawarehousing, luidt als volgt:
A (data) warehouse is a subject-oriented, integrated, time-variant and non-volatile collection of data in support of management's decision making process."

De kenmerken van een datawarehouse zijn volgens de officiële definitie:
subject-oriented Een datawarehouse is subject-oriented. Dit wil zeggen dat data gegroepeerd is per onderwerp en niet per activiteit, zoals dit bij operationele systemen het geval is.
Integrated Data in de verschillende bronsystemen, wijkt vaak af voor wat betreft gebruikte coderingen, dataformaten en data types. Voordat deze data in het datawarehouse geladen wordt, moet ze eerst op elkaar worden afgestemd.
time-variant Een datawarehouse bevat historische data. Dit betekent dat alle data gelinkt moet zijn aan een bepaalde periode in de tijd. Bovendien moet deze data precies de situatie weergeven zoals deze was op dat moment. In operationele systemen vindt men vaak alleen de situatie van het moment terug, omdat in het geval van wijzigingen bestaande data wordt overschreven.
non-volatile Data in een datawarehouse is statisch. Men gaat er vanuit dat data, nadat deze in het datawarehouse geladen is, niet meer veranderd.

De twee meest toegepaste architecturen op dit moment in het land van datawarehousing zijn de 'Hub & Spoke architectuur' van Bill Inmon en de 'Bus architectuur' met conforming dimensions van Ralph Kimball. De 'Hub & Spoke architectuur' of ' Corporate Information Factory (CIF)' maakt gebruik van een centraal datawarehouse, gemodelleerd in de derde-normaalvorm. De 'Bus architectuur' maakt gebruik van geschakelde datamarts en zijn dimensioneel gemodelleerd.

Negatieve effecten
Het probleem van deze twee modelleringsprincipes is dat ze oorspronkelijk niet zijn ontwikkeld voor respectievelijk het modelleren van data in het centraal datawarehouse en de geschakelde datamarts. De derde-normaalvorm is namelijk ontworpen voor transactieverwerkende systemen en het dimensioneel model is oorspronkelijk ontworpen voor interactieve OLAP-analyses op enkelvoudige datamarts. Met andere woorden: de derde-normaalvorm en het dimensioneel model zijn aangepast om gebruikt te kunnen worden voor modellering van enterprise datawarehouses. Deze aanpassing kent verschillende negatieve effecten: Enterprise datawarehouses die ontworpen worden met dimensionele modellen (ster schema's) zijn bijvoorbeeld niet geschikt voor geavanceerde analysetechnieken zoals data mining en real-time analyse-vraagstukken

Data Vault : Flexibele datamodellering voor BI
Data Vault is een hybride aanpak waarin het beste van genormaliseerd data modelleren en dimensioneel modelleren wordt gecombineerd. Het is een datamodel dat specifiek is ontworpen om aan de eisen van een enterprise datawarehouse te voldoen.

Datawarehousing is dan ook een continu dynamisch proces binnen de organisatie. Het stopt niet zodra het eerste project is opgeleverd. Inzichten van een organisatie zijn continu aan verandering onderhevig. Het is dan ook nagenoeg onmogelijk om vooraf de hele definitie van de inhoud van het volledige datawarehouse helder te hebben. Het idee om kleine, incrementele stappen te nemen bij het maken van een datawarehouse en het daarna steeds uit te breiden is in dit soort projecten de beste aanpak.

Wat kan Control Freaks voor u betekenen?
• Onderzoek naar de mogelijkheden van datawarehouses.
• Opstellen van business case, eisen en wensen.
• Begeleiding bij het selecteren van systemen en software
• Ontwerpen van het datawarehouse.
• Implementatie van BI tools

ikwilmeerweten@control-freaks.nl

Nieuwe reactie inzenden

De inhoud van dit veld is privé en zal niet openbaar worden gemaakt.
  • Adressen van webpagina's en e-mailadressen worden automatisch naar links omgezet.
  • Toegelaten HTML-tags: <a> <p> <span> <div> <h1> <h2> <h3> <h4> <h5> <h6> <img> <img /> <map> <area> <hr> <br> <br /> <ul> <ol> <li> <dl> <dt> <dd> <table> <tr> <td> <em> <b> <u> <i> <strong> <font> <del> <ins> <sub> <sup> <quote> <blockquote> <pre> <address> <code> <cite> <embed> <object> <strike> <caption> <swf> <swf />
  • Regels en paragrafen worden automatisch gesplitst.
  • You may use <swf file="song.mp3"> to display Flash files inline

Meer informatie over formaatmogelijkheden

CAPTCHA
Deze vraag wordt gebruikt om te testen indien u een menselijke bezoeker bent teneinde spam-inzendingen te vermijden.
Beeld-CAPTCHA
Enter the characters shown in the image.

Navigatie

Bel me terug

 Ring ring... Control Freaks bel mij even terug bitte!

Stem

Stem - Control is dodelijk voor Ondernemerschap!: