Datawarehousing
Versie door Jeroen Strompf (overleg | bijdragen) op 6 jul 2016 om 16:17
Een datawarehouse is een gegevensverzameling voor het beantwoorden van terugkerende en ad-hoc vragen op het gebied van business intelligence; rapportages en data-analyse:
- Een datawarehous bevat geen originele data: Alle data komt van elders
- Deze data van elders wordt meestal automatisch geïmporteerd en opgeschoond
- Gebruikers voegen geen gegevens toe aan een datawarehouse, en wijzigen ook geen gegevens
ETL
ETL staat voor Extraction, Transformation & Loading: Het proces waarbij originele data wordt ontsloten voor het datawarehouse.
Data Extraction
Data extraction is het proces waarbij gestructureerde data wordt gewonnen uit ongestructureerde of slecht-gestructureerde data.