Brontabellen (dwh): verschil tussen versies

Uit De Vliegende Brigade
Naar navigatie springen Naar zoeken springen
k (Jeroen Strompf heeft pagina Veldnamen bij import hernoemd naar Brontabellen (dwh))
 
(7 tussenliggende versies door dezelfde gebruiker niet weergegeven)
Regel 1: Regel 1:
Waarschijnlijk handig om 'intern', dus in het DWH, altijd dezelfde veldnamen te hanteren. Een paar ideeën:
+
Zie [[Single Source of Truth (SSoT, DWH)]] voor achtergrondinformatie
  
* Dezelfde veldnamen gebruiken als de oorspronkelijke bron: Dit wordt toch geabstraheerd verderop in het DWH. Geen hoofdletters of lästige tékens gebruiken. <code>Qualität</code> wordt dus <code>qualitat</code>, ook al dreigt er verwarring omdat het Duitse ''Qualität'' hier hoeveelheid betreft, en ''Quality'' uiteraard ''kwaliteit'' beteketn
+
* Naamgeving: <code>timestamp_description_imp</code>. Bv. <code>20181203_lampion_imp</code>
* Als veldnamen gereserveerde keywords zijn: Underscore toevoegen. Bv. <code>status_</code> en <code>item_</code.
+
* Description: Enkelvoud
 +
* Dezelfde veldnamen gebruiken als de oorspronkelijke bron. Geen hoofdletters, gewone streepjes of lästige tékens gebruiken. <code>Qualität</code> wordt dus <code>qualitat</code>, ook al dreigt er verwarring omdat het Duitse ''Qualität'' hier hoeveelheid betreft, en ''Quality'' uiteraard ''kwaliteit'' beteketn
 +
* Als veldnamen gereserveerde keywords zijn: Underscore toevoegen. Bv. <code>status_</code> en <code>item_</code>.
 +
 
 +
== Helemaal geen bewerkingen? ==
 +
 
 +
Waarschijnlijk is het te extreem om nooit bewerkingen op brondata te verrichten. Concrete lijst:
 +
 
 +
=== Program today for today and tomorrow for tomorrow ===
 +
 
 +
Geen velden aanpassen als je die toch niet gaat gebruiken.
 +
 
 +
=== Komma's & punten in getallen ===
 +
 
 +
Prijzen die geïmporteerd zijn als tekstvelden met komma's als decimaalscheidingsteken → Komma's vervangen door punten
 +
 
 +
=== Getallen converteren naar decimaalveld? ===
 +
 
 +
Een lastiger geval: Nadat komma's in punten zijn veranderd: Velden omfietsen naar iets decimaals? Prima te doen, maar zorg ervoor dat er geen signiciante cijfers verloren gaan: Vaak zijn bv. prijzen op vreemde manieren opgeslagen qua significante cijfers.
 +
 
 +
== Zie ook ==
 +
 
 +
* [[Single Source of Truth (SSoT, DWH)]]

Huidige versie van 3 dec 2018 om 14:34

Zie Single Source of Truth (SSoT, DWH) voor achtergrondinformatie

  • Naamgeving: timestamp_description_imp. Bv. 20181203_lampion_imp
  • Description: Enkelvoud
  • Dezelfde veldnamen gebruiken als de oorspronkelijke bron. Geen hoofdletters, gewone streepjes of lästige tékens gebruiken. Qualität wordt dus qualitat, ook al dreigt er verwarring omdat het Duitse Qualität hier hoeveelheid betreft, en Quality uiteraard kwaliteit beteketn
  • Als veldnamen gereserveerde keywords zijn: Underscore toevoegen. Bv. status_ en item_.

Helemaal geen bewerkingen?

Waarschijnlijk is het te extreem om nooit bewerkingen op brondata te verrichten. Concrete lijst:

Program today for today and tomorrow for tomorrow

Geen velden aanpassen als je die toch niet gaat gebruiken.

Komma's & punten in getallen

Prijzen die geïmporteerd zijn als tekstvelden met komma's als decimaalscheidingsteken → Komma's vervangen door punten

Getallen converteren naar decimaalveld?

Een lastiger geval: Nadat komma's in punten zijn veranderd: Velden omfietsen naar iets decimaals? Prima te doen, maar zorg ervoor dat er geen signiciante cijfers verloren gaan: Vaak zijn bv. prijzen op vreemde manieren opgeslagen qua significante cijfers.

Zie ook