Statistiek & online marketing - Vuistregels: verschil tussen versies

Uit De Vliegende Brigade
Naar navigatie springen Naar zoeken springen
 
(7 tussenliggende versies door dezelfde gebruiker niet weergegeven)
Regel 19: Regel 19:
 
* 1% - Ondergrens: Als een site slechter dan dit converteert, is er een probleem.
 
* 1% - Ondergrens: Als een site slechter dan dit converteert, is er een probleem.
  
== Minimaal benodigde steekproeven ==
+
== Meetperiode ==
 +
 
 +
''' Minimum '''
 +
 
 +
Afhankelijk van je business, de benodigde hoeveelheid data of het doel van de analyse, zal er zoiets zijn als een minimale meetperiode
 +
 
 +
* Soms een week
 +
* Vaak 3 maanden
 +
* Een paar jaar, indien je statistieken wilt hebben zonder seizoensinvloeden.
 +
 
 +
''' Maximum '''
 +
 
 +
Vaak zal er een maximale meetperiode zijn om data over te verzamelen: De wereld verandert in die tussentijd namelijk dermate dat je anders met te oude data werkt. Hoe lang die maximale periode is, verschilt van business tot business
 +
 
 +
* Als je een ijscotent hebt, en je ijsjes verkoopt in alleen de zomermaanden, is een minimale meetperiode van 6 maanden waarschijnlijk niet realistisch. Vermoedelijk is 3 maanden een maximum, en vaak waarschijnlijk zelfs korter
 +
* Waspoeder is vermoedelijk een stabielere business, waarbij je gemakkelijk een veel langere meetperiode kunt hanteren.
 +
 
 +
== Minimaal benodigde steekproeven (onzin) ==
  
 
Volgens mij klopt er geen fuck van deze getallen, omdat ze zonder context zijn gegeven. Daarnaast: Als je eenmaal snapt hoe je met binomialen werkt, is het zonde om te klooien met dit soort onzin.
 
Volgens mij klopt er geen fuck van deze getallen, omdat ze zonder context zijn gegeven. Daarnaast: Als je eenmaal snapt hoe je met binomialen werkt, is het zonde om te klooien met dit soort onzin.
  
=== Het magische getal is 11 ===
+
''' Het magische getal is 11 '''
  
 
Ooit zei iemand me dat ''11'' het minimale aantal bemonsteringen was om significant te kunnen zijn. Dat past aardig in het schema hierboven. Als ik dit schema zou terugbrengen tot één regel, zou het wellicht worden:
 
Ooit zei iemand me dat ''11'' het minimale aantal bemonsteringen was om significant te kunnen zijn. Dat past aardig in het schema hierboven. Als ik dit schema zou terugbrengen tot één regel, zou het wellicht worden:
Regel 35: Regel 52:
  
 
Het is hierbij het zekerste om te kijken naar ''Conversies'', en bij afwezigheid daarvan naar ''Klikken'' en ''Impressies''.
 
Het is hierbij het zekerste om te kijken naar ''Conversies'', en bij afwezigheid daarvan naar ''Klikken'' en ''Impressies''.
 
''' Let op '''
 
  
 
Maar let op: Deze vuistregel is nogal zwak:
 
Maar let op: Deze vuistregel is nogal zwak:
Regel 44: Regel 59:
 
|}
 
|}
  
''' Conclusies '''
+
Conclusies: Het aantal van 11 steekproeven is een minimum voordat je ook maar iets kunt concluderen. Net zoiets als "1 datapunt is geen data". Vaak zal 11 beslist onvoldoende zijn voor enige conclusies.
  
Het aantal van 11 steekproeven is een minimum voordat je ook maar iets kunt concluderen. Net zoiets als "1 datapunt is geen data". Vaak zal 11 beslist onvoldoende zijn voor enige conclusies.
+
''' Het magische getal is 200 '''
 
 
=== Het magische getal is 200 ===
 
  
 
In okt. 2017 las ik ergens dat ''200'' het magische getal is qua significantie. Daar werd geen enkele context bij gegeven, dus het zegt weinig. Toch vind ik het een handig getal. Zie voorbeeld Amazon hiernaast.
 
In okt. 2017 las ik ergens dat ''200'' het magische getal is qua significantie. Daar werd geen enkele context bij gegeven, dus het zegt weinig. Toch vind ik het een handig getal. Zie voorbeeld Amazon hiernaast.
  
=== Meer magische getallen ===
+
''' Meer magische getallen '''
  
 
AdAlysis geeft [http://adalysis.com/blog/how-much-data-should-you-have-before-examining-an-ad-test-result dit staatje] van het aantal benodigde steekproeven voor statistische significantie:
 
AdAlysis geeft [http://adalysis.com/blog/how-much-data-should-you-have-before-examining-an-ad-test-result dit staatje] van het aantal benodigde steekproeven voor statistische significantie:
Regel 65: Regel 78:
 
</pre>
 
</pre>
  
=== 10x-Marge ===
+
== 10x-Marge ==
  
 
De vuistregel ''10x-marge'' wil zeggen, dat je uitgaat van een bepaalde verwachtingswaarde, en die waardie 10x zo ruim neemt. Als de werkelijkheid dan nóg ongunstiger is → Stoppen.
 
De vuistregel ''10x-marge'' wil zeggen, dat je uitgaat van een bepaalde verwachtingswaarde, en die waardie 10x zo ruim neemt. Als de werkelijkheid dan nóg ongunstiger is → Stoppen.
Regel 95: Regel 108:
 
</pre>
 
</pre>
  
=== Voorbeeld ===
+
''' Voorbeeld '''
  
 
<pre>
 
<pre>
Regel 113: Regel 126:
  
 
</pre>
 
</pre>
 
== Minimale periode ==
 
 
De factor ''tijd'' doet ook mee:
 
 
* Verkeer kan op maandag heel anders zijn dan op zaterdag → Minimaal een week meten
 
* De zomer is vaak afwijkend van de rest van het jaar, en het eind van het jaar kan ook flink afwijken → Minimaal 3 maanden meten?
 
 
== Maxima ==
 
 
En nu de grote verrassing: Het is handig om ook ''maxima'' vast te stellen. Dat als die zijn bereikt, je niet langer wacht met actie.
 
 
Wat het eerste komt:
 
 
=== Maximaal drie maanden meten ===
 
 
* In drie maanden tijd verandert de wereld flink. Dus langer meten is niet interessant, omdat de data aan het begin van die periode al flink belegen is
 
* Zie het voorbeeld verderop in dit artikel over een zoekterm die na twee jaar nog niet converteerde.
 
 
=== Maximaal 10x de minimale hoeveelheid data ===
 
 
Voorbeeld:
 
 
<pre>
 
Je hebt een nieuwe AdGroup gemaakt, en wacht tot je minimaal 750 impressies, 500 kliks, en 11 conversies hebt.
 
Na twee maanden heb je deze gegevens:
 
 
* 60.000 Impressies
 
*  4.000 Klikken
 
*      0 Conversies.
 
 
Stoppen of doorgaan?
 
</pre>
 
 
→ Stoppen: Je heb qua impressies en klikken al meer dan 10x de minimale hoeveelheid data. Ook al is de campagne nog geen drie maanden actief: Het ging erom wat het eerste komt: 3 Maanden of 10x de minimaal benodigde steekproeven.
 
 
== Minimaal evenveel steekproeven als zoekopdrachten per week of maand (oh ja?) ==
 
 
''Deze vuistregel klinkt interessant, maar ik kan er nix mee (feb. 2018)''
 
 
Niet alleen moet je minimaal een week of een maand meten, maar daarnaast moet je ook minimaal het aantal steekproeven verzamelen, dat overeenkomt met het aantal keer dat de betreffende zoekterm in een week of maand gebruikt wordt:
 
 
<pre>
 
If you have a brand term that is searched 1 million times a week, you should be using at least a million impressions
 
as your minimum.
 
 
For many brands, they aren’t searched 1 million times in a year, and should be happy with 10,000 –
 
100,000 impressions before they examine their confidence levels.
 
</pre>
 
 
Practischer: Als ik drie maanden test, wil ik in ieder geval het aantal impressies hebben dat er gezocht wordt voor die zoekterm per maand (een maand lijkt me in deze context een aardige periode).
 
  
 
== Parameter sensitivity ==
 
== Parameter sensitivity ==

Huidige versie van 4 apr 2018 om 11:05

Vuistregels <1%, 200 steekproeven & Duidelijk verschil: Zie Casussen (statistiek) voor details
Vuistregels: 200 steekproeven, parameter sensitivity en 10x-marge: Zie Casussen (statistiek) voor details
Searchengineland zegt dat het zo'n 100 impressies vergt om een 'stabiele' QS te verkrijgen voor een zoekterm. PPC Hero houdt het op enkele duizenden impressies
Verwachte conversie is 4,4%. Met een 10x-marge is dat ca. 1 conversie op 225 klikken. We zitten op 260 klikken en 3 conversies. De 10x-marge-regel is vooral handig om te besluiten te stoppen als er geen conversies zijn. Dat punt zijn we hier gepasseerd. De 200-steekproevenregel zegt dat we nu genoeg data hebben om conclusies te trekken. Die conclusie is dan, dat de CVR 1,15% is. Maar let op: Dat is voor de campagne als geheel. het is zonde om op grond daarvan conclusies te trekken, want het betreft nogal hetereogene data. Het is veel handiger om te evalueren per AdGroup, zodat je minder appels met peren vergelijkt. Dat brengt echter een nadeel met zich mee: Er is te weinig data beschikbaar op dat niveau. Welliswaar homogener, maar ook schaarser. Voorstellen aan de klant dat ze nog 10 jaar moeten wachten? Da's ook niet handig. Dan toch conclusies trekken op een meer geaggregeerd niveau? Niet per se: Deze campagne is pas een maand oud. Misschien wachten tot drie maanden, en alles waar je toch te weinig info over hebt, afkappen.
Sitelinks in actie: Zie Casussen (statistiek) voor details

Wanneer heb je genoeg informatie om een conclusie te trekken? Bijvoorbeeld om een campagne te stoppen, of juist uit te breiden? Dit artikel behandelt een aantal vuistregels die daarmee kunnen helpen.

Verwachtingswaarde

De meeste vuistregels verder in dit artikel geloof ik steeds minder. Een vuistregel die ik daarintegen steeds meer vertrouw: Vergelijk met de verwachtingswaarde

Bij statistisch onderzoek wordt vaak uitgegaan van een nulhypothese H_0, bv. via een testcasus, om de verwachtingswaardes vast te stellen.

Bij gebruik aan specifiekere info, hanteer ik deze verwachtingswaardes tav. CVR:

  • 4% - Da's wat een redelijke webshop haalt
  • 1% - Ondergrens: Als een site slechter dan dit converteert, is er een probleem.

Meetperiode

Minimum

Afhankelijk van je business, de benodigde hoeveelheid data of het doel van de analyse, zal er zoiets zijn als een minimale meetperiode

  • Soms een week
  • Vaak 3 maanden
  • Een paar jaar, indien je statistieken wilt hebben zonder seizoensinvloeden.

Maximum

Vaak zal er een maximale meetperiode zijn om data over te verzamelen: De wereld verandert in die tussentijd namelijk dermate dat je anders met te oude data werkt. Hoe lang die maximale periode is, verschilt van business tot business

  • Als je een ijscotent hebt, en je ijsjes verkoopt in alleen de zomermaanden, is een minimale meetperiode van 6 maanden waarschijnlijk niet realistisch. Vermoedelijk is 3 maanden een maximum, en vaak waarschijnlijk zelfs korter
  • Waspoeder is vermoedelijk een stabielere business, waarbij je gemakkelijk een veel langere meetperiode kunt hanteren.

Minimaal benodigde steekproeven (onzin)

Volgens mij klopt er geen fuck van deze getallen, omdat ze zonder context zijn gegeven. Daarnaast: Als je eenmaal snapt hoe je met binomialen werkt, is het zonde om te klooien met dit soort onzin.

Het magische getal is 11

Ooit zei iemand me dat 11 het minimale aantal bemonsteringen was om significant te kunnen zijn. Dat past aardig in het schema hierboven. Als ik dit schema zou terugbrengen tot één regel, zou het wellicht worden:

Impressies   Klikken   Conversies
----------   -------   ----------
   750          500       11
   500           11       --

Het is hierbij het zekerste om te kijken naar Conversies, en bij afwezigheid daarvan naar Klikken en Impressies.

Maar let op: Deze vuistregel is nogal zwak:

De derde zoekterm: Pauzeren of niet? Er zijn al meer dan 11 klikken geweest, dus deze vuistregel suggereert dat je conclusies kunt trekken. Maar let op: Regel twee heeft slechts 1 conversie per 38 klikken! Dus na 11 klikken weet je nog niets!

Conclusies: Het aantal van 11 steekproeven is een minimum voordat je ook maar iets kunt concluderen. Net zoiets als "1 datapunt is geen data". Vaak zal 11 beslist onvoldoende zijn voor enige conclusies.

Het magische getal is 200

In okt. 2017 las ik ergens dat 200 het magische getal is qua significantie. Daar werd geen enkele context bij gegeven, dus het zegt weinig. Toch vind ik het een handig getal. Zie voorbeeld Amazon hiernaast.

Meer magische getallen

AdAlysis geeft dit staatje van het aantal benodigde steekproeven voor statistische significantie:

Verkeer               Impressies   Klikken   Conversies
-------               ----------   -------   ----------
Weinig verkeer            350         300           7
Middelmatig verkeer       750         500          13
Veel verkeer            1.000       1.000          20
Bekende merknamen     100.000      10.000    100-1000

10x-Marge

De vuistregel 10x-marge wil zeggen, dat je uitgaat van een bepaalde verwachtingswaarde, en die waardie 10x zo ruim neemt. Als de werkelijkheid dan nóg ongunstiger is → Stoppen.

Voorbeeld:

Je bent een zoekterm aan het testen: Vergelijkbare zoektermen hebben 
4% conversie, dus één conversie per 25 klikken, en 4 conversies per 
100 klikken. Dat is de verwachtingswaarde voor deze nieuwe term.

Bij 200 klikken & 0 conversies:

* Verwachtingswaarde: 8 conversies
* "10x-marge": 0,8 conversies. Afgerond: 0 conversies
* → Doorgaan

Bij 250 klikken & 0 conversies:

* Verwachtingswaarde: 10 conversies
* "10x-marge": 1 conversie
* → Stoppen. Je zit precies op het kantelpunt

Bij 500 klikken & 0 conversies:

* Verwachtingswaarde: 20 conversies
* "10x-marge": 2 conversies
* → Je had al bij 250 klikken moeten stoppen

Voorbeeld

* CPC € 1,--
* Conversie-verwachtingswaarde: 2,5% -- 1 conversie/40 klikken
* 10x-marge: 1 conversie/400 klikken

                             Impressies   Klikken   Conversies        Kosten    Opmerkingen
                             ----------   -------   ----------        -------   ------------
Hoge significantie vereist                             200            € 8.000   Beetje theoretisch?
Hoge significantie vereist                  200          ?            €   200   200 klikken & 0 of onbekend aantal conversies → welletjes

Geen hoge significantie vereist                         11            €   440
Geen hoge significantie vereist              11          ?            €    11

10x-marge                                   400          ?            €   400   400 klikken & 0 of onbekend aantal conversies → welletjes

Parameter sensitivity

Een truuk om een gevoel te krijgen of een parameter gevoelig is: Wat gebeurt er met de uitkomst als je een parameter aanpast?

±1

In dit geval: Wat gebeurt er als je een parameter met 1 verhoogt of verlaagt? Voorbeeld:

Amstelveen (€ 40/conversie) doet het veel beter dan Amsterdam (€ 227/conversie). En als ik 1 conversie optel bij Amsterdam, en er 1 aftrek bij Amstelveen, dan verandert er weinig: Amstelveen (€ 79/conversie) - Amsterdam (€ 195/conversie). Dus de parameter #conversies is beperkt gevoelig. Let op: Dit is slechts een vuistregel, en vaak een hele onzorgvuldige

10%

Vermoedelijk iets nauwkeuriger: Wat gebeurt er bij een verstoring van 10%?

In dit geval: Niet veel, want 6 conversies -/- 10% is 5,4 → 5. 2 Conversies +/+ 10% - 2,2 = 2.

Zie ook

Bronnen

Algemeen

Statistiek & AdWords