Gegevens analyse
Onlangs bereikte het huidige kabinet een akkoord met D66, ChristenUnie en de SGP. Dat het akkoord er lag was één ding. Het moest nog wel even worden doorgerekend door het Centraal Planbureau. Is dat laatste nodig, vroeg ik me af. Want de laatste tijd krijg ik steeds meer het idee dat het een ouderwets en achterhaald instituut is. Ze maken berekeningen waarvan de uitkomst, in ieder geval in deze crisistijd, vaak niet blijkt te kloppen en moet worden bijgesteld.
Het lijkt er op dat ze nog steeds werken met oude methoden en gegevens. Dat ze modellen hanteren die voorheen wellicht de enige mogelijkheid boden de werkelijkheid te duiden. Maar tegenwoordig zijn er veel betere methoden. Alleen zijn die in handen van andere partijen.
Google gegevens analyse
Kort voor de uitbraak in 2009 van H1N1, een griepvirus waarvan deskundigen waarschuwden dat het epidemisch kon worden, verscheen in het wetenschappelijke tijdschrift Nuture een artikel over Google. Het kwam er op neer dat Google, aan de hand van zoektermen, analyses kan maken over wat mensen bezig houdt. Ze kan dat zelfs regionaal bekijken.
In het voorbeeld in Nature (pdf 200 kb) hadden ze gekeken naar griep. In bepaalde regio’s was het aantal griepgerelateerde zoekvragen beduidend toegenomen. Dat was een aanwijzing dat mensen symptomen hadden waarover ze informatie wilde, waaruit dat weer geconcludeerd mocht worden dat daar griephaarden waren.
Het Centraal Planbureau
Natuurlijk kan het CPB gegevens doorrekenen. Bijvoorbeeld aan de hand van feiten en gegevens van bijvoorbeeld het Centraal Bureau Statistiek, de belastingdienst en dergelijke. Als je weet hoeveel mensen een bepaalde inkomen hebben, kun je berekenen wat voor gevolgen een bepaalde maatregel in de sfeer van inkomstenbelasting heeft. Wanneer 1 miljoen mensen twee euro meer moeten betalen, dan levert dat 2 miljoen euro op.
Het is een eenvoudig voorbeeld, in de praktijk zullen ze rekening houden met meer parameters. En bijvoorbeeld weten dat als 1 miljoen mensen twee euro meer moeten betalen, er 10.000 uit die inkomensgroep vallen.
Ik vraag me echter af of ze, omdat ze er zo vaak naast zitten, ook gebruik maken van een wijze van gegevens analyse zoals geschetst in het voorbeeld van Google.
Intermezzo
Twaalf jaar geleden spraak ik op een verjaardag een marketingman van Ahold. Hij vertelde dat ze al jaren allerlei gegevens verzamelen en daardoor steeds beter koopgedrag kunnen voorspellen, weten waar ze bepaalde producten neer moeten zetten en dergelijke. Maar ook, zo vertelde hij, kennen we onze klanten. Als iemand drie keer bij ons heeft gekocht en contant heeft afgerekend dan kennen we zijn of haar profiel. Wanneer hij daarna een keer pint hebben we zijn gegevens en kunnen deze koppelen aan de eerdere aankopen. Het leek mij twaalf jaar geleden, terwijl ik toen toch al het een en ander op het gebied van gegevens analyse had meegemaakt, een sterk verhaal.
Gegevens analyse
De geschetste mogelijkheden van die marketingman zijn ongetwijfeld dichterbij gekomen. Maar of ze na het bekend worden van iemands gegevens, eerdere anonieme aankopen aan die persoon kunnen koppelen lijkt me nog steeds sterk.
Wel kunnen ze, evenals bij Google, grote lijnen herkennen en gevolgtrekkingen maken die verder gaan dan hun eigen behoefte. Stel dat bijvoorbeeld Youp van het Hek weer eens over Buckler begint en dat overal de verkoop van dat bier stopt behalve in een bepaalde wijk. Dan mag je veronderstellen dat mensen in die wijk de conference niet hebben gezien. Voor Ahold wellicht geen interessant gegeven. Maar voor andere partijen wel. Samenwerking, en uitwisseling van gegevens, kan daarom interessant zijn.
De Googles en Aholds beschikken over een enorme hoeveelheid gegevens die verder gaat dat de statische gegevens waarmee het CPB lijkt te werken. De gegevens analyse van dit soort bedrijven geeft een veel correcter beeld van de werkelijkheid en ze kunnen na verloop van een periode gegevens verzamelen en analyseren, veel sneller conclusies trekken. Conclusies die in deze emotionele crisistijd de gevolgen, ook van een politieke beslissing, veel beter voorspellen.
Meer informatie:
- De Google zoekwoorden planner, daarmee kun je zelf gebruikte zoekwoorden analyseren (Gmail account noodzakelijk)
- Uitleg over het gebruik van de Google zoekwoorden planner
- Het boek ‘De Big-Data revolutie‘ geeft een mooi inzicht in de mogelijkheden van gegevens analyse

Een willekeurig bericht
Ik schrijf op deze site over allerlei onderwerpen. Soms is het heel persoonlijk, soms vooral informatief of beschouwend. Hieronder een willekeurig bericht uit ruim 2000 berichten.