De betekenis van Big Data voor organisaties in de financiële sector

Interview met dr. Roel Bakker over de betekenis van Big Data voor organisaties in de financiële sector.

“Ik weet niet of in de dealing rooms van onze grote banken metingen van sentiment mbv Twitter of Google Trends al worden gebruikt, maar het ontwikkelen van modellen en algoritmes op dit gebied lijkt veelbelovend…”

In maart 2014 kondigde ING aan een proef te gaan doen met het gebruiken van betaalgegevens van klanten om korting bij andere bedrijven te krijgen.Binnen enkele dagen werd de proef afgeblazen en bood ING excuus aan vanwege de onrust die hierdoor was ontstaan. Dit incident illustreert hoe gevoelig het gebruik van betaalgegevens ligt in Nederland.Ik denk dat de opwinding die ontstaan is grotendeels onterecht is. Klanten accepteren collectieve energie-inkoop via de vereniging Eigen Huis of gaslicht.com.Het idee van ING is op zich goed, maar het is blijkbaar nodig om dit nog voorzichtiger en zorgvuldiger te communiceren. Banken hebben geen goede reputatie: de combinatie van staatssteun en bonussen of extra’s voor leden van de raad van bestuur maakt het publiek argwanend. Reputatie is verschrikkelijk belangrijk en een bank zal allereerst duidelijk moeten maken dat de analyse van grote hoeveelheden individuele betaalgegevens in de eerste plaats in het belang van de klant is

Verzekeringsmaatschappijen hebben wellicht een nog iets moeilijker positie: woekerpolissen hebben het publiek (terecht) argwanend gemaakt. Big Data, in dit geval gegevens over individueel risicogedrag, biedt natuurlijk een mogelijkheid om de verzekeringspremie te differentiëren naar risicogedrag.Tot op zekere hoogte gebeurt dit al: jonge automobilisten betalen meer verzekeringspremie, er is no-claim korting, en er zijn verzekeraars die niet-rokers korting bieden voor een overlijdensrisicoverzekering.Net als banken zullen verzekeringsmaatschappijen zeer voorzichtig moeten zijn bij dit soort kortingen, en in de eerste plaats 100% transparant moeten zijn en duidelijk moeten maken dat het belang van de klant voorop staat.Uiteindelijk willen klanten niet betalen voor roekeloos rijgedrag van anderen, of zelfs voor ongezond gedrag in het geval van ziektekostenverzekeringen.Het is m.i. rechtvaardig dat de verzekeringspremie in zekere mate afhankelijk is van risicogedrag. Het zal echter nog lang duren voordat data-analyse op grote schaal geaccepteerd zal worden om risicogedrag te meten.

Een andere toepassing van Big Data is het meten van sentiment om handel op de beurs te voorspellen, zie de publicatieQuantifying Trading Behavior in Financial Markets UsingGoogle Trendsvan Preis et al. in Nature (http://dx.doi.org/10.1038/srep01684). Ik weet niet of in de dealing rooms van onze grote banken metingen van sentiment mbv Twitter of Google Trends al worden gebruikt, maar het ontwikkelen van modellen en algoritmes op dit gebied lijkt veelbelovend…

2. Kunnen organisaties ook iets met Small Data?

Small Data is ofwel Big Data die zodanig is geaggregeerd dat het voor mensen inzichtelijk is, of een beperkte hoeveelheid data die verzameld is voor een specifiek doel. Voor zowel Big Data als Small Data geldt dat de waarde afhankelijk is van de vraagstelling, de kwaliteit van de data, en de analysetechnieken.

3. Wat zijn uw 3 Big Data tips?

a. Formuleer eerst een vraagstelling

b. Houd rekening met ‘bias’ – is de data echt afkomstig van de doelgroep?

c. Gebruik statistische analyse, Bayesiaanse statistiek en wiskundige modellen.

4. Welke data is wel en niet bruikbaar, en waarom?

Dat is moeilijk in het algemeen te zeggen. Data is wel of niet bruikbaarvoor een bepaald doel.
Uiteraard moet altijd rekening gehouden met de privacy, en de WBP (wet bescherming persoonsgegevens)

5. Betrouwbaarheid en Big Data, wat zijn belangrijke factoren om rekening mee te houden?

In de eerste plaats moeten we altijd rekening houden met systematische fouten, bijvoorbeeld met het feit dat de data niet altijd afkomstig is van de doelgroep.
Bij AH worden klantenkaarten wel eens uitgeleend, bij analyse van Twitter / Facebook data moet rekening gehouden worden met het feit dat niet iedereen een Twitter en/of Facebook account heeft. Verder is – zeker bij gebruik van social media data – niet alle data echt en dus betrouwbaar.

6. Als we u op 1 maart 2020 weer tegenkomen, wat is er dan veranderd op het gebied van Big Data?

Het Internet of Things zal in 2020 een veel grotere bijdrage leveren aan Big Data dan in 2015. Slimme apparaten (denk aan de Nest thermostaat) zullen een grotere rol spelen, en auto’s zullen veiliger, zuiniger en betrouwbaar zijn door het meten en analyseren van grote hoeveelheden data. Files zullen afnemen door beter advies aan automobilisten over route en vertrektijd.

Een spectaculaire ontwikkeling verwacht ik op het gebied van informatie over erfelijke aanleg voor bepaalde ziektes. Bij 23andme.com kan nu al voor minder dan E 200 een DNA analyse worden gedaan van 500.000 SNPs (single nucleotide polymorphisms) die o.a. informatie geven over de aanleg voor bepaalde erfelijke ziektes. Deze informatie is van groot belang voor medisch onderzoek maar is tegelijkertijd een voorbeeld van informatie die niet door een verzekeringsmaatschappij mag worden misbruikt.


Roel Bakker is docent voor de opleiding Big Data in de financiële sector.

Over martijn

Bekijk ook

Big data-analyse en de rol van AI

Auteur: Tony De Jonker Met een razend tempo krijgen we te maken met de komst …

Geef een reactie

Je e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *