Je kan er niet omheen, tenzij je een tijdje weg was naar Mars. Iedereen in het bedrijfsleven heeft het erover in de één of andere strategische meeting. Elke marketing-guru praat erover. In alle IT-hokken gonst het er van. BIG DATA, BIG DATA. Je moét er wel mee bezig zijn of je wordt aangekeken als een sukkeltje.
Allemaal goed en wel, en waarschijnlijk zal het wel erg belangrijk zijn, maar wat is dat nu precies ? Waarom is het zo belangrijk en hoe pak ik die BIG DATA dan aan ? Ook in de eventwereld veel gehoorde vragen, bij kleine én grote bedrijven.
Eerste vraag is echter, waarom heeft iedereen het erover ? Wel, omdat het écht wel actueel is. De digitalisering van de wereld, het feit dat die digitalisering z’n weg heeft gevonden naar je broekzak (dank je wel Apple en Android) en het drastisch toegenomen gebruiksgemak van de tools die toegang geven tot het digitale, maken dat er vandaag tonnen data en informatie beschikbaar zijn over elk individu. Bovendien heeft die digitalisering ervoor gezorgd dat het aantal individuen dat je als bedrijf tot je doelgroep mag of kan rekenen, exponentieel gestegen is. Digitale business assets worden namelijk niet of veel minder beperkt door een geografisch gebied.
Moet je dáárom met BIG DATA bezig zijn ? Neen, niet noodzakelijk. Maar tegelijkertijd heeft ieder individu door de informatie-overstroom – terecht – steeds strengere eisen gesteld aan de relevantie van informatie, alvorens er de nodige aandacht aan te besteden, laat staan de gewenste en bedoelde actie aan te koppelen. Zeker wanneer hij/zij de informatie niet zelf zoekt maar aangereikt krijgt.
Dáárom moet je er mee bezig zijn. De drempel om de aandacht, die je zoekt, te krijgen is namelijk fors verhoogd. Je klant écht goed kennen en z’n interesse weten te behouden door relevante inhoud aan te bieden, op allerlei manieren, daar draait het in de toekomst om. En hoewel de veeleisende en sterk – maar daarom niet geheel correct – geïnformeerde klant van vandaag meer zelf bepaalt dan vroeger, blijf ik ervan overtuigd dat je als bedrijf nieuwe behoeftes en oplossingen succesvol kan creëren. Kijk maar naar Apple’s iPod en iTunes revolutie. Maar dat je daartoe alles moet weten over je klant en z’n behoeftes of frustraties, staat als een paal boven water.
Wat onderscheid nu BIG DATA van de dataverzameling die we nu al hebben ? De algemeen aanvaarde definitie heeft het over de 4 V’s (in het Engels) : Volume, Velocity, Variety, Veracity.
Vertaald naar het Nederlands wordt dat zoiets als :
- Volume : de hoeveelheid data
- Snelheid : de datastroom en de snelheid waarmee de data wordt geanalyseerd en doelgericht gebruikt
- Variëteit : de verscheidenheid van de informatie en hoe ze beschikbaar is
- Juistheid : de betrouwbaarheid van je data
Even inzoomen op die 4 principes.
1. Volume
We spreken echt over enorme hoeveelheden, niet enkel in totaal maar ook in volume data per unieke entiteit in je totale database. De hoeveelheid informatie over een bedrijf, een persoon, een product, de interacties met de klant, …
Het gemiddelde Belgisch bedrijf heeft vandaag ongeveer 60 Terabytes aan data opgeslagen. Dat zal tegen 2020 doorgroeien naar 6000 Terabytes of 5,8 Petabytes of nog 6.2 miljard Megabytes.
2. Snelheid
Net de snelheid waarmee al die data geanalyseerd en behandeld moet worden om er nuttige acties mee te ondernemen, onderscheid een grote hoeveelheid data van échte BIG DATA. Met name de exponentiële groei van netwerkgeconnecteerde toestellen in gebouwen en in de wagen en accurate “location based information” maken dat informatie just-in-time aangereikt wordt en de juiste actie ondernomen wordt. Een toestel zoals een internet geconnecteerde thermostaat, moet rekening houden met de weervoorspelling à la minute om echt doeltreffend het binnenklimaat optimaal te regelen. Maar moet ook weten of en hoeveel mensen zich in de ruimte bevinden.
3. Variëteit
De grote hoeveelheid data die dagelijks geproduceerd wordt, is zeer divers van oorsprong en aard. Het gaat om tekst, afbeeldingen, video, audio, cijfers,…
Niet al die informatie is gestructureerd beschikbaar, wat een zeer groot verschil is met de traditionele database-tools, die wel steeds om duidelijk gestructureerde data vragen.
Bovendien is het bij vele soorten data zoals afbeeldingen, video en audio moeilijk om ze automatisch te kwalificeren op inhoudelijke kernbegrippen. En dus is het lastiger om ze logisch met elkaar te verbinden.
4. Juistheid
Door de hoeveelheid data, de snelheid waarmee je ze verwerkt en de grote variëteit, is het lastig maar des te belangrijk om te kunnen rekenen op de juistheid van je gegevens. In sommige studies antwoorden tot bijna 30% van de respondenten geen vertrouwen te hebben in de data waarover ze beschikken om bedrijfsgebonden beslissingen te nemen. Wanneer de volumes zo groot worden dat je bepaalde processen gaat automatiseren op basis van de verzamelde en opgeslagen data, wordt het zeker cruciaal om over betrouwbare data te beschikken.
Zoals je merkt is BIG DATA een complexe materie die veel voorbereiding en strategische keuzes vraagt waar je niet licht mee mag omgaan.
Hoe je best met BIG DATA omgaat, hou ik voor de volgende post.