Dinsdag 3 november 2015

Big Data in vogelvlucht

Elke dag worden 2,5 triljoen bytes aan data verzameld over de gehele wereld. De toename in de hoeveelheid data is zelfs zo groot dat 90% van onze huidige data zijn ontstaan in de laatste twee jaar.((https://www-01.ibm.com/software/data/bigdata/what-is-big-data.html.)) Data ontstaan overal, denk aan het plaatsen van berichten op Facebook, het ontvangen van GPS-signalen op je smartphone en het inchecken met je OV-chipkaart. Het verzamelen en analyseren van deze data wordt ook wel Big Data genoemd. Maar wat houdt deze populaire term nu precies in? Wat kunnen we met al die data? Kleven er ook risico’s aan? En hoe ziet het toekomstbeeld eruit?

Wat is Big Data?

Big Data is een begrip waar geen simpele definitie voor bestaat. Letterlijk betekent het een grote hoeveelheid data. Deze term is niet allesomvattend aangezien het ook gaat om de snelle beschikbaarheid van data, de verschillende bronnen die data vergaren en de verscheidene soorten van data. Gartner, een groot onderzoeksbedrijf in de Verenigde Staten, heeft Big Data proberen te definiëren. Deze definitie wordt over het algemeen geaccepteerd in de wereld van de informatietechnologie.

Big Data valt volgens de definitie van Gartner uiteen in drie V’s; de hoeveelheid data (volume), de snelheid (velocity) waarmee de data binnen stromen en de diversiteit van data (variety).((http://www.datashaka.com/blog/big-data-in-2014-a-necessary-update.)) Verscheidene Big Data experts spreken soms van nog meer V’s. Validatie is hier een voorbeeld van. Hierbij zullen ondernemingen niet alleen data moeten analyseren maar ook reflecteren wanneer wetten, richtlijnen of contracten van toepassing zijn op deze data-analyse. Het kan immers voorkomen dat er in strijd met een wet, richtlijn of contract wordt gehandeld.((James R. Kalyvas e.a., ‘Big Data: a business and a legal guide’, 2015 p. 2))

Big Data verschilt van de reguliere manier om data te analyseren, te gebruiken en op te slaan. Informatie blijft namelijk niet op één plek maar beweegt zich vrij voort. Zo kan er flexibel data worden toegevoegd en verwijderd. Juist deze dynamische wijze van informatie vergaren is nieuw. Het opslaan van informatie in boeken is bijvoorbeeld een statische manier van opslaan waarbij informatie op één plek blijft.((S. Klous en N. Wielaard, ‘Wij zijn Big Data’, 2014 p. 9 tm 13.)) Data-analyse speelt een grote rol bij Big Data. Door middel van deze analyse wordt er gezocht naar patronen in grote hoeveelheden data. Op deze manier worden data omgezet in waardevolle kennis.((S. Klous en N. Wielaard, ‘Wij zijn Big Data’, 2014 p. 19.)) Een tastbaar voorbeeld van de toepassing van Big Data is het zogenoemde ‘Google Flu’, een online tool waarmee wordt gemeten hoe vaak er op Google naar het woord griep gezocht wordt. Deze data worden vervolgens geanalyseerd en zo wordt er gemeten wanneer er sprake is van een griepepidemie in Nederland.((S. Klous en N. Wielaard, ‘Wij zijn Big Data’, 2014 p. 13.)) Doordat de hoeveelheid data elke dag groeit, is het belangrijk dat er constant wordt gezocht naar betere data-analyse tools.

Daarnaast groeit ook het aantal apparaten die data genereren en analyseren zonder menselijke interactie. Zulke apparaten communiceren door middel van het internet met andere aangesloten apparaten zonder menselijke tussenkomst. Dit noemen we ook wel ‘the internet of things’.((James R. Kalyvas e.a., ‘Big Data: a business and a legal guide’, 2015 p. 3.)) Denk bijvoorbeeld aan de ‘slimme’ thermostaat. Deze thermostaat meet en analyseert het energieverbruik. De gebruiker kan dit verbruik vervolgens online inzien en daardoor besparen op energiekosten.

Business Intelligence

De meeste data die op dit moment bestaan zijn ongestructureerde data. Denk aan berichten op social-media, klimaatinformatie, veelgebruikte zoektermen etc. Vaak worden deze waardevolle data meteen weggegooid of helemaal niet in gebruik genomen. Analytici omschrijven deze data als een ‘goudmijn’ voor ondernemingen.((http://computerworld.nl/big-data/75803-big-data-als-goudmijn-voor-marketing.)) Door de data strategisch en analytisch te observeren kunnen bedrijven verbanden leggen waarmee het gedrag van consumenten en markttrends beïnvloed kunnen worden. Dit noemen we ook wel ‘Business Intelligence’. Dit is het omzetten van data in waardevolle informatie. Denk aan het verzamelen van resultaten na een ziekenhuisbezoek. Deze belangrijke data worden vaak weggegooid, terwijl het erg nuttige informatie kan zijn voor toekomstige ziekenhuisonderzoeken en het verbeteren van de gezondheidszorg. Met de komst van online opslag van data, de zogenoemde cloud-diensten, zijn de kosten om data-analyse uit te voeren veel lager geworden. De drempel ligt dus steeds lager voor bedrijven om Big Data in gebruik te gaan nemen. Met behulp van data-analyse kan de bedrijfsstrategie geoptimaliseerd worden. Ondernemingen zijn echter vaak bang voor de risico’s, met name op het gebied van privacy. Daarnaast kunnen niet alleen bedrijven veel met Big Data, maar denk ook aan de overheid. De Belastingdienst is bijvoorbeeld een vooruitstrevende gebruiker van Big Data.((http://www.financeinnovation.nl/de-belastingdienst-en-big-data/.)) Er wordt actief gezocht naar patronen in het gedrag van belastingbetalers en fraude wordt bestreden door het online in de gaten houden van wanbetalers.((https://decorrespondent.nl/2720/Baas-Belastingdienst-over-Big-Data-Mijn-missie-is-gedragsverandering/83656320-f6e78aaf)) Big Governance Data bij de overheid en Big Medical Data in de gezondheidszorg zijn maar enkele voorbeelden van de vele kansen en voordelen die Big Data opleveren.

Elk voordeel heeft zijn nadeel

Big Data brengt vele voordelen en mogelijkheden voor innovatie met zich mee. Er bestaan echter ook grote risico’s. Denk aan het foutief analyseren van data waardoor verkeerde informatie wordt afgeleid. Een tweede risico is het benaderen van de verkeerde consumenten, dit kan zorgen voor forse verliezen. Ook kan het zich voordoen dat data beschadigd raken of verloren gaan die toebehoren aan cliënten.((James R. Kalyvas e.a., ‘Big Data: a business and a legal guide’, 2015 p. 138.)) Dit brengt de kans op een rechtszaak met zich mee. Een ander belangrijk risico ligt besloten in het privacy vraagstuk. Een groot deel van de data die geanalyseerd worden bestaat uit persoonsgegevens. De vraag is wat ondernemingen met al deze gegevens doen. Dit is niet altijd even duidelijk en het is belangrijk dat ondernemingen de Wet bescherming persoonsgegevens naleven met betrekking tot privacy. Niet alleen privacy van individuen moet beschermd worden, maar bijvoorbeeld ook financiële gegevens van ondernemingen. Een andere mogelijke nadelige ontwikkeling doet zich voor op de arbeidsmarkt. Met de komst van Big Data kunnen namelijk een hoop banen verdwijnen, met name in de dienstensector.((http://www.nu.nl/opinie/3837228/big-data-bedreigt-nederland-dienstenland.html.)) Big Data tools kunnen de werkzaamheden van accountants, consultants en juristen sneller en efficiënter uitvoeren. Het opleiden van mensen in gebruik van Big Data zou een oplossing kunnen zijn.

Wat brengt de toekomst?

De trend op het gebied van Big Data is voorbij. Het is een ingeburgerd begrip in de wereld van de informatietechnologie en het bedrijfsleven. Gartner komt elk jaar met een zogenoemde ‘Hype Curve’, waarin technologische trends beschreven worden. Big Data komt er, voor het eerst sinds de opkomst ervan, niet meer in voor dit jaar.((http://www.datanami.com/2015/08/26/why-gartner-dropped-big-data-off-the-hype-curve/.)) Big Data komt pas langzaam aan op gang in Nederland maar begint ook hier aan een opmars.((http://www.emerce.nl/research/big-data-nederland.)) Sinds kort bestaan er zelfs opleidingen in Nederland die zich specifiek richten op het bestuderen van Big Data.((http://numrush.nl/2015/09/30/brabant-komt-met-een-big-data-opleiding-waarom-eigenlijk/.)) Daarnaast werd de allereerste Big Data Expo in september gehouden waar veel bezoekers op af kwamen.((http://www.xomnia.com/success-big-data-expo/.))

Conclusie

Big Data is de nieuwe manier van analyseren en verwerken van data. De uitdaging is om ongestructureerde data te veranderen in relevante kennis, ook wel ‘Business Intelligence’ genoemd. Door middel van data-analyse worden data omgezet in waardevolle informatie. Niet alleen ondernemingen kunnen groot voordeel ondervinden van deze informatie maar ook overheden en de gezondheidszorg ontwikkelen zich mede door het gebruik van Big Medical Data en Big Governance Data. Ondanks de vele voordelen en kansen bestaan er ook risico’s bij het gebruik van Big Data. Het analyseren en verwerken van persoonsgegevens kan een inbreuk op privacy opleveren. Ondernemingen zijn daarom voorzichtig met het gebruik van Big Data. In Nederland komt het gebruik van Big Data langzaam op gang maar we zijn aan een opmars bezig. De trend mag dan inmiddels voorbij zijn, de ontwikkeling staat nog lang niet stil.