Een gemiddelde organisatie genereert ontzettend veel gegevens. Data waarvan je je misschien niet eens bewust bent. Datavisualisatie maakt die data bruikbaar en stelt ons in staat om beslissingen te nemen. In dit blog laten we je zien welke stappen er nodig zijn om data te vertalen naar een begrijpelijk beeld.
Grote hoeveelheden data zijn moeilijk te bevatten. Veel datasets bevatten enorme hoeveelheden waardevolle data. De visualisatie van data helpt beleidsmakers om beslissingen te nemen. Een helder beeld legt bijvoorbeeld verbanden bloot en maakt het makkelijker om actie te ondernemen. Maar hoe geef je je data nou op zo’n manier vorm dat de visualisatie van data helpt bij het nemen van beslissingen?
Waarom is datavisualisatie een hot topic?
Onderzoek wijst uit dat mensen ongeveer 20% van wat ze lezen kunnen onthouden. Als je diezelfde informatie omzet in beeld dan neemt de capaciteit om informatie op te slaan enorm toe, tot wel 80%. Datavisualisatie zorgt daarmee dus voor efficiëntie in de overdracht van informatie. Zeker in een situatie waarin mensen veel informatie tot zich moeten nemen, bijvoorbeeld in het politieke speelveld, landelijke zorg of de procestechniek.
Tegelijkertijd vergroot visuele communicatie het begrip, zeker wanneer data abstract is. Een beeld zegt meer dan 1000 woorden wordt wel eens gezegd. Feit is dat ons brein in staat is om in milliseconden een beeld te begrijpen. Het stelt ons in staat om verbanden te leggen, of – in geval van data design – om consequenties te doorzien en een voorspelling te doen over de toekomst.
Het besluitvormingstraject naar de visualisatie van data
Je verwacht misschien dat het traject begint bij de data en de manieren waarop je die kunt benaderen om tot de juiste vorm te komen. Maar het echte beginpunt is veel eerder: bij de besluitvorming omtrent de visualisatie van data.
Allereerst heeft elke data een bron. En uiteindelijk is iemand eigenaar van die databron. De vraag is welk belang die persoon of organisatie heeft om de data ter beschikking te stellen. Het prijsgeven van data kan een bezwaar zijn, zeker wanneer intellectueel eigendom of dataveiligheid belangrijke kwesties zijn. En wanneer de eigenaar de kwaliteit van de data niet kan garanderen dan kunnen fouten en aannames in de data tot afbreukrisico voor de eigenaar leiden. Het is goed om daarover van tevoren afspraken te maken.
Het is dus verstandig om van tevoren de kwaliteit van de data te analyseren. De kwaliteit van data heeft namelijk invloed op de manier waarop je de data presenteert. Een voorbeeld: stel je een dataset voor waarin veel onzekerheden verborgen zitten, bijvoorbeeld doordat er aannames gedaan zijn of er slechts een kleine populatie beschikbaar is. Als je die data uiteindelijk gedetailleerd en concreet visualiseert, dan ontstaat er een mismatch tussen de zekerheid die de gevisualiseerd wordt en de betrouwbaarheid van data. De kans is aanwezig dat besluiten worden genomen op basis van onnauwkeurige informatie. De kwaliteit van data is dus altijd een factor die je mee moet nemen in de besluitvorming.
Uitgangspunten voor de visualisatie van data
Er zijn honderden manieren om data in een grafiek weer te geven. Er is ook niet één methode de juiste. Als ontwerper ben je op zoek naar de manier om de gebruiker inzicht te geven. De vraag is natuurlijk: inzicht waarÃn! Om met de Amerikaanse statisticus Edward Tufte te spreken: “de lakmoesproef van design is hoe goed het ontwerp ondersteunt in het begrip van inhoud, niet hoe fraai die inhoud wordt weergegevenâ€.
De sleutel zit ‘m in het leren kennen van je doelgroep. Om een beeld te vormen van de situaties waarin de datavisualisatie een rol van betekenis speelt moet je antwoorden zien te vinden op vragen als:
- Wie gaat de datavisualisatie gebruiken?
- In welke scenario’s draagt de datavisualisatie bij tot besluitvorming?
- Welke beslissing wil ik dat mijn doelgroep kan maken?
- En in welke omstandigheden vindt die beslissing plaats? Bijvoorbeeld onder hoge druk, of in een situatie met veel belanghebbenden?
- Welke acties wil ik mogelijk maken?
Welke keuzes maak je in data design?
Met de antwoorden op deze vragen ben je beter in staat om keuzes te maken in je data design. Een keuze is bijvoorbeeld welke gegevensdichtheid je nodig hebt om de vragen van je doelgroep te beantwoorden. Hoe hoger de dichtheid, hoe gedetailleerder het inzicht, maar hoe meer moeite het ook kost om een beeld te vormen. Het streven is te allen tijde om je ontwerp helder te houden.
Een tweede keuze is het kleurgebruik: met kleur kun je de focus leggen op dat wat belangrijk is. Alarmkleuren wanneer waarden een drempel overstijgen bijvoorbeeld, of kleurgebruik om de snelheid van fluctuaties weer te geven (een veelgebruikte methode in medische datavisualisaties). Daarnaast kan kleur worden ingezet als extra dimensie in een grafiek. Zo kun je kleur in een spreidingsdiagram (scatter chart) bijvoorbeeld gebruiken om je datapunten te categoriseren.
En een laatste keuze is de interactiviteit: wil je je doelgroep in staat stellen om de visualisatie te configureren? Eén van de mogelijkheden is bijvoorbeeld om bij gesegmenteerde data de details van een bepaald segment uit te lichten. Of om de mogelijkheid te geven om in te zoomen op een bepaald moment in een tijdlijn. Ook hier zijn de scenario’s waarin de datavisualisatie gebruikt wordt leidend: de vragen zijn leidend in de keuzes voor interactiviteit.
It’s not how much information there is, but rather how effectively it is arranged.
Edward R. Tufte, emeritus hoogleraar politieke wetenschappen, statistiek en informatica aan de Yale University
De meest gebruikte visualisaties op een rij
Afhankelijk van je doel heb je de keuze uit een hele reeks basisvisualisaties. We kennen ze allemaal wel: tijdlijnen, staafdiagrammen, cirkeldiagrammen, enzovoorts. De verschillen tussen die diagrammen zijn vrij helder. Toch worden er vaak onlogische keuzes gemaakt. Er zijn verschillende strategieën om tot een heldere data design te komen en het gaat te ver om die hier te bespreken. Maar de benadering van de Amerikaanse professor Dr. Andrew Abela geeft handige aanknopingspunten om tot een duidelijke datavisualisatie te komen. In zijn model vallen de volgende vier vraagstukken te onderscheiden:

Model van Dr. Andrew Abela – Extremepresentation.com
1. Een vergelijking tussen verschillende datasets of over het verloop in de tijd
Bij dit soort vraagstukken wil je vooral de verhoudingen kunnen zien. Staafdiagrammen en liggen voor de hand omdat je daarbij in een oogopslag een vergelijking kunt maken. Speelt tijd een rol, dan is een lijndiagram vaak een betere optie omdat datapunten daarbij met elkaar verbonden zijn en de verhoudingen nog makkelijker zichtbaar worden. In financiële vraagstukken zien we daarnaast vaak het kaarsdiagram, die het koersverloop aangeeft met daarbij de uitersten op een koersdag.
2. De verdeling tussen verschillende categorieën
Gaat de vraag van je doelgroep over de verdeling van data, bijvoorbeeld over de verdeling van aantallen over het verloop van tijd? In dat geval zijn er maar enkele basisdiagrammen die uitkomst bieden. Het lijndiagram en het staafdiagram bijvoorbeeld, waarbij het lijndiagram meestal wordt ingezet wanneer je meer datapunten hebt. Een spreidingsdiagram is ook een geschikte data design om verdeling weer te geven.
3. De relatie tussen 2 of meer factoren
Als je met meerdere dimensies werkt en de relatie tussen die dimensies wilt weten dan zijn het spreidingsdiagram (puntgrafiek), het radardiagram en het bellendiagram goede oplossingen. Radardiagrammen zie je bijvoorbeeld veel in persoonlijkheids- of talentenonderzoeken waarin je gescoord wordt op verschillende onderdelen. Spreidingsdiagrammen gebruik je vooral wanneer je veel datapunten hebt. En heb je een kleinere hoeveelheid datapunten, dan kun je een eventuele derde dimensie kwijt in de grootte van cirkels in het bellendiagram.
4. Samenstelling van de dataset
Wanneer je dataset verschillende segmenten bevat en je benieuwd bent naar aantallen en verhoudingen tussen die segmenten, dan wil je de focus juist op die segmenten leggen in plaats van op de totalen. Daar zijn gestapelde staafdiagrammen en meervoudige lijndiagrammen zeer geschikt voor. Bij statische data, zoals de samenstelling van nationaliteiten op een universiteit, bieden cirkeldiagrammen een eenvoudige oplossing. Is de data dynamisch, wanneer je bijvoorbeeld de ontwikkeling van nationaliteiten in het verloop van de jaren wilt zien, dan heb je een extra dimensie nodig en zijn vormen als een gestapeld staafdiagram of een meervoudig lijndiagram geschikt.
Aan de slag met datavisualisatie
Ik hoop dat je een inkijkje hebt gekregen in de factoren die van belang zijn om tot een goede datavisualisatie te komen. In het proces zijn vaak verschillende actoren betrokken: beleidsmakers, beslissers, en technici bijvoorbeeld. Betrek deze stakeholders vroeg in het proces om tot concrete uitgangspunten te komen voor een datavisualisatie die in de informatiebehoefte van de doelgroep voorziet. Het is de rol van de ontwerper om deze uitgangspunten te vertalen in een leesbare en consistente data design, waarbij de helderheid en consistentie van de presentatie nooit uit het oog mogen worden verloren.
Meer weten over onze benadering van datavraagstukken? We helpen je graag op weg. Neem vrijblijvend contact met ons op en we laten je zien welke strategieën je kunt hanteren.