vrijdag 12 oktober 2012

De hinkstapsprong van de datajournalistiek


Datajournalistiek is een combinatie van verhalende journalistiek en verifiërende wetenschap. Phillip Meijer omschreef het in de Hedy Lamarr Lecture alsvolgt: “..in the second half of the 20th century, (when) journalists began experimenting with two new ways of making the quest for truth more manageable. Precision journalism borrowed the tools of science. Narrative journalism was based on art. In their early stages, these two approaches seemed to be in conflict. My argument today is that, in the 21st century, we should consider the possibility that we need both”. Heel mooi, maar deze combinatie heeft flink wat problemen. Zonder nuance en kort door de bocht: journalisten zijn slecht in rekenen en wetenschappers schrijven nogal saai. Hoe breng je dat samen? Henk van Ess en Hille van der Kaa, doen in het Handboek Datajournalistiek een geslaagde poging.
Gepubliceerd op De Nieuwe Reporter  en Persinnovatie


Verhaal
Datajournalistiek is en blijft journalistiek. Het gaat om het verhaal. De cijfers, tabellen en grafieken zijn het resultaat van een lange speurtocht. Misschien is het wel nieuws. Maar je gooit niet een stapel cijfers in de krant. Prachtig is natuurlijk het voorbeeld van The Guardian: de analyse van de relatie tussen armoede en de onlusten in London verleden jaar. Verhalende journalistiek gaat hand in hand met aan data getoetste uitspraken. Onmogelijk is het dus het niet, maar om zo hoog te komen is een hele klim. Van Ess en Van der Kaa doen dat stap voor stap; Eerst het vinden van de data in databases of op het web. Daarna de verwerking en analyse in een spreadsheet en de vizialisering daarvan in grafieken en kaarten. Tenslotte het verhaal en de twijfel; want zit het echt wel zo?

De praktijk leert nog iets anders. Na een lange WOB procedure beschikt een redactie over een prachtig Excel sheet met wapenvergunningen. Wat blijkt daar nu uit? Geen idee, want dat hangt af van je wilt weten! Anders gezegd: alle datajournalistiek begint met een idee, vraag of een hypothese: wat wil je weten? Alleen vanuit dat perspectief zeggen data iets. En bovendien, hoe wordt het gemeten? Dit essentiele onderdeel blijft wat onderbelicht en had een apart hoofdstuk waard geweest, in plaats van de tips op het eind van het boek.

Zoektrucs
Welke data kun je vinden? Al lezend zie je bijna hoe Henk van Ess de doos zoektrucks opentrekt en het resultaat van de ene na de andere zoekopdracht op het scherm tovert. Soms zitten data niet in een mooi bestand of formulier, maar staan op web, op verschillende pagina's. Scrapen dus. De paragraaf over Outwit Hub is wat summier en de verwijzing brengt me bij een artikel van het Poynter Institute over scraping, met uiteindelijk de raad: lees de handleiding.

De moeder van alle datajournalistiek is een spreadsheet, meestal Excel. Dat is lastig als je alleen een tekstverwerker gewend bent. De instap bij dit hoofdstuk is hoog; we beginnen gelijk met het opschonen van de data in Excel om daarna direct door te gaan met draaitabellen. Alles aan de hand van data die op website van het boek te vinden zijn. Dat werkt prima maar je moet de basics wel onder de knie hebben.

Wanneer we ons door de cijferbrei van Excel hebben heen geworsteld, dan kan de journalistieke pret beginnen. Het presenteren van de data en het vertellen van het verhaal via vizualisaties. ManyEyes, Tableau en Fusion Tables passeren de revue. Maar probeer zelf eens een kaart te maken met Fusion Tables dmv van geo-coding van je data; precies het aantal fouten is nogal groot. Wat is eigenlijk de waarde van Fusion Tables?

Rokende Pistolen
Aan het eind van het boek volgt de analyse van data en discussie over de juistheid. Dit onderdeel met veel tips is nuttig en bovendien leuk om te lezen. Maar het is ook een beetje een allegaartje: van schijn verbanden tussen variabelen(elaboratie), gemiddelde en modus, causaliteit(post hoc, proper hoc) tot betrouwbaarheid van steekproeven(overigens kon ik in het hele boek niets vinden over enquetes). Of zomaar een verbazingwekkende uitspraak:“ Met uitschieters is vaak iets bijzonders aan de hand...wetenschappers proberen dat meestal weg te moffelen,....journalisten zijn er dol op....” (p.178). Oh ja?

Het Handboek Datajournalistiek wordt zo een soort hinkstapsprong naar allerlei onderwerpen uit de methodologie en statistiek. Al die tips zijn best nuttig, maar het verband ontbreekt. Wanneer de journalistiek gebruik wil maken van het gereedschap van de wetenschapper, dan is enig begrip van de systematiek van het onderzoek van belang, en dat is meer dan nuttige tips. 

-->
Handboek datajournalistiek
Henk van Ess en Hille van der Kaa
Boom Lemma uitgevers Den Haag 2012
ISBN 978-90-5931-885-4
220 p. Euro 32,50

Geen opmerkingen:

Een reactie plaatsen

Opmerking: alleen leden van deze blog kunnen een reactie plaatsen.