dinsdag 31 juli 2012

Datajournalistiek: handboek of RTFM

The Data Journalism Handbook; Jonathan Gray, Lucy Chambers, Liliana Bouegru. O'Reilly Media.
Paperback edition $17,49; Kindle edition $13,79
Gratis online versie van het handbook op: http://www.datajournalismhandbook.org/1.0/en/

De lezers lopen weg, de advertentiesinkomsten dalen, en online levert nauwelijks iets op. Het gaat slecht met de kranten en dat leidt tot gesomber over de journalistiek. Gaat de journalistiek misschien met de oude media ten onder? Opmerkelijk is dat tegelijkertijd het aantal nieuwe uitdrukkingen en combinatie met journalistiek toeneemt: webjournalistiek, multimediajournalistiek, online journalistiek, digitale journalistiek, computer assisted reporting(CAR). Het afgelopen jaar kwam een nieuwe term in de mode: datajournalistiek. De journalistiek lijkt me verre van dood, maar te zeggen dat datajournalistiek iets heel nieuws is, gaat wat ver.
Gepubliceerd op: De Nieuwe Reporter

Verkeersongevallen
Aan het eind van de vorige eeuw kende de School voor Journalistiek in Utrecht nog een specialisatie 'digitale journalistiek'. Het project 'verkeersongelukken' is een aardig voorbeeld van wat toen CAR heette. Verkeersongelukken worden centraal geregistreerd en een download uit de centrale database gaf voor Utrecht zo'n 2000 ongevallen. Echter, die ongelukken vinden natuurlijk niet bij toeval overal plaats. Sommige kruisingen zijn nu eenmaal gevaarlijker dan anderen. Dus maak een toptien van de gevaarlijke kruisingen en plaats die op een digitale kaart. Is dit nieuws? Ja want het gaat om bestaande data die op een nieuwe manier worden gerangschikt tot een nieuw inzicht leiden. Is het ook journalistiek? Nee, nog niet ik denk. En daarom gingen de studenten van toen, naar die kruisingen, spraken met gemeente, politie, hulpdiensten en omwonenden over het gevaar op de kruisingen. Journalistiek is meer dan een stel cijfers ordenen; het gaat om het verhaal, maar nu met harde cijfers onderbouwd.

Datajournalistiek heeft eigenlijk al een flinke geschiedenis. Philip Meyer gebruikte in 1967 een mainframe om de verslaggeving over de onrusten in Detroit te ondersteunenen en noemde dat 'precision journalism'. Onlangs kwam dit onderzoek en de werkwijze opnieuw ter sprake bij analyse door de Guardian van de rellen in London.

Bradt Guide
Hoe doe je dat, datajournalistiek; dat graven in een berg cijfers om een verhaal te maken? Je raakt snel de weg kwijt, omdat de hoeveelheid data enorm is toegenomen; niet alleen zijn databanken van overheden, internationale organisaties of NGO's beschikbaar, maar het web is zelf een databank geworden. De allereerste vraag is wat wil je weten?; naar welke verbanden ben je op zoek? Ten tweede welke technieken voor verzamelen en analyseren zet je in? De gereedschapskist van de wetenschap gaat verder open en de software om dat gereedschap te bedienen wordt eenvoudiger. Maar wat is handig en bruikbaar voor een concreet geval? En tenslotte: hoe vertel ik het de gebruiker/lezer? Visualisering is hier het trefwoord. The Data Journalism Handbook is de Bradt Guide voor de datajournalistiek en hoort in de koffer van elke journalist die een reis door dit nauwelijks ontgonnen landschap wil beginnen.

Het handbook is het resultaat van een project waar een groot aantal journalisten, hackers en onderzoekers aan deelnamen. Jerry Vermanen schreef hierover op De Nieuwe Reporter. Deze benadering geeft ruimte aan voorbeelden uit de journalistieke data-praktijk. Inspirerend is deze goudmijn aan voorbeelden, omdat het concreet laat zien hoe het team van onderzoekers te werk is gegaan. Al lezend kom je zelf op een idee: hé deze benadering zou ik ook op een ander onderwerp kunnen toepassen. Het gevaar van veel voorbeelden is dat je door de bomen het journalistiek databos niet mee ziet. Dat is niet het geval; de eindredactie volgt een strakke lijn: verzamelen, analyseren en visualiseren.

Read The Fucking Manual(RTFM)
Het Handboek voor de Datajournalistiek is zeker compleet, maar het is geen receptenboek, schrijft de redactie in het voorwoord. Stel dat ik bijvoorbeeld de woonplaatsen van Tweede Kamerleden wil analyseren. De NRC maakte hierover een prachtig verhaal onder de titel 'Er zit geen banketbakker meer in de Kamer'. Hoe schraap ik de woonplaatsen van de site van Tweede Kamer? In het hoofdstuk 'Getting Data' vind ik een korte verwijzing naar soorten scrapers; maar ik miste bijvoorbeeld Outwit Hub als plugin bij Firefox; wel een lang verhaal over scraper wiki. Plotseling sta ik tot me nek in Python en Ruby; meer voor coders en niet iets voor journalisten denk ik. Veronderstel we hebben die data, misschien moeten we de data opschonen: een bepaalde woonplaats behoort tot een gemeente. Google Refine wordt wel genoemd, maar hoe het werkt moet je zelf uitvinden. De volgende stap is eenvoudig, hoe ziet de toptien van woonplaatsen eruit; sorteren en ordenen in Excel. Je wilt ze ook op een kaart? QGIS (open software voor digitale kaarten) of Google Fusion Tables worden genoemd, maar hoe je die kaart maakt en je data aan de kaart koppelt blijf een geheim. De redactie van het Handboek onderkent dit probleem en schrijft: 'daarvoor hebben we de bibliotheek van internet'. Een zwakte bod maar vooruit. Het hoeft geen probleem te zijn als je bereid bent zelf de software te installeren en te leren hoe het werkt: RTFM!

Netwerken
De sociale media hebben onze communicatie getransformeerd tot een netwerk van contacten waarin we sharen, liken, en(re)tweeten. Hoe ziet dat netwerk eruit, wie zijn de centrale personen etc? De sleutel ligt bij sociale netwerk analyse en hiermee zijn aardige journalistiek verhalen te maken. Dit thema komt helaas nauwelijks aanbod. Opmerkelijk is dat in een Noors voorbeeld UCInet wordt genoemd als software. UCInet is typisch iets uit de wetenschappelijke gereedschapskist met een nogal stijle leercurve, terwijl Gephi of NodeXL – beide worden niet vermeld - wat gemakkelijker zijn.

Cijfers in de journalistiek is een lastig onderwerp. Uit ervaring weet ik dat percentages al tot grote moeilijkheden kunnen leiden. Een beetje statistiek is dus van groot belang in deze tak van sport. In een prachtig voorbeeld over de Amerikaanse verkiezingscampagnes worden de financiele bijdragen geanalyseerd met R-project (een soort SPSS voor gevorderden). Tja, dit is wat te veel van het goede, dan heb je wel een Bradt, maar ga je toch blind de datawoestijn in.

Nee, deze gebreken zijn niet onoverkomelijk. Het handboek laat vooral zien dat datajournalistiek teamwork is. Je hoeft niet alles te weten, ieder heeft zijn specialiteit, de coder, de statisticus, de schrijver, designer etc. Je moet elkaar wel begrijpen. Dit boek slaagt erin duidelijk te maken hoe verschillende disciplines samenwerken; de recepten zijn daardoor toch van onderschikt belang.

Datajournalistiek- the new kid on the block - is erg populair. Gelukkig, want dat journalisten niets met cijfers hebben is een misvatting. De IRE conferentie van dit jaar was, denk ik, de grote doorbraak. Media/kranten vragen naar meer scholing op data gebied; individuele journalisten scholen zich in spreadsheets, databases en kaarten. Wanneer de werkloosheid in de traditionele journalistiek toeneemt, liggen hier nieuwe kansen. Niet in de laatste plaats voor de journalistiek zelf. De datajournalistiek maakt de journalistiek weer springlevend. Dit handboek hoort standaard op elke redactie te staan en bovenaan de literatuurlijst van de scholen voor journalistiek.












Geen opmerkingen:

Een reactie plaatsen

Opmerking: alleen leden van deze blog kunnen een reactie plaatsen.