Fehlerquellen im schnellen Datenjournalismus

Die 7 Widersacher des tagesaktuellen #ddj

Datenjournalismus und schnell? Das ist nicht nur auf den ersten Blick ein Gegensatz. Daten wollen besorgt (wenn nicht gar erhoben), womöglich erst digitalisiert und bereinigt, auf jeden Fall sorgsam analysiert und vielleicht raffiniert dargestellt werden. In Deutschland beschränkt sich Datenjournalismus deshalb meist auf größere (Leuchtturm-)Projekte, die nicht so unter Zeitdruck stehen. Eine Ausnahme: Christina Elmer und ihre Kollegen bei Spiegel Online, die immer wieder auch in der Aktualität datenjournalistische Herangehensweise ausprobieren. Welche Klippen es dabei zu umschiffen gilt, hat Elmer in einem Vortrag auf der Social Media Week Hamburg erläutert.

Schon in der Langfassung ihres Vortragstitels warnt Elmer vor „fatalen Fußnoten“ – Anmerkungen zu nicht selbst erhobenen Daten, die vom Datenjournalisten ausgewertet werden sollen. Möglicherweise können diese Hinweise auf die Art und Weise der Datenerhebung oder Auswahl nämlich Einschränkungen offenbaren, die die Qualität der Daten stark beschneiden oder sie ganz für die journalistische Fragestellung ungeeignet erscheinen lassen.

Damit dies nicht erst nach einer umfangreichen Datenanalyse oder gar noch Fertigstellung einer darauf basierenden Story ist, rät Elmer: Fußnoten zuerst lesen – und Auffälligkeiten in der Datenqualität gegebenenfalls selbst zum Thema machen.

Ein Beispiel aus der Praxis bei Spiegel Online: bei der Landtagswahl in Sachsen wurden Briefwähler teilweise gesammelt für mehrere Gemeinden gemeinsam ausgezählt. Das führt dazu, dass sich die Daten zur Wahlbeteiligung nicht miteinander vergleichen ließen. Statt eines Stückes über die erfreulich hohe Wahlbeteiligung in einigen Gemeinden schrieb Elmer ein Stück über die „absurde Wahlbeteiligung“ in Sachsen.

Möglicherweise fallen die Daten in einem solchen Fall ja auch schon in Elmers nächste Widersacher-Kategorien:

  • Besonders bei Studien, die über Presse- oder Agenturmeldungen auftauchen, Datenbasis und Erhebungsmethode unter die Lupe nehmen. Zum Beispiel, wenn das Ergebnis so schön sexy „Senioren ist Kuscheln wichtiger als Sex“ heißt. Auch wenn in der PM von „drei Erhebungswellen“ die Rede ist – die absolute Fallzahl der Befragten sei doch in dieser Studie sehr gering gewesen. Elmers Tipp: Datenjournalisten sollten andere Redakteure präventiv vor methodisch schlechten Studien warnen, wenn diese z. B. durch die Agenturen geistern, bevor die Kollegen das Thema aufgreifen.
  • Gerade bei aktuell heißen Themen neigten Journalisten dazu, sich auf auf ihnen angebotene Studien zu stürzen, auch wenn deren Qualität eigentlich nicht gut genug ist: Besser irgendein Ergebnis als gar keins. So kritisiert Elmer die Aussagekraft der Untersuchung „Pegida mag dich“, die auswertete, welche sonstigen Seiten bekennende Pegida-Fans bei Facebook sonst gefallen (Zeit-Artikel darüber).

Als Fallstrick klassifiziert die Spiegel-Redakteurin auch die zunehmende Zahl mobiler Zugriffe auf die eigene Website: Komplexe Tabellen oder interaktive Grafiken werden schon aus Platzgründen auf Smartphones nicht vernünftig dargestellt. Schlecht, wenn man damit einen großen Teil der Besucher der eigenen Website außen vor lässt – insbesondere, wenn diese schon auf den Teaser geklickt haben. Empfehlung: In einem Artikel mit mehreren Visualisierungen in den sauren Apfel beißen und nicht unbedingt die journalistisch interessanteste Aussagen nach oben stellen, sondern auf jeden Fall eine Visualisierung, die Mobilnutzer nicht ausschließt.

Widersacher Nr. 6: In PDFs versteckte Daten. Zu dieser für Internetausdrucker am leichtesten zugänglichsten, für Vortragsreisende sichersten Variante und vom Datenwrangler ungeliebtesten Variante ist schon viel gesagt worden. Tipp der Expertin: In PDF-Dateien versteckte Tabellen konvertieren mit Tabula]. Ansonsten sollte der Umgang mit Scraping-Werkzeugen schon mal trainiert werden, damit man nicht in der Aktualität mühsam die notwendigen Tools erschließen muss. Und im Zweifelsfall – „If you have to do it more than once, automate it.“  zum Trotz – sei manchmal die Variante Copy+Paste die schnellste zum Datenübertragen.

Die letzte von Elmer beschriebene Hürde ist eine redaktionsinterne: hohe Ergebnis-Erwartungen der Kollegen an datenjournalistische Herangehensweisen. Dem könnten Datenjournalisten entgegen, wenn sie sie sich im Vorfeld von Terminen überlegten, welche Minimal-Variante einer Analyse sie garantieren könnten – „auch wenn es einigermaßen unspannnd ist. Wenn es dann mehr wird, ist es super!“ Aber: „Kein Stau kann auch eine Nachricht sein.“

Angesichts der beschriebenen Fallstricke stellte Vanessa Wormer, Onlinejournalistin der „Heilbronner Stimme“, am Ende die ketzerische Frage, ob das nicht alles gegen den Einsatz von Datenjournalismus im Redaktionsalltag spreche? So weit wollte Elmer dann doch nicht gehen: Trotz aller Schwierigkeiten würden datenjournalistische Herangehensweisen helfen, den Online-Nachrichtenjournalismus mit Tiefe zu unterfüttern.

Weitere Links

… im sonstigen Internet:

  • Facebook
  • Twitter
  • StumbleUpon
  • Diigo