Datengetriebener Journalismus : Kein Roboterj...
 
Datengetriebener Journalismus

Kein Roboterjournalismus

APA
Katharina Schell von der APA sieht die aktuellen Hürden bei der Automatisierung des Journalismus in der Datenlage.
Katharina Schell von der APA sieht die aktuellen Hürden bei der Automatisierung des Journalismus in der Datenlage.

Immer häufiger werden aus Daten journalistische Berichte. Katharina Schell von der APA erklärt im ­HORIZONT-Interview, was datengetriebener ­Journalismus kann und was er nicht sein soll.

Automatisierung und Datenjournalismus spielen eine wachsende Rolle in der Medienproduktion und bergen ein großes Entwicklungspotenzial. Auch die Austria Presse Agentur hat sich dieser Thematik bereits vor einigen Jahren angenommen. 2017 wurde beispielsweise Egon, der Fußballroboter, der aus Daten Spielberichte formulierte, als eines der ersten Projekte in Betrieb genommen. Die Grundlage, um automatisiert sinnvolle Texte zu generieren, sind strukturierte Daten, wie etwa Namen von Personen, denen bestimmte Merkmale wie Alter, Geschlecht oder Beruf sowie weitere Informationen zugeordnet sind. Bevor die Maschine einen Text erstellen kann, muss ein Mensch alle aus diesen Daten möglichen Texte vorbereiten und jeweils Lücken für die Variablen wie Namen oder Alter definieren. Welche Information schließlich in welchem Fall in welche Lücke zu füllen ist, muss ebenfalls von Menschenhand festgelegt werden. Erst nach diesen umfangreichen Vorarbeiten entstehen Texte scheinbar auf Knopfdruck.

Automatisierte Grätzl-Texte


Zuletzt bekam der datengetriebene Journalismus rund um die Wiener Gemeinderatswahl 2020 im Oktober eine größere Plattform. „Wir haben bei jeder Wahl datengetriebene Berichterstattung auf lokaler und hyperlokaler Ebene im Programm. Konkret bedeutet das, dass bei bundesweiten Wahlen eine Meldung auf Basis der Resultate (der Wahlbehörde) pro Gemeinde generiert wird“, erzählt Katharina Schell, Mitglied der Chefredaktion der APA – Austria Presse Agentur und zuständig für redaktionelle Innovationen, dem HORIZONT. „Bei der Wien-Wahl sind wir erstmals noch tiefer in die Bezirke gegangen und haben Grätzl-Texte angeboten. Außerdem verwenden wir Automatisierung für interne Zwecke, nämlich für Textvorschläge bei Themen, die auf regelmäßig aktualisierten Datensätzen basieren.“ Hier sei man allerdings noch in der Experimentierphase.

Knackpunkt Datenlage

Datengetriebener Journalismus ist allerdings nur so gut, wie es die Datenlage auch erlaubt. Dies sei, so Schell, auch eine der Schwierigkeiten. „Eine der größten Hürden ist zweifellos die Datenlage. Das sehen wir bei Wahlen sehr gut. Es gibt keine einheitlichen Standards, weder, was die Formate betrifft – maschinenlesbar – noch inhaltlich. Der schönste maschinenlesbare Datensatz ist für datenjournalistische Zwecke unbrauchbar, wenn er nicht die nötigen Informationen enthält oder aber inkonsistent ist“, erläutert Schell.

‚Wiener Dateng’schichten‘

Das aktuellste Projekt, das sich gerade in Umsetzung befindet, sind die „Wiener Dateng’schichten“. Schell: „Wir haben eine Förderung der ­Wiener Medieninitiative für das Projekt ‚Wiener Dateng’schichten‘ erhalten. Damit sind wir gerade nach der Wien-Wahl gestartet. Wir wollen herausfinden, welche Geschichten und Gschichtln wir auf Basis der Daten der Wiener Landesstatistik erzählen können.“ Dabei geht Schell davon aus, „dass Automatisierung an jedem Punkt des Medienschaffens eine immer wichtigere Rolle spielen wird“. Im Aufbringen, Finden von Informa­tionen – Stichwort Sourcing, Stichwort Crawler -, in der Contentproduktion, aber auch in der Distribution der journalistischen Inhalte.

‚Keine Magie‘

„Automatisierungsprozesse im Journalismus sind weder Roboter-Technik noch Magie, sondern bedeuten neue Workflows, neue Werkzeuge. Und man muss lernen, mit neuen Werkzeugen umzugehen.“ Sie nennt eine simple Metapher: „Wenn ich das erste Mal eine Motorsäge anwerfe, ohne mich darum zu kümmern, wie die funktioniert und was sie anrichten kann, wird das eher ein Kettensägenmassaker als ordentlich Feuerholz für den Winter“, erläutert Schell.

Kein Ersatz

Klare Transparenzregeln, eine Adaption der Qualitätssicherungskriterien und vor allem eine klare Vision, welche Inhalte man warum automatisiert und welchen Einsatzzweck sie haben sollen, sind aus Sicht von Schell notwendig. „In der APA ist für uns derzeit das Motto, dass wir automatisierte Texte als zusätzliches digitales Contentprodukt anbieten, nicht aber als Ergänzung oder gar Ersatz für Teile unseres Basisdiensts.“ Das wäre für sie undenkbar, „weil es quasi den österreichischen Nachrichten-Backbone betreffen würde.“

Eine weitere „Gefahr“ wäre wohl blindes Vertrauen in die Daten oder die (von Journalisten geschriebenen) Algorithmen. „Check, Recheck gelten auch im Datenjournalismus, das darf man nicht vergessen.“ Die Qualitätssicherungsmechanismen der APA-Redaktion werden auch bei Automated Content angewendet. „In der Redaktion gilt ein striktes Vier-Augen-Prinzip, keine Meldung geht aufs Netz, ohne dass sie ein zweites Augenpaar gesehen hat“, erläuterte Schell. Dieses Prinzip setzt man bei automatisiert erstellten Texten schon vor deren Generierung um und kontrolliert, ob alle Lücken und Variablen des Algorithmus richtig definiert wurden, noch bevor dieser zum Einsatz kommt. Weiters finden an Wahlabenden Plausibilitätsprüfungen der importierten Datensätze und stichprobenartige Kontrollen der erstellten Texte statt.

Daten- statt Roboterjournalismus

Schell wehrt sich daher auch gegen den Begriff Roboterjournalismus, wie er häufig in der medialen Bericht­erstattung verwendet wird. Es seien Maschinen und Algorithmen im Spiel, aber diese werden von Journalistinnen und Journalisten programmiert, so Schell. „Wir machen nicht Roboterjournalismus, wir machen Datenjournalismus.“„Künstlich intelligent ist in diesem Verfahren relativ wenig“, fasst sie zusammen. Es brauche Journalisten mit sehr spezifischem Know-how, mit Wissen über das Thema, über Daten und deren Verarbeitung, über Sprache und mit narrativen Kompetenzen, sagt sie. Diese menschlichen Fertigkeiten seien unabdingbar. „Die Maschine kann nicht Geschichten erzählen“, bereits im Vorfeld müsse sich der Mensch diese überlegen.

stats