Logo

30’000 Gerichtsurteile in einer Minute sichten

Von DB, 26. Oktober 2016 3 Kommentare »
Kürzlich zeigten wir, wie das Parteibuch die Urteile von Richtern am Bundesverwaltungsgericht bei Asylbeschwerden beeinflusst. Die acht Schritte der Computer-gestützten Analyse.

Von Barnaby Skinner und Simone Rau

Die Vermutung hegen Asylrechtler schon lange: Die Richter des Bundesverwaltungsgerichts bewerten Beschwerden von Asylsuchenden je nach Parteizugehörigkeit unterschiedlich streng.

Nur festmachen liess sich das nie, weil das Bundesverwaltungsgericht in St. Gallen selber keine solchen Statistiken erstellt. Das Gericht ist als letzte Beschwerdeinstanz für alle in der Schweiz eingereichten Asylgesuche zuständig. Seit seiner Gründung im Jahr 2007 hat es laut Datenbank 29’356 Urteile gefällt (Stand Donnerstag, 20. Oktober).

Selbst wenn das Gericht die Urteile auswerten würde, öffentlich publizieren würde es die Resultate wohl nicht. Das Gericht wehrt sich dagegen, dass es zwischen Parteibuch und Urteilsschärfe einen Zusammenhang geben könnte.

Bisher ist auch die Wissenschaft nicht in die Bresche gesprungen. Ergebnisse der ersten solchen Studie finanziert vom Nationalfonds sind erst 2018 zu erwarten: «Gleiches Recht für alle oder Asyl-Lotterie? Gerichtliche Präferenzen des Bundesverwaltungsgerichts 2007 bis 2015».

Deshalb hat sich der Datenblog/«Tages-Anzeiger» die Urteile angeschaut. Im Folgenden findet sich eine Anleitung, wie die Computer-gestützte Analyse funktionierte. Der Code ist auf der Software-Entwicklungsplattform Github publiziert.

1

Beschaffung der 30’000 Urteile

Grundsätzlich sind alle Urteile für die Öffentlichkeit einsehbar. In den Urteilen wurde lediglich der Name der Kläger und teilweise diejenigen der Anwälte anonymisiert. Allerdings sind die Urteile nur einzeln einsehbar. Sie können nicht alle gesamthaft abgespeichert werden. Um alle Urteile gleichzeitig einzusehen, hat der Datenblog/«Tages-Anzeiger» sogenannte Scraping-Technologie eingesetzt.

Die Urteile wurden einzeln aufgerufen und auf einem lokalen Laufwerk abgespeichert. Jeder Entscheid benötigt rund 2 bis 3 Sekunden, um aus der Datenbank geladen zu werden. Das Prozedere, alle 30’000 Urteile aufzurufen, dauerte somit insgesamt 25 Stunden.

Wie die Urteile automatisiert aufgerufen werden, möchten wir hier nicht im Detail ausführen. Auf Anfrage wollte das Gericht dem «Tages-Anzeiger» nicht alle Urteile zustellen. Es habe sich noch nie mit einer solchen Anfrage beschäftigen müssen, sagt der Mediensprecher des Bundesverwaltungsgerichts Rocco Maglio.

Der Sprecher sagte weiter: «Indem wir die Gesamtheit aller materiellen Urteile schrankenlos im Internet zur Verfügung stellen, ist das Bundesverwaltungsgericht weiterhin fortschrittlich in der Schweizer Justizlandschaft und kommt den Informationspflichten gemäss Informationsreglement nach (SR 173.320.4).» Unbeantwortet liess der Sprecher die Frage, warum es für Dritte nur mit viel technischem Aufwand möglich sei, die Urteile des Bundesverwaltungsgerichts abzuspeichern.

2

Betrachtung der Urteile

Alle Urteile sind gleich aufgebaut. Hier ist ein Beispiel einsehbar. Eine konsistente Struktur ist eine Bedingung für die automatisierte Sichtung der Textdokumente.

Doch selbst wenn die Dokumente so gut strukturiert sind wie im Falle des Bundesverwaltungsgerichts, kann es zu Unregelmässigkeiten kommen. Schliesslich werden die Dokumente von Menschen verfasst, die Fehler machen oder einfach unterschiedlich arbeiten. Statt einem Punkt verwendet ein anderer Gerichtsschreiber ein Komma, ein dritter vielleicht einen Strichpunkt. Bei der Entwicklung des Codes muss der Computer auf jede solche Ausnahme aufmerksam gemacht werden.

3

Reguläre Ausdrücke

Ein regulärer Ausdruck (Englisch «regular expression») ist in der Informatik eine Zeichenkette, die bestimmten logischen syntaktischen Regeln entspricht. Nehmen wir das Beispiel eines Datums: «Urteil vom 3. Mai 2010».

Mithilfe eines regulären Ausdrucks kann man dem Computer befehlen, aus jedem Urteil Textstellen herauszufiltern, die mit «Urteil vom» beginnen; dann von einer bis zwei Zahlen, von einem Punkt, einem Grossbuchstaben und beliebigen weiteren Kleinbuchstaben gefolgt werden; und schliesslich mit vier Zahlen enden. Für den Computer sieht ein Befehl, um deutschsprachige Daten zu lesen, folgendermassen aus:

Urteil vom [0-9]+.[ ]*[ÄÖÜA-Z][äüöa-z]+ 20[0-9]+

Dieser reguläre Ausdruck findet alle Daten vom 1. Januar 2000 bis zum 31. Dezember 2099.

4

Problem Dreisprachigkeit

Die Urteile des Bundesverwaltungsgerichts sind allerdings dreisprachig. Alle französischen und italienischen Urteile würden durch den Raster des oben erwähnten regulären Ausdrucks fallen. Jede Sprache braucht deshalb die eigenen Ausdrücke. Also neben Deutsch auch Französisch und Italienisch:

Arrêt du [0-9]+[er]* [A-Z]*[éèàâæûa-z]+ 20[0-9]+

Sentenza del[l']*[ ]*[0-9]+[ |°][a-z]+ 20[0-9]+

5

Die Rechenschritte

Der Computer besucht nun jedes einzelne Urteil und vergleicht den Textinhalt mit den entwickelten regulären Ausdrücken. Er filtert so nicht nur das Datum heraus, sondern auch die Aktennummer und den Urteilsentscheid.

In Bruchteilen von einer Sekunde ruft der Rechner also die 30’000 Dokumente je dreimal für Datum, Nummer und Entscheid auf. Dann weitere dreimal für die unterschiedlichen Sprachen. Also zusammengerechnet 270’000-mal.

Die Namen der Richter und Richterinnen herauszufiltern, ist noch rechenintensiver. Hierfür füttern wir den Computer mit den Nachnamen der 44 seit 2007 am Bundesverfassungsgericht tätigen Richter. Jeden Namen prüft der Rechner in den Texten und trägt ihn in einer Datenbank ein. Pro Einsatz als Einzelrichter, als zustimmender Richter oder in einem Dreier- oder Fünfergremium erhält ein Richter einen Eintrag. Der Computer ruft die 30’000 Urteile insgesamt 1,32 Millionen Mal auf. Die ganze Sichtung dauert knapp eine Minute.

6

Statistikwerkzeug Pandas

Das Resultat ist eine Tabelle mit einer Kolonne für den Namen des Richters, eine für das Datum, für die Aktennummer und für den Urteilsentscheid. Um die Daten in eine geeignete und für den Menschen lesbare Form zu bringen, verwendeten wir Pandas, eine Daten-Analyse-Bibliothek der Programmiersprache Python.

7

Vereinheitlichung der Daten

Pandas und die Programmiersprache Python erlauben es, Daten zu vereinheitlichen. Nehmen wir das Beispiel der Kalenderdaten. Hier sind zum Beispiel deutsche, französische und italienische Datenformate wild durcheinandergeraten. Mit simplen Befehlen lassen sich diese vereinheitlichen, damit aus «3. Januar 2015» ein Format wird, das der Computer lesen kann. Etwa: «2015/01/03».

8

Datenbefragungen und Visualisierungen

Sobald die Daten harmonisiert sind, lassen sie sich visualisieren. Zum Beispiel, wie sich die gutgeheissenen und abgelehnten Urteile seit 2007 entwickelt haben.

screen-shot-2016-10-24-at-12-10-15

Oder die Entscheidungsprofile im Zeitablauf der verschiedenen Richter:

screen-shot-2016-10-24-at-12-11-26 screen-shot-2016-10-24-at-12-11-48

Die gesamte Dokumentation des Codes ist hier einsehbar. Wer Zugriff auf alle Asylurteile des Bundesverfassungsgerichts seit 2007 möchte, soll sich bitte bei der Redaktion melden.

3 Kommentare zu “30’000 Gerichtsurteile in einer Minute sichten”

  1. Irene Steffen sagt:

    Es ist bei unserem System davon auszugehen, dass von einer gewählten, einer bestimmten Partei zugehörigen Gerichtsperson geradezu erwartet wird, dass er oder sie die Urteile im Sinne der jeweiligen Partei fällt. Die Verteilung der Richterstellen auf die Parteien im Verhältnis zu ihrer Stärke fusst offensichtlich auf dieser Annahme. Und jetzt regt man sich auf, dass es so ist…??

  2. Remo Peter sagt:

    “Wer Zugriff auf alle Asylurteile des Bundesverfassungsgerichts seit 2007 möchte…” Schön wär’s wir hätten ein solches!

  3. Hans-Ruedi Gehrig sagt:

    Dazu brauche ich keine Statistik. Unvergessen ist der CVP-GP, der einen “Prostituierten-Fall” hatte. Als eine der Angeklagten ausführte, wie sie u.a. ihr Kind abgetrieben hat, wurde der Richter blass. Er wies mich später an, dieser Frau maximal an den Karren zu fahren, eine derartige gottesferne und impertinente Person habe er noch nie gesehen. Oder dann der Regierungsstatthalter, der mich schreiend anwies, ich solle gefälligst das Baugesuch pos. beurteilen: der Gesuchsteller sei ein wichtiger Politiker hier in Bern und guter Parteikollege vom ihm. X-Mal erlebt. Und dann all die (Kader-)Stellen, die nur an Parteikollegen und Freunde gingen. So ist die Schweiz. Filz und Absprache.