Wenn Computer juristische Sprache erkennen können: Von Zitaterkennung bis echte Textanalyse.

Warum ist das wichtig: Eine Vielzahl an Information im juristischen Umfeld ist Text, meist in unstrukturierter Form. Ein Großteil der  tagtäglichen Arbeit in Kanzleien ist das Erfassen und Bearbeiten von Texten – seien es Verträge, gegnerische Klagschriften, Klagebeantwortungen, Publikationen, oder einfach nur die Vorarbeiten oder Recherchen von Konzipienten. Nahezu immer muss der Text schnell erfasst, einzelne Argumente eingeordnet oder anhand von Literatur überprüft werden. 

Es geht nicht nur darum zB Zitate in Texte zu erkennen, sondern es Programmen zu ermöglichen, diesen unstrukturierten Text zu verstehen und daraus Daten zu extrahieren. Wenn wir das schaffen, dann haben wir einen wahren Schatz gehoben: Stellen Sie sich vor, Programme könnten in der juristischen Arbeitsweise sogar einige Schritte „vorausdenken“ und könnten uns Routinetätigkeiten abnehmen – zB: das Herstellen einer schnelle Orientierung oder einer zweckdienlichen Basis an Rechtsliteratur. Je schneller man den inhaltlichen juristischen Rahmen abgesteckt hat,  desto eher und genauer kann man darin navigieren, gestalten, entscheiden und beraterische Wertschöpfung kreieren. 

NLP (Natural Language Processing) ist ein Teilgebiet in AI (Artificial Intelligence), das genau das zum Ziel hat: Sprache und Bedeutung mit Computerprogrammen zu verstehen. Der Prozess des Verstehens natürlichsprachlicher Texte ist sehr komplex und es bedarf einer sehr granularen Analyse des Textes. Oft sind juristische Texte sprachlich sehr unterschiedlich, obwohl die dahinter liegenden  juristischen Prinzipien ident sind.

Nicht eine Technologie, ein Algorithmus ist hier hinreichend um gute Ergebnisse zu erzielen, normalerweise bedeutet NLP die Anwendung unterschiedlicher Machine Learning (ML) Modelle. Um eine hinreichende Qualität der Verfahren zu erzielen, bedarf es außerdem eines iterativen Prozesses des Anpassen/Verbesserns der angewandten Algorithmen (Sentence Segmentation, Word Tokenization, Dependency Parsing, etc etc ).

Ein Beispiel anhand des Word-Addins Lexis SmartScan – dem ersten juristischen NLP-System von LexisNexis Österreich:

Der zu analysierende Beispieltext:

 

Das System findet inhaltliche Abhängigkeiten im Satzgefüge:

Das System gesichtet Inhalte und reduziert sie auf Wortstämme:

 

Der speziell angepasste Algorithmus von Lexis SmartScan kann daraus ein Sprach-Verständnis herstellen. Aus einem Abgleich mit der Lexis 360® Rechtsdatenbank mittels SmartSearch Technologie können lösungsrelevante Urteile, Gesetze, Fachartikel, Kommentare/Handbücher-Passagen uvm. abgeleitet werden. Ergebnis: das rechtliche Umfeld des Ausgangstextes ist automatisiert erschlossen und wird als weiterführende Literatur empfohlen. 

Endergebnis anhand eines Beispiels:   

Mehr zu juristischer Textanalyse und Lexis SmartScan