top of page

Das Insolvenzverfahren und die Hilfestellung durch EDiscovery und künstlicher Intelligenz

Autorenbild: Cem KözCem Köz

Unsere Gespräche und langjährige Zusammenarbeit mit Beratern aus den Bereichen der Insolvenzverwaltung und Sanierung haben gezeigt, dass die Arbeit der Insolvenzverwalter zunehmend durch wachsende Datenmengen erschwert wird. Die herkömmlichen Methoden reichen zur Bewältigung dieser Datenmengen nicht mehr aus. Ein Beispiel aus der Praxis zeigte, dass bereits das Auffinden von Arbeitsverträgen auf den IT-Systemen zu einer zeit- und kostenintensiven Aufgabe werden kann, sofern wichtige Mitarbeiter ein insolventes Unternehmen verlassen haben. Die EDiscovery macht elektronische Dokumente auf den verschiedenen IT-Systemen eines Unternehmens durchsuchbar, wodurch der Insolvenzverwalter über eine einfache Sucheingabe wichtige Dokumente finden kann. Eine strukturierte Dokumentensichtung erlaubt das Sichten einer hohen Anzahl von Dokumenten durch große Teams. Die künstliche Intelligenz unter Verwendung der Themenmodellierung kann zusätzliche Hilfestellung leisten. In der Themenmodellierung werden Dokumente automatisiert nach ihrem Inhalt klassifiziert.


Identifizierung relevanter Datenquellen und die Vorbereitung der EDiscovery

Die Datensicherungen der IT-Systeme des insolventen Unternehmens erfolgen grundsätzlich durch dessen IT bzw. dem durch den Insolvenzverwalter beauftragten IT-Dienstleister. Aufgrund rechtlicher Vorgaben zur revisionssicheren Langzeitarchivierung liegen die wesentlichen IT-Systeme, wie E-Mail- und Datei-Server, zumeist bereits auf Backup-Datenträgern in gesicherter Form vor. So können in Abstimmung mit der IT die relevanten Datenquellen schnell identifiziert und für die Verarbeitung auf einen zentralen EDiscovery-Server kopiert werden. Ein Zugriff auf die produktiven IT-Systeme des insolventen Unternehmens ist dann nicht mehr notwendig (gegebenenfalls sind die Produktivsysteme auch bereits abgeschaltet worden). Idealerweise wird in diesem Prozessschritt bereits eine Vorfilterung vorgenommen und auch nur relevante Datentypen, wie Word- oder PDF-Dokumente, aus den Backup-Datenträgern kopiert. Im Vorfeld muss der Datenschutzbeauftragte, je nach Art der Datenquelle, seine Freigabe erteilen. Datenschutzrechtlich sensible Datenquellen, wie E-Mail-Daten, unterliegen häufig einem langen Freigabeprozess, um im Rahmen einer EDiscovery verarbeitet werden zu können. Die Freigaben sollten deshalb priorisiert nach Datenquellen erfolgen. Datenquellen, die datenschutzrechtlich weniger sensibel sind, können vom Datenschutzbeauftragten rechtlich einfacher bzw. schneller bewertet und freigegeben werden. Die Datenverarbeitung für die EDiscovery kann dann frühzeitig beginnen. Besteht daneben die Notwendigkeit einen bestimmten Sachverhalt aufzuklären, so kann es zusätzlich relevant sein, forensische Sicherungen von Mitarbeiterendgeräten durchzuführen, da diese häufig nicht Bestandteil von revisionssicheren Langzeitarchivierungen sind. Forensische Sicherungen von Datenträgern sind gerichtsverwertbar und ermöglichen u.a. die Wiederherstellung gelöschter Daten.


Datenverarbeitung und -aufbereitung

Nachdem die relevanten Daten bzw. elektronischen Dokumente auf den zentralen EDiscovery-Server kopiert worden sind, werden diese im nächsten Schritt aufbereitet und verarbeitet. Im Rahmen der Datenverarbeitung erfolgt u.a. die Textextraktion aus den elektronischen Dokumenten. In diesem Prozessschritt werden auch Texte aus Bildinformationen, wie Scans, durch das sogenannte OCR extrahiert. Weiterhin werden mehrfach vorliegende Dokumente gegeneinander dedupliziert, so dass später in den Suchergebnissen die Dokumente nur einmal aufgelistet werden. Während einer strukturierten Dokumentensichtung verhindert die Deduplizierung zudem Mehrfachsichtungen desselben Dokumentes. Der extrahierte Text wird schließlich indiziert und dadurch durchsuchbar gemacht.


Suchabfragen und die Dokumentensichtung

Die Dokumente können nach erfolgter Verarbeitung über eine Suchmaske durchsucht werden. Die Suchanfragen können einfache Stichwörter sein oder aber auch beliebig komplex gestaltet werden. Beispielsweise können Suchwörter durch UND- und ODER-Operatoren verknüpft werden oder ein Unschärfegrad („Fuzziness“) kann hinzugefügt werden. So können auch Wörter gefunden werden, die leicht vom Suchwort abweichen, wie beispielsweise Ausfall und Außfall. Die gefundenen Dokumente können für eine strukturierte Sichtung durch große Teams in Dokumentenbündel eingeteilt und den Team-Mitgliedern zugeordnet werden.


Künstliche Intelligenz mit Themenmodellierung

Neben der Anwendung von Suchen kann es hilfreich sein, wenn die elektronischen Dokumente thematisch kategorisiert werden. Dadurch kann der Datensatz, wie in einem Bibliothekskatalog, thematisch durchgesehen werden. Da in einer Insolvenz es sehr unwahrscheinlich ist, dass die Daten in geordneter und kategorisierter Form vorliegen, kann die künstliche Intelligenz mithilfe der Themenmodellierung helfen. Die künstliche Intelligenz erkennt dabei automatisiert die Themen in einem Datensatz und kategorisiert sie.





bottom of page