Blogpost

Mit Integrated Gradients KI-Modelle verstehen

Künstliche Intelligenz, insbesondere Machine Learning, gewinnt auch in der Finanzbranche immer mehr an Bedeutung. Diverse Aufsichtsbehörden und Gesetze regeln die Rahmenbedingungen des Einsatzes zur Datenverarbeitung und verlangen eine klare Nachvollziehbarkeit von Künstlicher Intelligenz. Sind "Integrated Gradients" die Lösung?

56
3 Minuten Lesezeit
Mit Integrated Gradients KI-Modelle verstehen

In dieser Collection enthalten:

Collection öffnen

Durch den rapiden Fortschritt in der Forschung, der Zunahme der Rechenleistung moderner Computer und dem immer großflächigerem Einsatz in der Industrie gewinnt Künstliche Intelligenz und insbesondere das Feld des Machine Learnings (ML) immer mehr an Bedeutung. Auch in der Banking Branche halten moderne ML-Methoden Einzug, welche mit etablierten Verfahren wetteifern und diese aufgrund besserer Performance teils vollständig ablösen. Getrieben wird dieser Wandel durch den Kampf um Wirtschaftlichkeit und harschen Wettbewerb.

Rahmenbedingungen

Diverse Aufsichtsbehörden und Gesetze wie die CRR/CRD und DSGVO regeln die Rahmenbedingungen zur klassischen Datenverarbeitung. Moderne Methoden benötigen aufgrund ihrer neuen Funktionsweisen eine Überarbeitung bzw. Erweiterung dieser Rahmenbedingungen. Die BaFin, die Deutsche Bundesbank als auch die EBA (mit ihren Diskussions- und Thesenpapieren) nehmen als wichtige Aufsichtsorgane Stellung zum Einsatz und zur Entwicklung solcher Systeme zur Datenverarbeitung. Ein entscheidender Faktor ist die Erklärbarkeit bzw. Nachvollziehbarkeit von Künstlicher Intelligenz.

Use Case: Kreditvergabe auf Basis von Kundenscores

Um diesen Aspekt genauer zu erläutern wird im Folgenden eine alltägliche Aufgabe einer jeden Bank betrachtet: Die Entscheidung der Kreditvergabe auf Basis von Kundenscores, dieses Mal jedoch durch ein Machine Learning Modell gesteuert (zur Verständlichkeit wird dieser Prozess jedoch vereinfacht dargestellt). Die Problemstellung lässt sich einfach zusammenfassen: Herr Mustermann möchte einen Kredit, der Bankangestellte gibt die Kundendaten in das Modell und erhält als Ergebnis einen hohen Score, woraufhin er grünes Licht für die Kreditvergabe gibt. Doch wie genau entscheidet das Modell nun über diesen Score, hält es sich an geltende Regeln oder Gesetze und hält diese Entscheidung einer genauen Prüfung der Revision stand? Um diese Fragen beantworten zu können, muss die Bank in der Lage sein nachzuvollziehen, aufgrund welcher Eigenschaften das Modell den ausgegebenen Score gebildet hat.

Am einfachsten lassen sich Modelle wie die logistische Regression oder Entscheidungsbäume erklären. Diese besitzen eine inhärente Erklärbarkeit aufgrund ihrer simplen Funktionsweise. Bei der logistischen Regression besitzt jede Kundeneigenschaft ein Gewicht und die Summe daraus ergibt das Ergebnis. Im oben genannten Beispiel besitzt Herr Mustermann Sicherheiten im vielfachen Wert der Kredithöhe. Das Modell gewichtet diesen Wert (nach Optimierung durch vergangene Kreditvergaben) mit 90% der Gesamtentscheidung und liefert somit einen hohen Score. Diese Gewichte können direkt abgelesen und interpretiert werden, wodurch eine hohe Transparenz und Nachvollziehbarkeit gegeben ist. Ein entscheidender Nachteil bei solchen simplen Modellen ist jedoch deren eingeschränkte Genauigkeit.

Der Einsatz von Künstlicher Intelligenz muss erklärbar und nachvollziehbar sein.

Moderne Modellarten wie zum Beispiel Neuronale Netzwerke besitzen diese inhärente Erklärbarkeit nicht. Auf den ersten Blick erscheinen diese wie enorme Blackboxen welche keinen Einblick in die innere Funktionsweise zulassen. Dennoch existieren Techniken, welche versuchen die Rolle der Kundeneigenschaften anzugeben. Hierbei wird zwischen lokalen und globalen Methoden unterschieden: Lokale Methoden verändern geringfügig die Eingaben in das Modell und messen den Einfluss auf das Ergebnis (zum Beispiel 10% weniger Sicherheiten verringern den Score um 5 Basispunkte). Währenddessen versuchen globale Methoden allumfassende Entscheidungskriterien des Modells herauszuarbeiten. In der Regel lassen sich nicht beide, also präzise Aussagen über einen einzelnen Kunden als auch detaillierte Aussagen über das Zusammenspiel von Kundeneigenschaften für die gesamte Kundschaft, gleichzeitig getroffen werden.

Integrated Gradients

Ein vielversprechender Ansatz, welcher lokale und globale Erklärbarkeit bestmöglich vereint, sind Integrated Gradients. Dieses, speziell auf Banking spezifische Anwendungen zugeschnittene, Verfahren verwendet sowohl Informationen über das globale Entscheidungsverhalten des Modells als auch Einflüsse der Daten des einzelnen Kunden. So lässt sich eine bestmögliche Balance aus globaler und lokaler Entscheidungserklärung finden.

Einflussfaktoren bei Integrated Gradients

Abbildung 1: Zusammenspiel aus lokalen und globalen Einflussfaktoren bei Integrated Gradients

Hierbei wird eine Stichprobe der Gesamtkundschaft verwendet, um eine statistische Baseline zu erhalten. Daraufhin wird in einem speziellen Verfahren gemessen, welchen Einfluss die einzelnen Kundeneigenschaften auf das Ergebnis haben, wenn anstatt der Baseline der Zielkunde verwendet wird. Integrated Gradients können somit durch geeignete Anwendung auf Einzelkunden sowie Kundengruppen ein umfangreiches Entscheidungsprofil eines Machine Learning Modells generieren.

Entscheidung eines neuronalen Netzwerks

Abbildung 2: Beispielhaftes Entscheidungsprofil nach einer Analyse mit Integrated Gradients

Fazit

Das Verständnis und die Nachvollziehbarkeit von komplexen Modellen stellt einen Grundpfeiler für zukünftige Datenverarbeitungen in der Bank der Zukunft dar. Zur Sicherung der Robustheit der Systeme und Einhaltung aller bisherigen und zukünftigen Regularien ist ein tiefes Verständnis der gelieferten Ergebnisse anhand lokaler und globaler Erklärungsmethoden – beispielsweise mit Integrated Gradients – unersetzbar.

Blitz auf schwarz

Sind Sie bereit für das Banking der Zukunft?

Die Zukunft des Bankings hat bereits begonnen. Und der disruptive Wandel der Branche Banking schreitet weiter voran. Treiber sind vor allem der Einsatz Künstlicher Intelligenz, der Ausbau von Plattformökonomien und das Eindringen von FinTechs in klassische Bankdienstleistungen. Die Spielregeln einer gesamten Branche werden neu definiert. Wie müssen sich Banken JETZT aufstellen, um für die zukünftigen Herausforderungen gerüstet zu sein? Diese Frage steht im Fokus unserer Serie Banking der Zukunft.

msg GillardonBSM

denkt Banking neu und bietet seinen Kunden smarte, innovative und plattformbasierte digitalisierte Lösungen aus einer Hand.

Schreiben Sie einen Kommentar

Sie müssen sich anmelden um einen Kommentar zu schreiben.