1 Actuarial Data Science – Business Cases
In den nachfolgenden Kapiteln werden wir Methoden, Verfahren und Prozesse im Themenfeld Data Science beschreiben, erläutern und analysieren. Dabei werden wir – stets mit einem Blick auf das aktuarielle Umfeld – ebenso auf die technischen Möglichkeiten und Herausforderungen wie auch die mathematischen Verfahren des maschinellen Lernens eingehen.
Bevor wir uns inhaltlich genauer mit Data Science Themen beschäftigen, geben wir in diesem Kapitel einen kurzen Überblick über beispielhafte Anwendungen, sogenannte Use Cases. In den nachfolgenden Kapiteln werden wir auf diese zurückkommen und die vorgestellten Verfahren u.a. anhand dieser Use Cases erläutern.1
Stornoprognose
In den Risikomanagement-Abteilungen von Versicherungsunternehmen beschäftigen sich Aktuarinnen und Aktuare mit allen Risiken, denen das jeweilige Unternehmen ausgesetzt ist, und versuchen, diese zu modellieren und zu quantifizieren. Im Rahmen des sogenannten Asset-Liability-Managements oder im Kontext von Solvency II führen sie Rechnungen durch, bei denen sie Finanzkennzahlen und Zahlungsflüsse des Versicherungsunternehmens modellhaft über einige oder viele Jahre in die Zukunft projizieren. Dafür haben sie geeignete Modelle und Annahmen für die verschiedenen Elemente der Aktiv- und der Passivseite der Versicherungsbilanz zu suchen und auch Annahmen über die Ausübung von Handlungsoptionen des Unternehmens, etwa über die Verwendung von Überschüssen, zu treffen. In der Gesamtheit spricht man hier von einem Unternehmensmodell.
Für die Modellierung der Passivseite der Bilanz eines Lebensversicherungsunternehmens werden zum Beispiel Annahmen über die Sterblichkeit oder die künftige Kostenentwicklung getroffen. Ein wichtiger Einflussfaktor im Modell ist dabei auch das Stornoverhalten der Versicherungsnehmer. Für die Projektionsrechnungen werden damit – neben vielem anderen – geeignete Stornoprognosen benötigt. Hierfür gibt es sogenannte klassische Stornomodelle, die Fragestellung eignet sich jedoch auch für den Einsatz von Methoden des maschinellen Lernens.
An guten Stornoprognosen ist im Übrigen auch der Vertrieb interessiert. Zur Stornoprävention möchte man dort in Erfahrung bringen, welche Kunden mit höherer Wahrscheinlichkeit demnächst ihren Vertrag kündigen werden. Zum anderen sind natürlich auch die möglichen Ursachen von Vertragskündigungen interessant für das Versicherungsunternehmen. Wirksame Steuerungsmöglichkeiten ergeben sich ja erst, wenn auch die Umstände, welche eine Kündigung wahrscheinlicher bzw. unwahrscheinlicher machen, verstanden wurden und somit beeinflusst werden können.
Bestandsverdichtung
Bei den oben angeführten Projektionsrechnungen unterscheiden wir zwischen deterministischen und stochastischen Projektionen. Bei einer deterministischen Projektion wird das gesamte Unternehmensmodell einmal über den Projektionszeitraum hochgerechnet. Bei einer stochastischen Projektion verwendet man mehrere (in der Regel viele2) Kapitalmarktpfade3 und rechnet das Unternehmensmodell für jeden einzelnen Kapitalmarktpfad hoch (Monte-Carlo-Simulation). Die umfangreichen Ergebnisse müssen dann geeignet aggregiert werden.
Stochastische Projektionsrechnungen benötigen gegenüber deterministischen Projektionen ein Vielfaches an Rechenzeit. In der Praxis führt das, auch beim Einsatz von leistungsstarker Hardware, bei einer einzelvertraglichen Hochrechnung häufig zu Laufzeiten von vielen Stunden.
Eine Möglichkeit, diesem Laufzeitproblem zu begegnen, ist die sogenannte Bestandsverdichtung. Dabei sucht man geeignete Verträge, die jeweils als Repräsentanten für eine Menge von Verträgen fungieren. Anstatt die Projektion mit allen Einzelverträgen durchzuführen, führt man diese nur mit den Repräsentanten durch. Jeder Repräsentant erhält dabei ein Gewicht, das in der Regel der Anzahl der von ihm repräsentierten Verträge entspricht.
In der Praxis ist dieses Konzept überraschend erfolgreich. Zwar liefert die Projektionsrechnung mit den Repräsentanten Abweichungen in den Ergebnissen gegenüber der Hochrechnung mit allen Einzelverträgen. Die Kunst liegt jedoch darin, die Repräsentanten geschickt zu wählen, so dass die resultierenden Abweichungen in den Ergebnissen sich in einem tolerierbaren Rahmen bewegen.4 Und die Verbesserungen in der Laufzeit sind häufig enorm. Rechnet man zum Beispiel anstelle von 1 Mio. Einzelverträgen nur mit 1 000 Repräsentanten, so verringert sich die Laufzeit ungefähr um den Faktor 1 000. Projektionsrechnungen, die etwa acht Stunden benötigen, sind damit in 30 Sekunden möglich.
Leider ist die Aufgabe, die richtigen Repräsentanten zu finden, nicht trivial und mit klassischen Verfahren in der Regel nicht effizient zu lösen. Zum Glück gibt es Verfahren des maschinellen Lernens, die hier Erfolg versprechen. Wir besprechen dieses Thema ausführlicher im Abschnitt 6.4.1.
Modellierung biometrischer Risiken
Die Quantifizierung des Risikos ist die Hauptaufgabe der Aktuare. Interne und externe Anforderungen in diesem Bereich sind in der Vergangenheit stetig gewachsen und werden dies aller Voraussicht nach auch in der Zukunft weiter tun.
Im Abschnitt 6.3.2 diskutieren wir einen Ansatz zur Berechnung des Solvency Capital Requirement (SCR) für Portfolios von Lebensversicherungsrisiken, basierend auf einem stochastischen Simulationsverfahren. Simulationsverfahren zur Risikobewertung arbeiten üblicherweise in zwei Schritten: Im ersten Schritt wird ein Reihe von Risiko-Szenarien bestimmt, die jeweils eigene Realisierungen der Hauptrisikotreiber (Kapitalmarktentwicklung, Storno, ...) bereitstellen. Im zweiten Schritt erfolgt die Neubewertung im jeweiligen Pfad, was theoretisch durch einen weiteren Simulationsschritt erfolgen müsste, für den wiederum viele neue Pfade generiert und durchgerechnet werden müssten.
Um dem Problem der verschachtelten Simulationen (nested simulations) zu begegnen, kommt beim im Abschnitt 6.3.2 betrachteten Ansatz ein Regressionsmodell zum Einsatz. Wir besprechen eine lineare Variante davon und deuten an, wie nichtlineare Verallgemeinerungen aussehen könnten.
Kfz-Telematik
Eine der umfassendsten neuen Produktinnovationen in der Kompositversicherung ist ohne Zweifel die zunehmende Verwendung von Echtzeitinformationen wie der Telematik in der Kfz-Versicherung. Das Konzept wirkt dabei simpel; es werden hochgranulare Bewegungsdaten gesammelt, entweder mit dem Smartphone des Nutzers oder über dedizierte Hardware, und nachgelagert ausgewertet. Aus kinematischen Informationen wie Beschleunigungsdaten schlieẞlich tarifierungsrelevante Merkmale zu extrahieren ist dabei allerdings nur eine stark verkürzte Aufgabe – neben dem Kerngeschäft gibt es auch gänzlich neue Wege der Echtzeit-Datenverarbeitung zu beschreiten – sodass die Methoden zur Erschlieẞung der in Telematik-Daten enthaltenen Informationen zum Einsatz kommen, von Clustering (beispielsweise zur Merkmalsextraktion) über Klassifikation (beispielsweise zur Triperkennung) bis hin zur klassischen Regression (beispielsweise zur Bestimmung von Telematik-Tarifmerkmalen) reichen. Das Thema wird für uns in erster Linie im Kapitel 6.4 relevant sein, weil an den Schnittpunkten zwischen Clustering und Dimensionsreduktion der Knackpunkt zur Nutzbarmachung der Daten liegt.
Weitere Anwendungen
Neben den oben genauer ausgeführten Use Cases gibt es zahlreiche weitere anspruchsvolle Aufgaben im Versicherungsbereich, bei denen Data-Science-Methoden mit Erfolg verwendet werden. Beispiele dafür sind:
-
– Die Reduktion des Fragenkatalogs zur Risikoprüfung in der Berufsunfähigkeitsversicherung. Weniger Fragen erhöhen letztlich die Akzeptanz und können Abschlussprozesse beschleunigen, woraus sich Wettbewerbsvorteile ergeben können.
- –
Die automatisierte Leistungsprüfung bei Schadenversicherungen, Berufsunfähigkeitsversicherungen etc. Ein Unterpunkt hierbei ist die Betrugserkennung mit Hilfe von Machine-Learning-Modellen.
- –
Automatisiert generierte Empfehlungen wie Robo-Advice-Beratungen im Rahmen von Vertragsabschlüssen (Kunden die diese Versicherung kauften, kauften auch...).
Wir werden einige dieser Themen im weiteren Verlauf des Buches streifen. Im Übrigen lieẞe sich die Liste der Anwendungsfälle weiter fortsetzen; einen Überblick geben verschiedene auf der Homepage der Deutschen Aktuarvereinigung verlinkte Papiere.5