eBook - ePub

Actuarial Data Science

Name: Actuarial Data Science
Author: Martin Seehafer, Stefan Nörtemann, Jonas Offtermatt, Fabian Transchel, Axel Kiermaier, René Külheim, Wiltrud Weidner

Maschinelles Lernen in der Versicherung

Martin Seehafer, Stefan Nörtemann, Jonas Offtermatt, Fabian Transchel, Axel Kiermaier, René Külheim, Wiltrud Weidner

380 pages
German
ePUB (mobile friendly)
Available on iOS & Android

eBook - ePub

Actuarial Data Science

Maschinelles Lernen in der Versicherung

Martin Seehafer, Stefan Nörtemann, Jonas Offtermatt, Fabian Transchel, Axel Kiermaier, René Külheim, Wiltrud Weidner

Book details

Book preview

Table of contents

Citations

About This Book

Neben den klassischen Tätigkeitsfeldern der Versicherungsmathematik wie Produktentwicklung und Bilanzierung wird der praktisch tätige Aktuar zunehmend mit neuen Anforderungen aus IT-Automatisierung, Datenmanagement und weiteren spannenden Aufgaben aus den Bereichen Maschinelles Lernen/Künstliche Intelligenz betraut. Das vorliegende Buch bietet eine Einführung in Data-Science-Anwendungen in der Versicherungsbranche (= Actuarial Data Science). Es richtet sich an (werdende) Aktuare und allgemeiner an alle quantitativ im Finanz- und Versicherungsbereich Tätigen und Studenten, die sich einen Einblick in die eingesetzten Konzepte und Technologien verschaffen möchten. Neben den mathematisch-technischen Grundlagen werden auch mögliche Auswirkungen auf die Organisationsstruktur der Unternehmen sowie Fragen aus dem gesellschaftlichen Umfeld einschließlich Datenschutz ausführlich diskutiert.

Aufgrund der Wichtigkeit dieser Themen hat die Deutsche Aktuarvereinigung e.V. (DAV) entschieden, sie in das Programm für Aus- und Weiterbildung der Aktuarinnen und Aktuare zu integrieren. Die sieben Autoren dieses Buches sind allesamt Dozenten in diversen Lehrveranstaltungen der Deutschen Aktuar Akademie (DAA) im Themenfeld Actuarial Data Science.

Frequently asked questions

How do I cancel my subscription?

Simply head over to the account section in settings and click on “Cancel Subscription” - it’s as simple as that. After you cancel, your membership will stay active for the remainder of the time you’ve paid for. Learn more here.

Can/how do I download books?

At the moment all of our mobile-responsive ePub books are available to download via the app. Most of our PDFs are also available to download and we're working on making the final remaining ones downloadable now. Learn more here.

What is the difference between the pricing plans?

Both plans give you full access to the library and all of Perlego’s features. The only differences are the price and subscription period: With the annual plan you’ll save around 30% compared to 12 months on the monthly plan.

What is Perlego?

We are an online textbook subscription service, where you can get access to an entire online library for less than the price of a single book per month. With over 1 million books across 1000+ topics, we’ve got you covered! Learn more here.

Do you support text-to-speech?

Look out for the read-aloud symbol on your next book to see if you can listen to it. The read-aloud tool reads text aloud for you, highlighting the text as it is being read. You can pause it, speed it up and slow it down. Learn more here.

Is Actuarial Data Science an online PDF/ePUB?

Yes, you can access Actuarial Data Science by Martin Seehafer, Stefan Nörtemann, Jonas Offtermatt, Fabian Transchel, Axel Kiermaier, René Külheim, Wiltrud Weidner in PDF and/or ePUB format, as well as other popular books in Business & Information Management. We have over one million books available in our catalogue for you to explore.

Information

Publisher

De Gruyter

Year

2021

ISBN

9783110659511

Edition

Topic

Business

Subtopic

Information Management

Index

Business

1 Actuarial Data Science – Business Cases

In den nachfolgenden Kapiteln werden wir Methoden, Verfahren und Prozesse im Themenfeld Data Science beschreiben, erläutern und analysieren. Dabei werden wir – stets mit einem Blick auf das aktuarielle Umfeld – ebenso auf die technischen Möglichkeiten und Herausforderungen wie auch die mathematischen Verfahren des maschinellen Lernens eingehen.

Bevor wir uns inhaltlich genauer mit Data Science Themen beschäftigen, geben wir in diesem Kapitel einen kurzen Überblick über beispielhafte Anwendungen, sogenannte Use Cases. In den nachfolgenden Kapiteln werden wir auf diese zurückkommen und die vorgestellten Verfahren u.a. anhand dieser Use Cases erläutern.¹

Stornoprognose

In den Risikomanagement-Abteilungen von Versicherungsunternehmen beschäftigen sich Aktuarinnen und Aktuare mit allen Risiken, denen das jeweilige Unternehmen ausgesetzt ist, und versuchen, diese zu modellieren und zu quantifizieren. Im Rahmen des sogenannten Asset-Liability-Managements oder im Kontext von Solvency II führen sie Rechnungen durch, bei denen sie Finanzkennzahlen und Zahlungsflüsse des Versicherungsunternehmens modellhaft über einige oder viele Jahre in die Zukunft projizieren. Dafür haben sie geeignete Modelle und Annahmen für die verschiedenen Elemente der Aktiv- und der Passivseite der Versicherungsbilanz zu suchen und auch Annahmen über die Ausübung von Handlungsoptionen des Unternehmens, etwa über die Verwendung von Überschüssen, zu treffen. In der Gesamtheit spricht man hier von einem Unternehmensmodell.

Für die Modellierung der Passivseite der Bilanz eines Lebensversicherungsunternehmens werden zum Beispiel Annahmen über die Sterblichkeit oder die künftige Kostenentwicklung getroffen. Ein wichtiger Einflussfaktor im Modell ist dabei auch das Stornoverhalten der Versicherungsnehmer. Für die Projektionsrechnungen werden damit – neben vielem anderen – geeignete Stornoprognosen benötigt. Hierfür gibt es sogenannte klassische Stornomodelle, die Fragestellung eignet sich jedoch auch für den Einsatz von Methoden des maschinellen Lernens.

An guten Stornoprognosen ist im Übrigen auch der Vertrieb interessiert. Zur Stornoprävention möchte man dort in Erfahrung bringen, welche Kunden mit höherer Wahrscheinlichkeit demnächst ihren Vertrag kündigen werden. Zum anderen sind natürlich auch die möglichen Ursachen von Vertragskündigungen interessant für das Versicherungsunternehmen. Wirksame Steuerungsmöglichkeiten ergeben sich ja erst, wenn auch die Umstände, welche eine Kündigung wahrscheinlicher bzw. unwahrscheinlicher machen, verstanden wurden und somit beeinflusst werden können.

Bestandsverdichtung

Bei den oben angeführten Projektionsrechnungen unterscheiden wir zwischen deterministischen und stochastischen Projektionen. Bei einer deterministischen Projektion wird das gesamte Unternehmensmodell einmal über den Projektionszeitraum hochgerechnet. Bei einer stochastischen Projektion verwendet man mehrere (in der Regel viele²) Kapitalmarktpfade³ und rechnet das Unternehmensmodell für jeden einzelnen Kapitalmarktpfad hoch (Monte-Carlo-Simulation). Die umfangreichen Ergebnisse müssen dann geeignet aggregiert werden.

Stochastische Projektionsrechnungen benötigen gegenüber deterministischen Projektionen ein Vielfaches an Rechenzeit. In der Praxis führt das, auch beim Einsatz von leistungsstarker Hardware, bei einer einzelvertraglichen Hochrechnung häufig zu Laufzeiten von vielen Stunden.

Eine Möglichkeit, diesem Laufzeitproblem zu begegnen, ist die sogenannte Bestandsverdichtung. Dabei sucht man geeignete Verträge, die jeweils als Repräsentanten für eine Menge von Verträgen fungieren. Anstatt die Projektion mit allen Einzelverträgen durchzuführen, führt man diese nur mit den Repräsentanten durch. Jeder Repräsentant erhält dabei ein Gewicht, das in der Regel der Anzahl der von ihm repräsentierten Verträge entspricht.

In der Praxis ist dieses Konzept überraschend erfolgreich. Zwar liefert die Projektionsrechnung mit den Repräsentanten Abweichungen in den Ergebnissen gegenüber der Hochrechnung mit allen Einzelverträgen. Die Kunst liegt jedoch darin, die Repräsentanten geschickt zu wählen, so dass die resultierenden Abweichungen in den Ergebnissen sich in einem tolerierbaren Rahmen bewegen.⁴ Und die Verbesserungen in der Laufzeit sind häufig enorm. Rechnet man zum Beispiel anstelle von 1 Mio. Einzelverträgen nur mit 1 000 Repräsentanten, so verringert sich die Laufzeit ungefähr um den Faktor 1 000. Projektionsrechnungen, die etwa acht Stunden benötigen, sind damit in 30 Sekunden möglich.

Leider ist die Aufgabe, die richtigen Repräsentanten zu finden, nicht trivial und mit klassischen Verfahren in der Regel nicht effizient zu lösen. Zum Glück gibt es Verfahren des maschinellen Lernens, die hier Erfolg versprechen. Wir besprechen dieses Thema ausführlicher im Abschnitt 6.4.1.

Modellierung biometrischer Risiken

Die Quantifizierung des Risikos ist die Hauptaufgabe der Aktuare. Interne und externe Anforderungen in diesem Bereich sind in der Vergangenheit stetig gewachsen und werden dies aller Voraussicht nach auch in der Zukunft weiter tun.

Im Abschnitt 6.3.2 diskutieren wir einen Ansatz zur Berechnung des Solvency Capital Requirement (SCR) für Portfolios von Lebensversicherungsrisiken, basierend auf einem stochastischen Simulationsverfahren. Simulationsverfahren zur Risikobewertung arbeiten üblicherweise in zwei Schritten: Im ersten Schritt wird ein Reihe von Risiko-Szenarien bestimmt, die jeweils eigene Realisierungen der Hauptrisikotreiber (Kapitalmarktentwicklung, Storno, ...) bereitstellen. Im zweiten Schritt erfolgt die Neubewertung im jeweiligen Pfad, was theoretisch durch einen weiteren Simulationsschritt erfolgen müsste, für den wiederum viele neue Pfade generiert und durchgerechnet werden müssten.

Um dem Problem der verschachtelten Simulationen (nested simulations) zu begegnen, kommt beim im Abschnitt 6.3.2 betrachteten Ansatz ein Regressionsmodell zum Einsatz. Wir besprechen eine lineare Variante davon und deuten an, wie nichtlineare Verallgemeinerungen aussehen könnten.

Kfz-Telematik

Eine der umfassendsten neuen Produktinnovationen in der Kompositversicherung ist ohne Zweifel die zunehmende Verwendung von Echtzeitinformationen wie der Telematik in der Kfz-Versicherung. Das Konzept wirkt dabei simpel; es werden hochgranulare Bewegungsdaten gesammelt, entweder mit dem Smartphone des Nutzers oder über dedizierte Hardware, und nachgelagert ausgewertet. Aus kinematischen Informationen wie Beschleunigungsdaten schlieẞlich tarifierungsrelevante Merkmale zu extrahieren ist dabei allerdings nur eine stark verkürzte Aufgabe – neben dem Kerngeschäft gibt es auch gänzlich neue Wege der Echtzeit-Datenverarbeitung zu beschreiten – sodass die Methoden zur Erschlieẞung der in Telematik-Daten enthaltenen Informationen zum Einsatz kommen, von Clustering (beispielsweise zur Merkmalsextraktion) über Klassifikation (beispielsweise zur Triperkennung) bis hin zur klassischen Regression (beispielsweise zur Bestimmung von Telematik-Tarifmerkmalen) reichen. Das Thema wird für uns in erster Linie im Kapitel 6.4 relevant sein, weil an den Schnittpunkten zwischen Clustering und Dimensionsreduktion der Knackpunkt zur Nutzbarmachung der Daten liegt.

Weitere Anwendungen

Neben den oben genauer ausgeführten Use Cases gibt es zahlreiche weitere anspruchsvolle Aufgaben im Versicherungsbereich, bei denen Data-Science-Methoden mit Erfolg verwendet werden. Beispiele dafür sind:

– Die Reduktion des Fragenkatalogs zur Risikoprüfung in der Berufsunfähigkeitsversicherung. Weniger Fragen erhöhen letztlich die Akzeptanz und können Abschlussprozesse beschleunigen, woraus sich Wettbewerbsvorteile ergeben können.
–
Die automatisierte Leistungsprüfung bei Schadenversicherungen, Berufsunfähigkeitsversicherungen etc. Ein Unterpunkt hierbei ist die Betrugserkennung mit Hilfe von Machine-Learning-Modellen.
–
Automatisiert generierte Empfehlungen wie Robo-Advice-Beratungen im Rahmen von Vertragsabschlüssen (Kunden die diese Versicherung kauften, kauften auch...).

Wir werden einige dieser Themen im weiteren Verlauf des Buches streifen. Im Übrigen lieẞe sich die Liste der Anwendungsfälle weiter fortsetzen; einen Überblick geben verschiedene auf der Homepage der Deutschen Aktuarvereinigung verlinkte Papiere.⁵

2 Crashkurs in Data Mining Anwendungen

Bevor wir uns in den nachfolgenden Kapiteln ausführlich konkreten Methoden und Verfahren zur Bearbeitung der Use Cases aus Kapitel 1 (und mehr) zuwenden, möchten wir vorab die zentralen Begriffe im Umfeld Actuarial Data Science erläutern. Für ein Verständnis der folgenden Abschnitte ist es notwendig, einige Grundlagen parat zu haben. Dabei beschränken wir uns hier auf die zentralen Begriffe und Ideen und greifen viele Themen dann nochmals im Kapitel 8 auf. Wer bereits mit Buzzwords wie Data Mining, künstliche Intelligenz, maschinelles Lernen, Under-/Overfitting und Data Science vertraut ist, kann diesen Abschnitt gefahrlos überspringen.

Mit dem Begriff Data Science (zu Deutsch Datenwissenschaft, aber das sagt so niemand) wird häufig die Disziplin bezeichnet, die sich der Extraktion von Wissen aus Daten widmet. Wir wollen es noch etwas allgemeiner fassen und sprechen von der Wissenschaft, die sich ganz allgemein mit Daten beschäftigt. Das umfasst den gesamten Prozess des Umgangs mit Daten, beginnend mit der Erhebung und Erfassung, der Aufbereitung und Speicherung, der Verarbeitung und Auswertung bis hin zum Data Mining. Bei der Erhebung und Verarbeitung der Daten sind technische Fragen des Datenmanagements (siehe Kapitel 5) ebenso relevant wie die Prinzipien der Datenschutzbestimmungen (Kapitel 9).¹

Unter Data Mining verstehen wir die Gewinnung von Informationen aus Daten, jeweils Bezug nehmend auf eine spezifische Fragestellung. Die wörtliche Bedeutung von Data Mining ist zumindest irreführend (wenn nicht falsch), denn es werden keine Daten geschürft, sondern Informationen. Daher müsste es eigentlich Information Mining heiẞen, aber der Begriff Data Mining hat sich etabliert. Synonym spricht man manchmal auch von Data Analytics.

Da die spezifischen Fragestellungen für uns stets aktuarieller Natur sind oder allgemeiner das Prinzip Versicherung betreffen (siehe Kapitel 1), sprechen wir von Actuarial Data Science (kurz ADS). Actuarial Data Science beschäftigt sich also mit der Erhebung, Erfassung, Verarbeitung und Auswertung versicherungsspezifischer Daten unter einer aktuariellen Fragestellung.

Die Auswertung der Daten erfolgt dabei meist mit Methoden des maschinellen Lernens (daher die Erwähnung im zweiten Teil des Buchtitels), oder allgemeiner und populärer der künstlichen Intelligenz (KI). Der Begriff künstliche Intelligenz (engl. Artificial Intelligence; hier ist auch im Deutschen der englische Begriff gebräuchlich) bezeichnet den Versuch, menschenähnliche Entscheidungsstrukturen maschinell (in der Regel mit einer Software) nachzubilden. Konkret geht es darum, eine Maschine zu bauen, die eigenständig Aufgaben bearbeiten oder Probleme lösen kann. Als Geburtsstunde des Begriffs künstliche Intelligenz gilt gemeinhin das von John McCarthy organisierte Dartmouth Summer Research Project on Artificial Intelligence 1955 in New Hampshire.

Einige Jahre zuvor hatte sich Alan Turing bereits mit theoretischen Fragestellungen zu intelligenten Maschinen beschäftigt ([96]...

Citation styles for Actuarial Data Science

APA 6 Citation

Seehafer, M., Nörtemann, S., Offtermatt, J., Transchel, F., Kiermaier, A., Külheim, R., & Weidner, W. (2021). Actuarial Data Science (1st ed.). De Gruyter. Retrieved from https://www.perlego.com/book/2109919/actuarial-data-science-maschinelles-lernen-in-der-versicherung-pdf (Original work published 2021)

Chicago Citation

Seehafer, Martin, Stefan Nörtemann, Jonas Offtermatt, Fabian Transchel, Axel Kiermaier, René Külheim, and Wiltrud Weidner. (2021) 2021. Actuarial Data Science. 1st ed. De Gruyter. https://www.perlego.com/book/2109919/actuarial-data-science-maschinelles-lernen-in-der-versicherung-pdf.

Harvard Citation

Seehafer, M. et al. (2021) Actuarial Data Science. 1st edn. De Gruyter. Available at: https://www.perlego.com/book/2109919/actuarial-data-science-maschinelles-lernen-in-der-versicherung-pdf (Accessed: 15 October 2022).

MLA 7 Citation

Seehafer, Martin et al. Actuarial Data Science. 1st ed. De Gruyter, 2021. Web. 15 Oct. 2022.