Actuarial Data Science
eBook - ePub

Actuarial Data Science

Maschinelles Lernen in der Versicherung

  1. 380 Seiten
  2. German
  3. ePUB (handyfreundlich)
  4. Über iOS und Android verfügbar
eBook - ePub

Über dieses Buch

Neben den klassischen Tätigkeitsfeldern der Versicherungsmathematik wie Produktentwicklung und Bilanzierung wird der praktisch tätige Aktuar zunehmend mit neuen Anforderungen aus IT-Automatisierung, Datenmanagement und weiteren spannenden Aufgaben aus den Bereichen Maschinelles Lernen/Künstliche Intelligenz betraut. Das vorliegende Buch bietet eine Einführung in Data-Science-Anwendungen in der Versicherungsbranche (= Actuarial Data Science). Es richtet sich an (werdende) Aktuare und allgemeiner an alle quantitativ im Finanz- und Versicherungsbereich Tätigen und Studenten, die sich einen Einblick in die eingesetzten Konzepte und Technologien verschaffen möchten. Neben den mathematisch-technischen Grundlagen werden auch mögliche Auswirkungen auf die Organisationsstruktur der Unternehmen sowie Fragen aus dem gesellschaftlichen Umfeld einschließlich Datenschutz ausführlich diskutiert.

Aufgrund der Wichtigkeit dieser Themen hat die Deutsche Aktuarvereinigung e.V. (DAV) entschieden, sie in das Programm für Aus- und Weiterbildung der Aktuarinnen und Aktuare zu integrieren. Die sieben Autoren dieses Buches sind allesamt Dozenten in diversen Lehrveranstaltungen der Deutschen Aktuar Akademie (DAA) im Themenfeld Actuarial Data Science.

Häufig gestellte Fragen

Ja, du kannst dein Abo jederzeit über den Tab Abo in deinen Kontoeinstellungen auf der Perlego-Website kündigen. Dein Abo bleibt bis zum Ende deines aktuellen Abrechnungszeitraums aktiv. Erfahre, wie du dein Abo kündigen kannst.
Derzeit stehen all unsere auf mobile Endgeräte reagierenden ePub-Bücher zum Download über die App zur Verfügung. Die meisten unserer PDFs stehen ebenfalls zum Download bereit; wir arbeiten daran, auch die übrigen PDFs zum Download anzubieten, bei denen dies aktuell noch nicht möglich ist. Weitere Informationen hier.
Perlego bietet zwei Pläne an: Elementar and Erweitert
  • Elementar ist ideal für Lernende und Interessierte, die gerne eine Vielzahl von Themen erkunden. Greife auf die Elementar-Bibliothek mit über 800.000 professionellen Titeln und Bestsellern aus den Bereichen Wirtschaft, Persönlichkeitsentwicklung und Geisteswissenschaften zu. Mit unbegrenzter Lesezeit und Standard-Vorlesefunktion.
  • Erweitert: Perfekt für Fortgeschrittene Studenten und Akademiker, die uneingeschränkten Zugriff benötigen. Schalte über 1,4 Mio. Bücher in Hunderten von Fachgebieten frei. Der Erweitert-Plan enthält außerdem fortgeschrittene Funktionen wie Premium Read Aloud und Research Assistant.
Beide Pläne können monatlich, alle 4 Monate oder jährlich abgerechnet werden.
Wir sind ein Online-Abodienst für Lehrbücher, bei dem du für weniger als den Preis eines einzelnen Buches pro Monat Zugang zu einer ganzen Online-Bibliothek erhältst. Mit über 1 Million Büchern zu über 1.000 verschiedenen Themen haben wir bestimmt alles, was du brauchst! Weitere Informationen hier.
Achte auf das Symbol zum Vorlesen in deinem nächsten Buch, um zu sehen, ob du es dir auch anhören kannst. Bei diesem Tool wird dir Text laut vorgelesen, wobei der Text beim Vorlesen auch grafisch hervorgehoben wird. Du kannst das Vorlesen jederzeit anhalten, beschleunigen und verlangsamen. Weitere Informationen hier.
Ja! Du kannst die Perlego-App sowohl auf iOS- als auch auf Android-Geräten verwenden, um jederzeit und überall zu lesen – sogar offline. Perfekt für den Weg zur Arbeit oder wenn du unterwegs bist.
Bitte beachte, dass wir keine Geräte unterstützen können, die mit iOS 13 oder Android 7 oder früheren Versionen laufen. Lerne mehr über die Nutzung der App.
Ja, du hast Zugang zu Actuarial Data Science von Martin Seehafer,Stefan Nörtemann,Jonas Offtermatt,Fabian Transchel,Axel Kiermaier,René Külheim,Wiltrud Weidner im PDF- und/oder ePub-Format sowie zu anderen beliebten Büchern aus Betriebswirtschaft & Statistik für Volks- & Betriebswirtschaft. Aus unserem Katalog stehen dir über 1 Million Bücher zur Verfügung.

1Actuarial Data Science – Business Cases

In den nachfolgenden Kapiteln werden wir Methoden, Verfahren und Prozesse im Themenfeld Data Science beschreiben, erläutern und analysieren. Dabei werden wir – stets mit einem Blick auf das aktuarielle Umfeld – ebenso auf die technischen Möglichkeiten und Herausforderungen wie auch die mathematischen Verfahren des maschinellen Lernens eingehen.
Bevor wir uns inhaltlich genauer mit Data Science Themen beschäftigen, geben wir in diesem Kapitel einen kurzen Überblick über beispielhafte Anwendungen, sogenannte Use Cases. In den nachfolgenden Kapiteln werden wir auf diese zurückkommen und die vorgestellten Verfahren u.a. anhand dieser Use Cases erläutern.1

Stornoprognose

In den Risikomanagement-Abteilungen von Versicherungsunternehmen beschäftigen sich Aktuarinnen und Aktuare mit allen Risiken, denen das jeweilige Unternehmen ausgesetzt ist, und versuchen, diese zu modellieren und zu quantifizieren. Im Rahmen des sogenannten Asset-Liability-Managements oder im Kontext von Solvency II führen sie Rechnungen durch, bei denen sie Finanzkennzahlen und Zahlungsflüsse des Versicherungsunternehmens modellhaft über einige oder viele Jahre in die Zukunft projizieren. Dafür haben sie geeignete Modelle und Annahmen für die verschiedenen Elemente der Aktiv- und der Passivseite der Versicherungsbilanz zu suchen und auch Annahmen über die Ausübung von Handlungsoptionen des Unternehmens, etwa über die Verwendung von Überschüssen, zu treffen. In der Gesamtheit spricht man hier von einem Unternehmensmodell.
Für die Modellierung der Passivseite der Bilanz eines Lebensversicherungsunternehmens werden zum Beispiel Annahmen über die Sterblichkeit oder die künftige Kostenentwicklung getroffen. Ein wichtiger Einflussfaktor im Modell ist dabei auch das Stornoverhalten der Versicherungsnehmer. Für die Projektionsrechnungen werden damit – neben vielem anderen – geeignete Stornoprognosen benötigt. Hierfür gibt es sogenannte klassische Stornomodelle, die Fragestellung eignet sich jedoch auch für den Einsatz von Methoden des maschinellen Lernens.
An guten Stornoprognosen ist im Übrigen auch der Vertrieb interessiert. Zur Stornoprävention möchte man dort in Erfahrung bringen, welche Kunden mit höherer Wahrscheinlichkeit demnächst ihren Vertrag kündigen werden. Zum anderen sind natürlich auch die möglichen Ursachen von Vertragskündigungen interessant für das Versicherungsunternehmen. Wirksame Steuerungsmöglichkeiten ergeben sich ja erst, wenn auch die Umstände, welche eine Kündigung wahrscheinlicher bzw. unwahrscheinlicher machen, verstanden wurden und somit beeinflusst werden können.

Bestandsverdichtung

Bei den oben angeführten Projektionsrechnungen unterscheiden wir zwischen deterministischen und stochastischen Projektionen. Bei einer deterministischen Projektion wird das gesamte Unternehmensmodell einmal über den Projektionszeitraum hochgerechnet. Bei einer stochastischen Projektion verwendet man mehrere (in der Regel viele2) Kapitalmarktpfade3 und rechnet das Unternehmensmodell für jeden einzelnen Kapitalmarktpfad hoch (Monte-Carlo-Simulation). Die umfangreichen Ergebnisse müssen dann geeignet aggregiert werden.
Stochastische Projektionsrechnungen benötigen gegenüber deterministischen Projektionen ein Vielfaches an Rechenzeit. In der Praxis führt das, auch beim Einsatz von leistungsstarker Hardware, bei einer einzelvertraglichen Hochrechnung häufig zu Laufzeiten von vielen Stunden.
Eine Möglichkeit, diesem Laufzeitproblem zu begegnen, ist die sogenannte Bestandsverdichtung. Dabei sucht man geeignete Verträge, die jeweils als Repräsentanten für eine Menge von Verträgen fungieren. Anstatt die Projektion mit allen Einzelverträgen durchzuführen, führt man diese nur mit den Repräsentanten durch. Jeder Repräsentant erhält dabei ein Gewicht, das in der Regel der Anzahl der von ihm repräsentierten Verträge entspricht.
In der Praxis ist dieses Konzept überraschend erfolgreich. Zwar liefert die Projektionsrechnung mit den Repräsentanten Abweichungen in den Ergebnissen gegenüber der Hochrechnung mit allen Einzelverträgen. Die Kunst liegt jedoch darin, die Repräsentanten geschickt zu wählen, so dass die resultierenden Abweichungen in den Ergebnissen sich in einem tolerierbaren Rahmen bewegen.4 Und die Verbesserungen in der Laufzeit sind häufig enorm. Rechnet man zum Beispiel anstelle von 1 Mio. Einzelverträgen nur mit 1 000 Repräsentanten, so verringert sich die Laufzeit ungefähr um den Faktor 1 000. Projektionsrechnungen, die etwa acht Stunden benötigen, sind damit in 30 Sekunden möglich.
Leider ist die Aufgabe, die richtigen Repräsentanten zu finden, nicht trivial und mit klassischen Verfahren in der Regel nicht effizient zu lösen. Zum Glück gibt es Verfahren des maschinellen Lernens, die hier Erfolg versprechen. Wir besprechen dieses Thema ausführlicher im Abschnitt 6.4.1.

Modellierung biometrischer Risiken

Die Quantifizierung des Risikos ist die Hauptaufgabe der Aktuare. Interne und externe Anforderungen in diesem Bereich sind in der Vergangenheit stetig gewachsen und werden dies aller Voraussicht nach auch in der Zukunft weiter tun.
Im Abschnitt 6.3.2 diskutieren wir einen Ansatz zur Berechnung des Solvency Capital Requirement (SCR) für Portfolios von Lebensversicherungsrisiken, basierend auf einem stochastischen Simulationsverfahren. Simulationsverfahren zur Risikobewertung arbeiten üblicherweise in zwei Schritten: Im ersten Schritt wird ein Reihe von Risiko-Szenarien bestimmt, die jeweils eigene Realisierungen der Hauptrisikotreiber (Kapitalmarktentwicklung, Storno, ...) bereitstellen. Im zweiten Schritt erfolgt die Neubewertung im jeweiligen Pfad, was theoretisch durch einen weiteren Simulationsschritt erfolgen müsste, für den wiederum viele neue Pfade generiert und durchgerechnet werden müssten.
Um dem Problem der verschachtelten Simulationen (nested simulations) zu begegnen, kommt beim im Abschnitt 6.3.2 betrachteten Ansatz ein Regressionsmodell zum Einsatz. Wir besprechen eine lineare Variante davon und deuten an, wie nichtlineare Verallgemeinerungen aussehen könnten.

Kfz-Telematik

Eine der umfassendsten neuen Produktinnovationen in der Kompositversicherung ist ohne Zweifel die zunehmende Verwendung von Echtzeitinformationen wie der Telematik in der Kfz-Versicherung. Das Konzept wirkt dabei simpel; es werden hochgranulare Bewegungsdaten gesammelt, entweder mit dem Smartphone des Nutzers oder über dedizierte Hardware, und nachgelagert ausgewertet. Aus kinematischen Informationen wie Beschleunigungsdaten schlieẞlich tarifierungsrelevante Merkmale zu extrahieren ist dabei allerdings nur eine stark verkürzte Aufgabe – neben dem Kerngeschäft gibt es auch gänzlich neue Wege der Echtzeit-Datenverarbeitung zu beschreiten – sodass die Methoden zur Erschlieẞung der in Telematik-Daten enthaltenen Informationen zum Einsatz kommen, von Clustering (beispielsweise zur Merkmalsextraktion) über Klassifikation (beispielsweise zur Triperkennung) bis hin zur klassischen Regression (beispielsweise zur Bestimmung von Telematik-Tarifmerkmalen) reichen. Das Thema wird für uns in erster Linie im Kapitel 6.4 relevant sein, weil an den Schnittpunkten zwischen Clustering und Dimensionsreduktion der Knackpunkt zur Nutzbarmachung der Daten liegt.

Weitere Anwendungen

Neben den oben genauer ausgeführten Use Cases gibt es zahlreiche weitere anspruchsvolle Aufgaben im Versicherungsbereich, bei denen Data-Science-Methoden mit Erfolg verwendet werden. Beispiele dafür sind:
  • – Die Reduktion des Fragenkatalogs zur Risikoprüfung in der Berufsunfähigkeitsversicherung. Weniger Fragen erhöhen letztlich die Akzeptanz und können Abschlussprozesse beschleunigen, woraus sich Wettbewerbsvorteile ergeben können.
  • Die automatisierte Leistungsprüfung bei Schadenversicherungen, Berufsunfähigkeitsversicherungen etc. Ein Unterpunkt hierbei ist die Betrugserkennung mit Hilfe von Machine-Learning-Modellen.
  • Automatisiert generierte Empfehlungen wie Robo-Advice-Beratungen im Rahmen von Vertragsabschlüssen (Kunden die diese Versicherung kauften, kauften auch...).
Wir werden einige dieser Themen im weiteren Verlauf des Buches streifen. Im Übrigen lieẞe sich die Liste der Anwendungsfälle weiter fortsetzen; einen Überblick geben verschiedene auf der Homepage der Deutschen Aktuarvereinigung verlinkte Papiere.5

2 Crashkurs in Data Mining Anwendungen

Bevor wir uns in den nachfolgenden Kapiteln ausführlich konkreten Methoden und Verfahren zur Bearbeitung der Use Cases aus Kapitel 1 (und mehr) zuwenden, möchten wir vorab die zentralen Begriffe im Umfeld Actuarial Data Science erläutern. Für ein Verständnis der folgenden Abschnitte ist es notwendig, einige Grundlagen parat zu haben. Dabei beschränken wir uns hier auf die zentralen Begriffe und Ideen und greifen viele Themen dann nochmals im Kapitel 8 auf. Wer bereits mit Buzzwords wie Data Mining, künstliche Intelligenz, maschinelles Lernen, Under-/Overfitting und Data Science vertraut ist, kann diesen Abschnitt gefahrlos überspringen.
Mit dem Begriff Data Science (zu Deutsch Datenwissenschaft, aber das sagt so niemand) wird häufig die Disziplin bezeichnet, die sich der Extraktion von Wissen aus Daten widmet. Wir wollen es noch etwas allgemeiner fassen und sprechen von der Wissenschaft, die sich ganz allgemein mit Daten beschäftigt. Das umfasst den gesamten Prozess des Umgangs mit Daten, beginnend mit der Erhebung und Erfassung, der Aufbereitung und Speicherung, der Verarbeitung und Auswertung bis hin zum Data Mining. Bei der Erhebung und Verarbeitung der Daten sind technische Fragen des Datenmanagements (siehe Kapitel 5) ebenso relevant wie die Prinzipien der Datenschutzbestimmungen (Kapitel 9).1
Unter Data Mining verstehen wir die Gewinnung von Informationen aus Daten, jeweils Bezug nehmend auf eine spezifische Fragestellung. Die wörtliche Bedeutung von Data Mining ist zumindest irreführend (wenn nicht falsch), denn es werden keine Daten geschürft, sondern Informationen. Daher müsste es eigentlich Information Mining heiẞen, aber der Begriff Data Mining hat sich etabliert. Synonym spricht man manchmal auch von Data Analytics.
Da die spezifischen Fragestellungen für uns stets aktuarieller Natur sind oder allgemeiner das Prinzip Versicherung betreffen (siehe Kapitel 1), sprechen wir von Actuarial Data Science (kurz ADS). Actuarial Data Science beschäftigt sich also mit der Erhebung, Erfassung, Verarbeitung und Auswertung versicherungsspezifischer Daten unter einer aktuariellen Fragestellung.
Die Auswertung der Daten erfolgt dabei meist mit Methoden des maschinellen Lernens (daher die Erwähnung im zweiten Teil des Buchtitels), oder allgemeiner und populärer der künstlichen Intelligenz (KI). Der Begriff künstliche Intelligenz (engl. Artificial Intelligence; hier ist auch im Deutschen der englische Begriff gebräuchlich) bezeichnet den Versuch, menschenähnliche Entscheidungsstrukturen maschinell (in der Regel mit einer Software) nachzubilden. Konkret geht es darum, eine Maschine zu bauen, die eigenständig Aufgaben bearbeiten oder Probleme lösen kann. Als Geburtsstunde des Begriffs künstliche Intelligenz gilt gemeinhin das von John McCarthy organisierte Dartmouth Summer Research Project on Artificial Intelligence 1955 in New Hampshire.
Einige Jahre zuvor hatte sich Alan Turing bereits mit theoretischen Fragestellungen zu intelligenten Maschinen beschäftigt ([96]...

Inhaltsverzeichnis

  1. Title Page
  2. Copyright
  3. Contents
  4. 1 Actuarial Data Science – Business Cases
  5. 2 Crashkurs in Data Mining Anwendungen
  6. 3 Neue Versicherungsprodukte
  7. 4 Tools, Sprachen, Frameworks
  8. 5 Informationstechnologie
  9. 6 Mathematische Verfahren
  10. 7 Korrelation und kausale Inferenz
  11. 8 Data Mining
  12. 9 Gesellschaftliches Umfeld
  13. A Appendix
  14. Nachwort & Danksagungen
  15. Stichwortverzeichnis