Mirko von Haxthausen im Gespräch mit Heiko Faust, Leiter Versicherungen Deutschland, Implement Consulting Group Germany GmbH
BUaktuell: Herr Faust, gab es für Sie einen persönlichen Aha-Moment, in dem Ihnen plötzlich klar wurde, welches reale Potenzial generative künstliche Intelligenz (Gen‑KI) wirklich entfalten kann?
Heiko Faust: Ja – und um das einzuordnen, muss ich tatsächlich etwas ausholen. Mein erster ernsthafter Kontakt mit „KI in der Versicherung“ war (wie bei vielen) IBM Watson. Wir wollten damals in der BU‑Leistungsprüfung ansetzen: Muster in Akten erkennen, Prüfungsschritte beschleunigen, Aussagen aus Arztberichten konsistent extrahieren. Der Enthusiasmus war groß, die Ernüchterung kam ziemlich schnell mit der Datenrealität: zu wenig sauber strukturierte, gelabelte Daten, extrem viel Varianz in Dokumenten und Formulierungen – und dann die Grenzen der „klassischen“ Ansätze, die stark auf spezifisches Training angewiesen sind. Für BU‑Akten ist genau das ein Problem, weil es eben nicht nur um ein Dokument geht, sondern um heterogene Aktenpakete mit Scans, Nachträgen, widersprüchlichen Befunden und viel Kontext. Das war erst mal sehr ernüchternd, aber das Thema hat mich danach nie mehr losgelassen.
Der wirkliche Aha-Moment kam dann mit den ersten Large Language Models – Ende 2022, als ChatGPT plötzlich „massentauglich“ wurde. Das war nicht nur ein neues Tool, sondern gefühlt ein neuer Basistechnologie-Baustein: Plötzlich hatten wir eine Gen‑KI, die nicht nur erkennt, sondern in natürlicher Sprache strukturiert, zusammenfasst, vergleicht, erklärt – und damit genau in textlastigen Wissensprozessen einen Hebel bietet. Die BU ist genau so ein Prozess: textlastig, komplex, fachlich heikel – ideal für den Einsatz von KI als Co‑Pilot.
Meine persönliche Erkenntnis war dabei nicht „die KI ersetzt den Menschen“, sondern eher: Sie kann uns in wissensintensiven, dokumentengetriebenen Abläufen schneller und konsistenter machen, wenn wir sie richtig einbetten, also mit Quellen, klaren Leitplanken und sichtbarer menschlicher Entscheidung.
Was mich damals zusätzlich beeindruckt hat: Schon mit relativ einfachen Setups – also „Dokument rein, strukturierte Zusammenfassung raus“ – konnten Teams plötzlich ganz anders arbeiten. Man merkt sofort, ob man noch sucht oder schon bewertet. Und genau dieser Wechsel von „Akten wälzen“ hin zu „Fall verstehen und entscheiden“ ist für mich der Kern des Potenzials.
Zusätzlich kam dann noch die Diffusionsgeschwindigkeit dazu. Binnen Wochen/Monaten war klar, dass generative Assistenten in den Arbeitsalltag Einzug halten werden, in einer Geschwindigkeit, die man in regulierten Branchen sonst selten sieht.
BUaktuell: Sie beraten die Branche zum Einsatz von KI. Was begeistert Sie an dieser Aufgabe? Und welchen besonderen Herausforderungen begegnen Sie dabei?
Heiko Faust: Mich begeistert an der Aufgabe vor allem die Mischung aus „sehr praktisch“ und „sehr anspruchsvoll“. Praktisch, weil man in BU‑Prozessen relativ schnell echte Hebel sieht: Akten sind komplex, Texte lang, medizinische und berufskundliche Einschätzungen vielschichtig – und genau da kann KI als Co‑Pilot helfen, den roten Faden sichtbar zu machen, Wiederholungen zu reduzieren und Begründungen konsistenter aufzusetzen. Das ist nicht nur effizient, es verbessert auch die Nachvollziehbarkeit – intern, gegenüber Versicherten und im Zweifel auch vor Gericht. Und anspruchsvoll ist es, weil KI eben nicht „einfach IT“ ist. Gute Lösungen entstehen dort, wo Fachlichkeit, Technik und Recht/Datenschutz zusammenarbeiten. Wenn dieser Schulterschluss klappt, bekommt man Systeme hin, die produktiv und auditierbar sind – also nicht nur eine „Demo“, sondern etwas, das man verantworten kann.
Die Herausforderungen sind aus meiner Sicht menschlich, organisatorisch/technisch und regulatorisch. Die Reihenfolge ist kein Zufall: menschlich, weil KI Emotionen triggert – von „die Maschine nimmt mir meinen Job weg“ bis „super, dann löst KI jetzt alle Probleme“. Beides stimmt nicht. Erfolgreiche Häuser investieren sichtbar in Befähigung, definieren den Human-in-the-Loop, üben Zitier- und Belegdisziplin und setzen Leitplanken für Tonalität und Risiken. Gerade bei Gen‑KI muss man zudem ganz offen darüber sprechen, dass „flüssig formuliert“ nicht gleich „richtig“ ist. Das ist eine kulturelle Umstellung: Teams müssen lernen, Ergebnisse zu prüfen wie einen Entwurf – nicht wie eine Quelle.
Organisatorisch/technisch sind die Herausforderungen deshalb, weil viele Unternehmen ihre Dokumenten und Wissensinfrastruktur erst ertüchtigen müssen:
- stabile OCR (Optical Character Recognition),
- saubere Taxonomien,
- sichere Schnittstellen,
- Retrieval-Mechanismen (Verfahren, um gezielt Informationen aus Datenquellen abzurufen),
- Logging (systematisches Aufzeichnen von Informationen) und
- Betriebsprozesse.
Ohne diese Basis bleibt Gen‑KI ein gut gemachter Prototyp.
Zusätzlich verdichtet sich der Rahmen regulatorisch gerade deutlich: Der EU AI Act arbeitet mit risikobasierten Pflichten (u. a. Datenqualität, Transparenz, Logging, Human Oversight), und parallel bleibt das Thema IT‑Sicherheit / Resilienz im Fokus – in Deutschland historisch über VAIT (also die versicherungsaufsichtsrechtlichen Anforderungen an die IT bis 2025), inzwischen über DORA (den „Digital Operational Resilience Act“, eine EU‑Verordnung). Auch EIOPA (European Insurance and Occupational Pensions Authority) und BaFin (Bundesanstalt für Finanzdienstleistungsaufsicht) präzisieren Erwartungen an Governance, IT‑Sicherheit und Modellrisikomanagement. Wer Governance nicht mitdenkt, wird nicht skalieren oder skaliert mit unnötigem Risiko.
BUaktuell: Wenn Sie an kleinere und mittlere LV/BU‑Erstversicherer denken: Für welche Art von Problem lohnt sich ein KI‑Einstieg aus Ihrer Sicht zuerst und welche Art von Vorhaben würden Sie dort bewusst noch nicht anfassen?
Heiko Faust: Der beste Einstieg liegt dort, wo Text in Struktur verwandelt wird und der Mensch sichtbar die Entscheidung behält.
Für BU sehe ich drei Felder, die sich für kleinere und mittlere Häuser wirklich lohnen – weil der Nutzen hoch und das Risiko überschaubar ist.
- Dokumenten-Automatisierung und Fallzusammenfassungen
Hier geht es darum, eingehende Unterlagen zu erkennen, zu klassifizieren, Dubletten rauszunehmen, relevante medizinische Fakten zu extrahieren und daraus eine gut lesbare Fallübersicht mit Quellen zu bauen. In BU‑ähnlichen Setups sind 20 bis 40 % weniger Lese‑ / Strukturierzeit realistisch – insbesondere bei komplexen Akten (Psyche, Multimorbidität), wenn die Dokumentenpipeline sauber ist. Und man kann das sehr pragmatisch starten: erst die „Top 3‑Dokumenttypen“ (z. B. Arztbericht, Reha Bericht, Arbeitgeberauskunft), mit klaren Extraktionsfeldern und einer Zusammenfassung, die immer Belege enthält. Das ist schnell testbar und schafft Vertrauen. - Triaging und einfache Berufsklassifikation
Eine KI, die Fälle nach Komplexität vorsortiert und an Spezialistenteams lenkt, reduziert Liegezeiten und glättet Auslastungsspitzen – ohne dass man gleich in „Black-Box-Entscheidungen“ hineinrutscht. Das ist als Entscheidungsunterstützung gut vermittelbar und schnell messbar. - Generative Co‑Piloten fürs Schreiben
Hier geht es um Entwürfe für Anforderungsschreiben, Begründungen, Nachprüfungsmitteilungen – aber strikt im Human-in-the-Loop-Modell, mit Standardprompts, Tonalitätsleitplanken und verpflichtenden Quellenverweisen. Dann sieht man typischerweise deutliche Zeitgewinne bei Entwürfen und mehr Konsistenz in der Kommunikation, ohne fachliche Verantwortung abzugeben.
Bewusst nicht anfassen würde ich zu Beginn zwei Dinge:
- voll bzw. teilautomatisierte Leistungsentscheidungen in der BU. Das ist fachlich und rechtlich extrem heikel, und je nach Ausgestaltung kann das schnell in hochriskante Kategorien fallen – dann brauchst du ein deutlich schwereres Governance-Set‑up (Dokumentation, Monitoring, Human Oversight etc.).
- ambitionierte Prognosemodelle (Dauer von Einschränkungen, Return-to-Work, Reserven), bevor die Datenbasis steht. Die bringen Wert, aber nur, wenn longitudinale Verlaufsdaten wirklich belastbar sind und die Nutzung als Assistenz sauber geregelt ist. Für kleinere/mittlere Häuser ist die klügere Reihenfolge: erst Dokumente und Wissen beherrschen, dann Routing und Assistenz – alles andere baut darauf auf.
BUaktuell: An welcher Stelle bleiben KI‑Vorhaben in Leben und BU in der Realität am häufigsten stecken und woran erkennt man früh, dass ein Projekt zwar Aktivität erzeugt, aber nicht in Richtung Produktivbetrieb läuft?
Heiko Faust: Es gibt drei klassische Stolperstellen:
Erstens die berühmte „Pilotitis“: schöne Demos, die in einer Laborumgebung funktionieren, aber keinen Weg in die Produktionslandschaft finden. Man erkennt das früh daran, dass Integrationsfragen vertagt werden, keine klaren Abnahmekriterien existieren und echte „Goldfälle“ aus der Praxis im Test fehlen. Wenn ein Prototyp nur mit Einzeldokumenten glänzt, aber nicht mit kompletten Akten inklusive Scans, Faxen und widersprüchlichen Befunden umgehen kann, dann ist der Weg in die Realität faktisch verbaut. Ein weiteres Frühwarnsignal ist, wenn der Pilot nur „nice to have“ wirkt: Die Fachbereiche nutzen ihn selten im Alltag, weil er nicht in die Oberfläche integriert ist oder weil Ergebnisse nicht zitierbar sind. Dann entsteht Aktivität – aber keine Adoption.
Zweitens scheitern Vorhaben am Daten- und Wissensfundament: Ohne robuste Dokumentenpipelines, definierte Taxonomien, Rechte‑ / Rollenkonzepte und eine kuratierte Wissensbasis für Retrieval gestützte Antworten bleibt Gen‑KI anfällig: Halluzinationen, inkonsistente Ergebnisse, fehlende Zitierbarkeit. Ein Frühindikator ist fehlende Zitierdisziplin: Wenn Antworten keine Quellenverweise haben oder interne Richtlinien nicht verlässlich gefunden werden, ist das kein Produktionsniveau.
Drittens fehlen Governance und Metriken: Viele Projekte laufen als IT‑Experiment ohne fachliche Product Ownership, ohne Modellinventar, ohne Drift Monitoring und ohne klare KPIs (also Key Performance Indicators wie Bearbeitungszeit, Nacharbeit, First Time Right, Beschwerde‑ / Audit-Quoten). Spätestens wenn Recht, Datenschutz und Informationssicherheit erst kurz vor Go‑live ins Spiel kommen, ist klar: Das wird nicht fliegen. Der produktionsreife Pfad sieht anders aus: frühe Einbindung der zweiten Linie, definierte Human-in-the-Loop-Punkte, Protokollierung und klare Aussagen, welche Entscheidung beim Menschen bleibt.
BUaktuell: Welche organisatorischen und technischen Voraussetzungen müssen erfüllt sein, bevor ein KI‑Projekt produktiv gehen kann – unabhängig davon, wie gut das Modell selbst funktioniert?
Heiko Faust: Entscheidend ist die Kombination aus einem belastbaren Operating Model und einer soliden technischen Basis.
Organisatorisch braucht es eine klare Verantwortlichkeit: Ein fachlicher Product Owner verantwortet Nutzen, Qualität und Einbettung ins Tagesgeschäft; ein (fachlicher) Model Owner steht für Nachvollziehbarkeit ein; Data Steward, Engineering und Betrieb sichern Datenqualität, Integration und Stabilität, und der Human-in-the-Loop muss konkret definiert sein: Welche Vorschläge darf die KI abgeben, wo muss zwingend geprüft werden, wie sieht das Vier Augen Prinzip in der Einführungsphase aus? Genau diese Klarheit ist später auch regulatorisch ein Kernpunkt.
Technisch sind vier Punkte aus meiner Sicht nicht verhandelbar.
- Dokumentenstrom und Datenqualität
Post, E‑Mail, Portal – alles muss in einer Pipeline zusammenlaufen, die OCR‑Fehler robust abfängt, Layout Varianten erkennt und PII-Schutz (Personally Identifiable Information) etabliert. - Retrieval statt „freier“ Generierung
KI‑Antworten müssen aus freigegebenen Dokumenten (Retrieval) gespeist werden – mit Quellenlinks, idealerweise klickbar. - Integration und Protokollierung
KI‑Bausteine interagieren sauber über Events/APIs (Application Programming Interface, also eine entsprechende Schnittstelle) mit Fachverfahren; Schreibrechte sind begrenzt (Entwurf statt Final), und jede Interaktion wird revisionsfähig geloggt. - Machine Learning Operations (MLOps) und Sicherheit
Modellinventar, Versionierung, Monitoring / Drift-Erkennung und Red-Teaming (also ein systematischer Stresstest des Systems) gehören in den Regelbetrieb.
BUaktuell: Welche weiteren Rahmenbedingungen braucht ein KI‑Projekt, um erfolgreich im Produktivbetrieb etabliert zu werden?
Heiko Faust: Neben Operating Model, Technik und Governance braucht es vor allem drei Dinge: Sinn, Maß und Tempo.
Sinn heißt: ein klarer Business Case mit messbaren Zielen. In der Leistungsprüfung sind das typischerweise weniger Lese‑ / Strukturierzeit, weniger Nacharbeit, kürzere Liegezeiten und konsistentere Begründungen; im Underwriting eher höhere Straight Through Anteile – also Anteile, die vollständig automatisiert sind – und eine bessere „Time to Yes“ als Kennzahl für die Dauer des Entscheidungs‑, Prüf- bzw. Freigabeprozesses.
Maß bedeutet: mit überschaubaren, auditierbaren Use Cases starten und diese sauber skalieren – nicht den großen Wurf versprechen, sondern Wirkung in Monaten zeigen und lernen.
Und schließlich Tempo: eine Roadmap, die in acht- bis zwölfwöchigen Iterationen arbeitet, echte Fälle in den Test nimmt und nach jedem Schritt härtet, bevor ausgerollt wird. Das ist im Kern Change-Management und das ist oft der Engpass, nicht so sehr das Modell.
Wichtig ist dabei auch ein realistisches Erwartungsmanagement: Am Anfang ist ein Co‑Pilot oft „gut genug“, nicht perfekt. Entscheidend ist, dass er nachweislich hilft, dass Fehler transparent sind und dass das Team Feedback geben kann – dann wird er im Betrieb besser, statt im Pilot zu sterben.
Hinzu kommt die Lieferantensteuerung. Viele Häuser kombinieren Bausteine unterschiedlicher Anbieter (z. B. für Dokumenten-NLP, für Retrieval, Text-Co‑Pilot und ggf. Fraud Signals als Frühwarnzeichen für möglichen Betrug). Das kann super funktionieren, wenn Übergaben klar sind, Qualitätsmetriken vereinbart werden und Verantwortlichkeiten bei Fehlern explizit geregelt sind. Eine gute Praxis ist es, früh gemeinsame Abnahmekriterien zu definieren, Shadow Mode Phasen zu fahren, in denen ein System im Hintergrund mitläuft, und mit „Goldfällen“ der Fachbereiche zu testen. So entsteht Vertrauen – und ohne Vertrauen skaliert KI in der BU nicht.
BUaktuell: Welche Rolle spielt Ihrer Einschätzung nach generative KI mit Blick auf den demografischen Wandel in den Regulierungsabteilungen?
Heiko Faust: Eine sehr große. Viele BU‑Abteilungen stehen vor einem doppelten Engpass: Erfahrungsträger gehen in den nächsten Jahren in Rente, während der Nachwuchs nicht im gleichen Maß nachrückt. Das ist kein Bauchgefühl, das sieht man auch makrodemografisch sehr klar – die Ruhestandswelle ist real und groß. Ohne ein Gegensteuern wäre die Konsequenz längere Bearbeitungszeiten, Wissensverluste und ein steigender Druck durch Krankheitsbilder mit hoher Komplexität – insbesondere in den Bereichen Psyche und Multimorbidität.
Gen‑KI kann das nicht „wegzaubern“, aber sie kann helfen, den Effekt abzufedern und in Teilen umzukehren:
Erstens, indem sie Wissen konserviert und zugänglich macht: Ein Retrieval gestützter Assistent, der interne Richtlinien, Rechtsprechung und medizinische Leitfäden zitiert, reduziert die Abhängigkeit von persönlichem Erfahrungswissen und beschleunigt das Onboarding neuer Mitarbeitender.
Zweitens, indem sie die kognitive Last senkt: Fallzusammenfassungen, Vorschläge für rote Fäden und Textentwürfe schaffen mehr Zeit für das, was die Maschine niemandem abnimmt, die Würdigung im Einzelfall, die empathische Kommunikation und die verantwortliche Entscheidung.
Drittens ermöglicht Gen‑KI flexiblere Arbeitsmodelle. Wenn wesentliche Arbeitsschritte durch Co‑Piloten unterstützt werden, lassen sich Teilzeit‑, Remote- oder Wiedereinstiegsmodelle einfacher organisieren – ein Faktor, der angesichts des Arbeitsmarktes an Bedeutung gewinnt.
Und viertens stärkt Gen‑KI die Attraktivität des Berufsbilds: Arbeiten mit modernen Werkzeugen, die Routine reduzieren und Qualität sichtbar machen, spricht Nachwuchs an.
Für mich gehört die gezielte Nutzung von Gen‑KI daher zu einer ernsthaften Demografiestrategie in der Leistungsprüfung. Die Alternative wäre, in ein paar Jahren mit signifikant längeren Liegezeiten konfrontiert zu sein und Rückstände aufzubauen.
BUaktuell: Vor dem Hintergrund des Potenzials von KI: Wie wird die BU‑Leistungsregulierung im Jahre 2035 aussehen? Welche Visionen sollten in den Häusern aus Ihrer Sicht entstehen?
Heiko Faust: Ich glaube nicht, dass die BU Leistungsprüfung 2035 vollautomatisiert ist, aber sie wird deutlich professionalisierter sein. Ich erwarte so etwas wie End to End Klarheit über den Fall: Eingehende Dokumente werden unmittelbar strukturiert, irrelevantes Material wird früher aussortiert, entscheidungsrelevante medizinische und berufskundliche Fakten werden extrahiert, verlinkt und entlang einer Zeitachse zusammengeführt. Die prüfende Person sieht zu Beginn, was fehlt und was zählt. Genau dieses Zielbild sieht man im Markt, und es passt auch zu dem, was heute schon in Bausteinen produktiv ist.
Generative KI‑Assistenten schlagen (mit Quellen) nächste sinnvolle Schritte vor: welche Unterlagen fehlen, ob ein Gespräch mit dem Arbeitgeber sinnvoll ist, ob eine fachärztliche Stellungnahme den Kernpunkt klärt. Die Kommunikation nach außen wird einheitlicher und verständlicher, Begründungen konsistenter – und das nicht, weil die KI „entscheidet“, sondern weil sie bessere Vorarbeit leistet und Wissen verfügbar macht. Governance wird sichtbarer Teil der Arbeit: Jede KI‑Interaktion erzeugt auditfähige Protokolle, jede Begründung verweist auf Quellen, menschliche Entscheidungspunkte sind klar markiert. In Standardfällen wird die Zeit bis zur tragfähigen Einschätzung deutlich sinken; bei komplexen Fällen werden die Teams besser aufgestellt sein, weil Triaging und Workload Hinweise die Expertise gezielt dorthin lenkt, wo sie den größten Unterschied macht.
Ich rechne außerdem damit, dass vernetzbare Gesundheitsdaten (mit informierter Einwilligung) eine größere Rolle spielen – sei es über die elektronische Patientenakte (ePA) oder über standardisierte Austauschformate. Das beschleunigt nicht „die Entscheidung“, aber es beschleunigt den Weg zur Evidenz, also zu den relevanten Informationen.
Und noch ein Punkt, der oft unterschätzt wird: die Rückkopplung zwischen Leistung und Underwriting. Was man in der Leistungsprüfung über Tätigkeitskerne, Evidenzlücken oder typische Komorbiditätsmuster lernt, fließt systematisch in Risikofragen und Evidenzanforderungen zurück. Das macht das Gesamtsystem belastbarer.
BUaktuell: Wenn man sich als BU‑Abteilung dieser Vision nähern möchte: Was wären sinnvolle erste Schritte?
Heiko Faust: Ich würde mit einer ehrlichen Standortbestimmung beginnen, und zwar gemeinsam mit dem Fachbereich:
- Welche Aktenarten kosten heute die meiste Zeit?
- Wo entstehen die meisten Nachfragen und die meiste Nacharbeit?
- Welche Dokumentenquellen sind am schwierigsten zu verarbeiten?
- Parallel würde ich eine kleine interdisziplinäre Einheit aufsetzen (Leistungsprüfung, Medizin, Berufskunde, Data / Engineering, Recht / Datenschutz), die mit einem klaren Mandat zwei bis drei Quick Wins aufsetzt und in ein paar Monaten messbare Wirkung zeigt.
In der Praxis sind das meistens: Dokumenten Automatisierung mit fallbezogenen Zusammenfassungen, Triaging / Komplexitätsrouting und ein Co‑Pilot für die Korrespondenz mit Human-in-the-Loop. Jede Antwort der KI trägt eine Quelle, jeder Entwurf bleibt von der prüfenden Person freizuzeichnen. So entsteht Nutzen ohne Risikoüberhang.
Während diese Bausteine wirken, bauen Sie das Fundament für den nächsten Schritt: eine kuratierte Wissensbasis mit Richtlinien, Urteilen und medizinischen Leitfäden, die über Retrieval Augmented Generation erschlossen wird.
Beginnen können Sie mit einem eng umrissenen Themenfeld (etwa Anerkenntnis bei depressiven Störungen), und etablieren Sie Zitier und Begründungsstandards, die später ausgerollt werden können.
Parallel sollten Sie die Governance „auf Linie“ bringen:
- Rollen,
- Protokolle,
- Metriken,
- Drift Monitoring und
- Lieferantensteuerung.
Und schließlich lohnt sich schon früh die Rückkopplung ins Neugeschäft: Was die Leistung zum Tätigkeitsabgleich, zu typischen Evidenzlücken und zu wirkungsvollen Nachfragen lernt, hilft dem Underwriting – sei es über präzisere Berufsklassifikation, reflexive Fragebäume oder eine intelligentere Evidenz Orchestrierung. Wenn Sie so vorgehen, also klein starten, nutzenorientiert iterieren, Governance ernst nehmen und Rückkopplung etablieren, dann nähern Sie sich der Vision mit jedem Monat.
Und das Wichtigste: Die Mannschaft wird mitgenommen, weil sie die Wirkung sieht und die Verantwortung behält.
BUaktuell: Herr Faust, wir danken Ihnen für dieses Gespräch!