Inteligencia actuarial con IA generativa – un marco ilustrado a través de los siniestros de Enfermedades Graves

TOP

Critical Illness, Disability

June 24, 2026 Wendy Low, Samuel Lim

Español

Muchos debates sobre la IA generativa en el sector de los seguros se centran en la tecnología. Sin embargo, la cuestión más interesante es quién está capacitado para integrarla en nuestro flujo de trabajo, y en este sentido los actuarios cuentan con una ventaja poco común. Esta disciplina ya prepara a sus profesionales para descomponer problemas complejos y ambiguos en componentes estructurados que puedan someterse a pruebas y validarse con rigor estadístico, haciendo hincapié en la explicabilidad y la gobernanza. Si a esto se suma un profundo conocimiento de la cadena de valor del sector asegurador – desde el diseño de productos y la fijación de precios hasta la suscripción, la gestión de siniestros, la gestión de capital y el análisis de la experiencia –, se obtienen precisamente las fortalezas necesarias para convertir modelos potentes en decisiones responsables que satisfagan tanto a los reguladores como a los clientes. En este sentido, la IA generativa complementa, en lugar de sustituir, la toma de decisiones humanas. Refuerza la capacidad del actuario para pensar de manera crítica, estructurar los problemas con claridad y aplicar un juicio sólido a gran escala.

En Gen Re, nuestro equipo inició este trabajo mientras desarrollaba una herramienta de clasificación de siniestros de Enfermedades Graves (EG) para respaldar el estudio de larga trayectoria «CI Data Insights» (también conocido como «Dread Disease Survey»). A través de esta iniciativa, nos dimos cuenta de que aplicar la IA generativa de forma eficaz requiere no solo tecnología, sino también un marco estructurado y basado en principios que refleje el razonamiento humano.

La clasificación de los siniestros de Enfermedades Graves ha supuesto durante mucho tiempo un reto en el trabajo analítico sobre estas enfermedades, ya que los datos brutos suelen consistir en descripciones de texto libre no estructuradas y las definiciones y criterios de cobertura de las enfermedades graves a menudo difieren entre sí. Clasificar con precisión los siniestros de Enfermedades Graves requiere una combinación matizada de precisión técnica, conocimientos médicos y un juicio profesional riguroso.

La envergadura de este trabajo también es considerable. Por ejemplo, el último informe publicado por Gen Re, «CI Data Insights Hong Kong 2019–2023» abarca más de 69 000 siniestros recopilados a lo largo de un periodo de cinco años para el mercado de Hong Kong. Utilizamos el problema de la clasificación de texto libre de los siniestros de EG para mostrar cómo un flujo de trabajo secuencial y multiagente puede emular la forma en que los actuarios desglosan y evalúan un siniestro.

Aunque el caso de uso de la clasificación de EG se presenta como ejemplo, los principios subyacentes van mucho más allá de este ámbito y ofrecen a los actuarios un marco repetible para diseñar soluciones basadas en IA que sean robustas, explicables y escalables.

De la información sin procesar al razonamiento estructurado: un ejemplo de siniestros de EG

Un error habitual es tratar la IA generativa como un oráculo omnisciente, es decir, alimentarla con el texto sin procesar de un siniestro y esperar una clasificación correcta de las enfermedades graves. Esta falta de orientación estructurada aumenta el riesgo de que el modelo sufra alucinaciones,¹ reduce la transparencia y hace que el razonamiento del modelo se desvíe de la lógica actuarial humana.

Para abordar este problema, dividimos el problema en una secuencia de pasos explícitos. Consideremos un escenario sencillo de reclamación:

Estado del siniestro: Aceptado
Nombre del producto: Cobertura adicional de Enfermedades Graves «Vida Feliz»
Sexo: Masculino
Edad en el momento del siniestro: 55
Descripción del siniestro sin procesar con abreviaturas:
Dx de STEMI ant agudo el 11/02/25
+ elev ST ECG V2‑5
+ Trop 12,8 ng/mL
s/p ICP ocl 100 % LAD
FE 38 %
H55 fumador HTA
Tipo de reclamación: Indemnización por EG con pago del 100 % del capital asegurado

Un gestor de siniestros suele convertir esta descripción en otra más comprensible. Por ejemplo:

+Diagnosticado con infarto agudo de miocardio anterior con elevación del segmento ST el 11/02/25
+El electrocardiograma mostró elevación del segmento ST en las derivaciones V2‑5, compatible con un infarto anterior
+Niveles elevados de troponina: 12,8 ng/mL
+Estado tras una intervención coronaria percutánea en la arteria descendente anterior izquierda por oclusión del 100 %
+Fracción de eyección tras el infarto de miocardio reducida al 38 %
+Hombre de 55 años, fumador, con hipertensión preexistente

A continuación, se seguirá un proceso de razonamiento estructurado basado en preguntas. Los pasos de este razonamiento pueden utilizarse para crear un flujo de trabajo secuencial basado en agentes que «guíe» a la IA para que imite los patrones de pensamiento actuarial. Cada agente lleva a cabo una tarea específica que constituye la solución a las preguntas planteadas.

Con el ejemplo de clasificación de siniestros de seguros de vida como referencia, podemos transformar las preguntas en pasos que se presentan de la siguiente manera:

	Proceso de razonamiento humano de la pregunta	Pasos
1	¿Qué afección médica describe este informe?	Transformar la descripción del siniestro en una frase en español fácilmente comprensible para el diagnóstico, las intervenciones quirúrgicas o la incapacidad
2	Dado que el siniestro ha sido aceptado, la afección debe corresponder a un evento de enfermedad grave cubierto por la cláusula adicional «Complementario EG Vida Feliz»	Obtenga una lista de las enfermedades graves cubiertas por el producto «Complementario EG Vida Feliz» y compare la descripción del siniestro con dicha lista para buscar la que más se ajuste
3	¿Qué definiciones de enfermedades graves se aplican? ¿Qué definiciones podrían corresponder de forma plausible a la afección descrita?	Compruebe que la correspondencia más cercana, en la práctica, cumpla la definición de enfermedad grave que figura en la documentación del producto «Complementario EG Vida Feliz»
4	¿Es esta reclamación algo realista? ¿Se trata de un caso inusual que justifique un análisis más detallado?	Analice la clasificación final de la enfermedad grave y compare el resto de información disponible, como el sexo, la edad en el momento del siniestro y el tipo de reclamación, para determinar su verosimilitud

Como ampliación del escenario de reclamación anterior, podemos diseñar un flujo de trabajo que amplíe estos cuatro pasos de razonamiento a cinco etapas operativas. La etapa final emite el resultado de la clasificación con una puntuación de confianza, tal y como se muestra en el siguiente diagrama:

Proceso de clasificación de siniestros de EG asistido por IA

Ahora contamos con un flujo de trabajo multiagente que proporciona un desglose estructurado que reduce las «alucinaciones», mejora la coherencia y aumenta la transparencia de una forma que resulta intuitiva y auditable a la vez. Esta arquitectura refleja la forma en que los actuarios y los gestores de siniestros abordan de manera natural la evaluación de la enfermedad grave, es decir, desglosando una tarea de juicio compleja en componentes claros.

Ofrece varias ventajas:

Reducción de las alucinaciones gracias a unos ámbitos de aplicación bien delimitados
Mejora de la auditabilidad al hacer explícito cada paso
Modularidad, lo que permite probar o mejorar cada agente de forma independiente
Trazabilidad intuitiva que muestra exactamente cómo se llegó a la conclusión
Cumplimiento de las expectativas actuariales y normativas en materia de explicabilidad

Este flujo de trabajo transforma la IA generativa de un «predictor de caja negra» en un socio que apoya la toma de decisiones de forma explicable, regulada y trazable.

Fiabilidad por diseño – evaluación y gobernanza de la IA generativa

La fiabilidad de la IA ha sido un tema central para los reguladores y los responsables políticos del sector financiero,² prestándose especial atención a cómo puede implementarse de manera estable y fiable. Aspectos como el sesgo, la equidad, la explicabilidad, la transparencia y la interpretabilidad son fundamentales a la hora de implementar soluciones de IA generativa. Sin embargo, la fiabilidad no debe considerarse una característica exclusiva del modelo. Se trata más bien de una propiedad de todo el flujo de trabajo en el que opera el modelo. Por lo tanto, para que una solución de IA generativa sea sólida, no solo se necesitan agentes bien diseñados, sino también una evaluación rigurosa, una gobernanza adecuada y una supervisión continua de todo el flujo de trabajo.

Una medida de seguridad importante es establecer un marco de revisión con participación humana. Aunque los flujos de trabajo basados en agentes pueden reducir los errores y mejorar la coherencia, la supervisión humana sigue siendo esencial.

Para implementar un marco de supervisión humana eficiente, se pueden establecer métricas predefinidas adecuadas al caso de uso, de modo que los casos complicados se deriven para la revisión humana. Dado que no existe una norma universal que especifique qué proporción de los resultados de la IA generativa debe ser revisada por humanos, este marco puede ayudar a las organizaciones a establecer umbrales adecuados a su tolerancia al riesgo y a sus necesidades operativas.

Por ejemplo, durante la fase de pruebas, se pueden evaluar las puntuaciones de confianza en un conjunto de datos de validación para determinar el nivel por debajo del cual los resultados deben señalarse para su revisión humana. También se pueden introducir reglas de revisión adicionales para terminología poco común, novedosa o especialmente sensible a los errores y sesgos. En el contexto de la clasificación de siniestros de EG, esto puede incluir clasificaciones de baja confianza, terminología médica desconocida, características contradictorias o ambiguas extraídas, y siniestros que se salen de las distribuciones de datos conocidas.

También pueden incorporarse métricas más determinísticas. Por ejemplo, en un entorno de clasificación, se puede supervisar la similitud coseno (una medida del ángulo entre dos vectores que capta la dirección independientemente de la magnitud, de modo que dos textos de longitudes muy diferentes pueden seguir registrándose como similares si sus distribuciones de características apuntan en la misma dirección) entre las representaciones de las expresiones y remitir para su revisión los casos que se sitúen por debajo de un umbral especificado. Con una metodología cuidadosa, la IA generativa respalda el criterio profesional, en lugar de sustituirlo.

Un segundo componente de la fiabilidad es la creación de un proceso de validación riguroso, respaldado por un «conjunto de datos de referencia» y otras métricas conocidas que no dependen de la IA generativa. En este contexto, un conjunto de datos de referencia se refiere a un conjunto seleccionado de datos de alta calidad, a menudo etiquetados manualmente, que contiene la «verdad fundamental» con la que se espera evaluar el sistema de IA generativa. Este conjunto de datos debe ser lo suficientemente amplio y diverso como para reflejar la variedad de escenarios prácticos con los que puede encontrarse el flujo de trabajo y debe conservarse para realizar pruebas continuas a medida que evoluciona la solución.

Aunque su creación es muy laboriosa, un conjunto de datos de referencia es fundamental para un flujo de trabajo de evaluación en múltiples niveles de un sistema de IA generativa. En el caso de la clasificación de siniestros de EG, el flujo de trabajo de evaluación en múltiples niveles puede incluir pruebas retrospectivas con el conjunto de datos de referencia elaborado a partir de descripciones históricas de siniestros, la comparación con métodos de procesamiento del lenguaje natural basados en representaciones, como los modelos de incrustación o los modelos codificadores, como BERT (Bidirectional Encoder Representations from Transformers), comprobaciones de razonabilidad estadística y de valores atípicos y pruebas adversarias que utilicen casos extremos poco frecuentes o descripciones intencionadamente engañosas.

Este enfoque de validación por capas refuerza la fiabilidad y la gobernanza, al garantizar que el rendimiento se evalúe desde múltiples ángulos, en lugar de juzgarse únicamente en función de la precisión general.

Otro mecanismo útil es utilizar un modelo de IA más potente para evaluar los resultados de otro modelo de IA. Un agente de IA generativa independiente puede actuar como capa de evaluación de los resultados producidos por un modelo más pequeño o menos costoso que se utiliza en producción. Esto puede resultar eficaz para guiar a modelos más potentes, dotados de capacidad de razonamiento, mediante indicaciones bien diseñadas, y así evaluar si un resultado es plausible, completo y se ajusta a las expectativas, al tiempo que se asigna un nivel de confianza a la evaluación. De este modo, se crea una forma de garantía de calidad basada en modelos que puede mejorar la escalabilidad sin depender por completo de la revisión manual. No obstante, la revisión humana sigue siendo necesaria cuando el agente de evaluación identifique contradicciones, incertidumbre o discrepancias con el resultado original.

La documentación transparente de las decisiones es un cuarto elemento. Una documentación clara de las indicaciones, la configuración de los modelos, los materiales de referencia, los métodos de validación, los criterios de escalado y las decisiones sobre el flujo de trabajo favorece la auditabilidad, la reproducibilidad y el cumplimiento de los requisitos de gobernanza interna. Además, está en consonancia con la importancia que la profesión actuarial otorga a la transparencia, la rendición de cuentas y el juicio profesional. En aplicaciones de seguros de alto riesgo, la documentación sirve como control para que otros puedan comprender cómo y por qué se llegó a una conclusión. Además, dado que el campo de la IA generativa sigue evolucionando rápidamente, dicha documentación es esencial para garantizar la eficacia de la mejora y el mantenimiento cuando se produzcan cambios que puedan afectar a la disponibilidad o al rendimiento de los modelos implementados.

Por último, la fiabilidad no solo depende de cómo se construya un flujo de trabajo, sino también de cómo se mantenga a lo largo del tiempo. Un proceso de actualización sencillo y bien gestionado favorece la fiabilidad continua. A medida que evolucionan los modelos, las indicaciones, las definiciones de productos y los documentos de origen, el flujo de trabajo debe poder actualizarse, volverse a probar y volverse a implementar de forma controlada con facilidad. Una arquitectura modular es especialmente valiosa para este fin, ya que permite mejorar los agentes o componentes individuales de forma independiente sin alterar todo el sistema. Esto permite a las organizaciones perfeccionar continuamente el rendimiento, al tiempo que preservan los estándares de gobernanza y mantienen la confianza en el proceso.

En conjunto, estas prácticas hacen que la IA generativa pase de ser una herramienta experimental para convertirse en una capacidad fiable que apoya la toma de decisiones. Al combinar la supervisión humana, la validación mediante conjuntos de datos de referencia, la evaluación basada en modelos, la documentación transparente y las vías controladas de actualización, los actuarios pueden diseñar flujos de trabajo de IA generativa eficaces, explicables, auditables y alineados con las expectativas de gestión de riesgos de la empresa.

Resumen

A medida que el panorama de la IA sigue evolucionando, aumenta la gama de tareas que la tecnología puede respaldar para mejorar la productividad. Las limitaciones que antes hacían que las organizaciones fueran cautelosas a la hora de adoptar la IA se están superando a medida que la tecnología madura.

La IA generativa puede aportar más valor al sector de los seguros si se diseña para razonar como los actuarios. Este artículo ha expuesto dos argumentos relacionados. En primer lugar, dividir una tarea compleja que requiere criterio en una secuencia de agentes especializados refleja la forma en que los actuarios desglosan y evalúan un problema, lo que reduce las «alucinaciones» y mejora la posibilidad de auditar. En segundo lugar, la fiabilidad es una propiedad de todo el flujo de trabajo y no solo del modelo, y se consigue mediante supervisión humana, validación con conjuntos de datos de referencia, evaluación basada en modelos, documentación transparente y actualizaciones controladas. Aunque se han ilustrado con la clasificación de siniestros de EG, estos principios proporcionan a los actuarios un marco repetible para crear soluciones basadas en IA que sean robustas, explicables y escalables, y los posicionan no como meros usuarios de estas herramientas, sino como las personas que las diseñan y gestionan.

Póngase hoy mismo en contacto con su representante de Gen Re para descubrir cómo podemos ayudarle a implementar soluciones basadas en IA en toda la cadena de valor del sector asegurador.