Cómo definir el alcance del modelado de un modelo interno de riesgo crediticio

atravesando una profunda transformación impulsada por el progreso tecnológico. Estos cambios afectan a todos los sectores, especialmente al sector bancario. Los profesionales de datos deben adaptarse rápidamente para ser más eficientes, productivos y competitivos.

Para profesionales experimentados con bases sólidas en matemáticas, estadística y práctica operativa, esta transición puede ser natural. Sin embargo, puede resultar más desafiante para los principiantes que aún no dominan por completo estas habilidades fundamentales.

En el campo del riesgo crediticio, desarrollar estas habilidades requiere una comprensión clara de las exposiciones bancarias y los mecanismos utilizados para gestionar los riesgos asociados.

Mis próximos artículos se centrarán principalmente en la gestión del riesgo crediticio dentro de un marco regulatorio. El Banco Central Europeo (BCE) permite a los bancos utilizar modelos internos para evaluar el riesgo crediticio de sus diferentes exposiciones. Estas exposiciones pueden incluir préstamos concedidos a empresas para financiar proyectos a largo plazo o préstamos concedidos a hogares para financiar proyectos inmobiliarios.

Estos modelos tienen como objetivo estimar varios parámetros clave:

PD (Probabilidad de Incumplimiento): la probabilidad de que un prestatario no pueda cumplir con su obligación de pago. EAD (Exposición en caso de incumplimiento): el monto de la exposición en el momento del incumplimiento. LGD (Loss Given Default): es la gravedad de la pérdida en caso de incumplimiento.

Por tanto, podemos distinguir entre modelos PD, modelos EAD y modelos LGD. En esta serie, me centraré principalmente en los modelos PD. Estos modelos se utilizan para asignar calificaciones a los prestatarios y contribuir al cálculo de los requisitos de capital regulatorio, que protegen a los bancos contra pérdidas inesperadas.

En este primer artículo, me centraré en definir y construir el alcance del modelado.

Definición de defecto

La construcción de modelos de datos requiere una comprensión clara del objetivo del modelo y una definición precisa de incumplimiento. Evaluar la probabilidad de incumplimiento de una contraparte implica observar la transición de un estado saludable a un estado de incumplimiento en un horizonte determinado h. En lo que sigue, asumiremos que este horizonte se fija en un año (h = 1).

La definición de incumplimiento se armonizó y se sometió a supervisión regulatoria después de la crisis financiera de 2008. El objetivo era establecer una definición estandarizada aplicable a todas las instituciones bancarias.

Esta definición se basa en varios criterios, entre ellos:

un deterioro significativo de la situación financiera de la contraparte, la existencia de importes vencidos, situaciones de indulgencia, efectos de contagio dentro de un grupo de exposiciones.

Históricamente, existía la antigua definición de incumplimiento (ODOD), que gradualmente evolucionó hacia la nueva definición de incumplimiento (NDOD) que existe actualmente.

Por ejemplo, se considera que una contraparte está en mora cuando el deudor tiene atrasos en el pago de más de 90 días en una obligación crediticia importante.

Una vez establecida claramente la definición de incumplimiento, la institución puede aplicarla a todos sus clientes. Entonces podría enfrentarse a una cartera potencialmente heterogénea compuesta por grandes corporaciones, pequeñas y medianas empresas (PYME), clientes minoristas y entidades soberanas.

Para gestionar el riesgo de forma más eficaz, es esencial identificar estas diferentes categorías y crear subcarteras homogéneas. Esta segmentación permite modelar cada cartera de una manera más relevante y precisa.

Definición de filtros

La definición de filtros permite determinar el alcance del modelado y retener solo contrapartes homogéneas para el análisis. Los filtros son variables que se utilizan para delimitar este alcance.

Estas variables pueden identificarse mediante métodos estadísticos, como técnicas de agrupación, o definirse por expertos en la materia en función del conocimiento empresarial.

Por ejemplo, cuando nos centramos en grandes corporaciones, los ingresos pueden servir como una variable de tamaño relevante para establecer un umbral. Se puede optar por incluir únicamente contrapartes con ingresos anuales superiores a 30 millones de euros.

Luego se pueden utilizar variables adicionales para caracterizar mejor este segmento, como el sector industrial, la región geográfica, los índices financieros o los indicadores ESG.

Otro ámbito de modelado puede centrarse exclusivamente en clientes minoristas que han obtenido préstamos para financiar proyectos personales. En este caso, el ingreso puede usarse como variable de filtrado, mientras que otras características relevantes pueden incluir la situación laboral, el tipo de garantía y el tipo de préstamo.

Una vez que el objetivo está claramente definido, la definición predeterminada está bien especificada y el alcance se ha estructurado adecuadamente a través de los filtros apropiados, la construcción del conjunto de datos de modelado se convierte en el siguiente paso natural.

Construcción del conjunto de datos de modelado

Dado que el objetivo es predecir la probabilidad de incumplimiento en un horizonte de un año, para cada año (N), debemos retener a todas las contrapartes sanas, es decir, aquellas que no incumplieron en ningún momento durante el año (N) (del 01/01/N al 31/12/N).

El 31 de diciembre de N se observan y registran las características de estas contrapartes sanas. Por ejemplo, si nos centramos en entidades corporativas, a partir del 31/12/N, se recopilan los valores de las siguientes variables para cada contraparte: volumen de negocios, sector industrial y ratios financieros.

Para construir la variable de incumplimiento para cada una de estas contrapartes, analizamos el año (N+1). La variable toma el valor 1 si la contraparte incumple al menos una vez durante el año (N+1), y 0 en caso contrario.

Esta variable, denominada Y o def, es la variable objetivo del modelo. El siguiente cuadro ilustra el proceso descrito anteriormente.

En resumen, para cada año fijo (N), obtenemos un conjunto de datos rectangular donde:

Cada fila corresponde a una contraparte que estaba saludable al 31/12/N. Las columnas incluyen todas las variables explicativas medidas en esa fecha, denotadas (Xi) para la contraparte (i). La última columna corresponde a la variable objetivo (Yi), que indica si la contraparte (i) incumple al menos una vez durante el año (N+1) (1) o no (0).

Por ejemplo, si (N = 2015), las variables explicativas se miden al 31/12/2015, y la variable objetivo se observa durante el año 2016.

El regulador exige que se creen conjuntos de datos de modelado utilizando al menos cinco años de datos históricos para capturar diferentes ciclos económicos. Dado que los modelos se calibran durante múltiples períodos, el regulador también exige que los modelos regulatorios sean a lo largo del ciclo (TTC), lo que significa que deben ser relativamente insensibles a las fluctuaciones macroeconómicas de corto plazo.

Supongamos que tenemos datos de clientes que abarcan seis años, desde el 01/01/2015 al 31/12/2020. Aplicando el procedimiento descrito anteriormente para cada año (N) entre 2015 y 2019, se pueden construir cinco conjuntos de datos sucesivos.

El primer conjunto de datos, correspondiente al año 2015, incluye todas las contrapartes que mantuvieron su rentabilidad desde el 01/01/2015 al 31/12/2015. Sus variables explicativas ( Xi, …, Xk ) se miden al 31/12/2015, mientras que la variable de incumplimiento ( Y ) se observa a lo largo del año 2016. Toma el valor 1 si la contraparte incumple al menos una vez durante 2016, y 0 en caso contrario.

El mismo proceso se repite para los años siguientes hasta el conjunto de datos de 2019. Este conjunto de datos final incluye todas las contrapartes que siguieron funcionando desde el 01/01/2019 hasta el 31/12/2019. Sus variables explicativas (X1,…, Xk) se miden al 31/12/2019, y la variable de incumplimiento (Y) se observa en 2020. Toma el valor 1 si la contraparte incumple en algún momento durante 2020, y 0 en caso contrario.

El alcance del modelado final corresponde a la concatenación vertical de todos los conjuntos de datos construidos al 31/12/N. En nuestro ejemplo, N oscila entre 2015 y 2019. El conjunto de datos resultante se puede ilustrar con la siguiente tabla rectangular.

Cada observación estadística se identifica mediante un par formado por el identificador de la contraparte y el año (ID x año) en el que se miden las variables explicativas (al 31/12/N). Y el número de líneas denota el número de observaciones.

Por ejemplo, la contraparte con identificador (ID = 1) puede aparecer tanto en 2015 como en 2018. Estas corresponden a dos observaciones distintas e independientes en el conjunto de datos, identificadas respectivamente por los pares (1 x 2015) y (1 x 2018).

Este enfoque ofrece varias ventajas. En particular, evita la superposición temporal entre deudores y reduce la autocorrelación implícita entre observaciones, ya que cada registro se identifica de forma única mediante el par (id x año).

Además, aumenta la probabilidad de construir un conjunto de datos más sólido y representativo. Al combinar observaciones a lo largo de varios años, el número de eventos de incumplimiento se vuelve lo suficientemente grande como para respaldar una estimación confiable del modelo. Esto es particularmente importante cuando se analizan carteras de grandes corporaciones, donde los eventos de incumplimiento suelen ser relativamente raros.

Finalmente, la institución financiera debe implementar medidas organizativas apropiadas para garantizar la seguridad y la gestión eficaz de los datos durante todo el ciclo de vida de los datos. Para ello, el BCE exige a las entidades financieras que cumplan estándares regulatorios comunes, como la Ley de Resiliencia Operacional Digital (DORA).

Las instituciones deben establecer un marco estratégico integral para la gestión de la seguridad de la información, así como un marco de seguridad de datos dedicado que cubra específicamente los datos utilizados en los modelos internos.

Además, la supervisión humana debe seguir siendo fundamental para estos procesos. Por lo tanto, los procedimientos deben documentarse minuciosamente y deben establecerse directrices claras para explicar cómo y cuándo se debe aplicar el juicio humano.

Conclusión

Definir el desarrollo del modelo y el alcance de la aplicación, así como documentarlos adecuadamente, son pasos esenciales para reducir el riesgo del modelo, no solo en la etapa de diseño, sino durante todo el ciclo de vida del modelo.

El objetivo clave es garantizar que el alcance del desarrollo sea representativo del portafolio previsto y, cuando sea necesario, identificar claramente cualquier extensión, restricción o aproximación realizada al aplicar el modelo en comparación con su diseño original.

Se considera una buena práctica elaborar un documento estandarizado que defina claramente las variables utilizadas para establecer el alcance. Como mínimo, la siguiente información debe ser fácilmente identificable: el nombre técnico de la variable, su formato y su fuente.

En mi próximo artículo, utilizaré un conjunto de datos sobre riesgo crediticio para ilustrar cómo predecir la probabilidad de incumplimiento de diferentes contrapartes. Explicaré los pasos necesarios para comprender adecuadamente el conjunto de datos disponible y, cuando sea posible, describiré cómo manejar y procesar las diferentes variables.

Referencias

Banco Central Europeo. (2025). Guía de Supervisión: Guía del Proceso de Revisión y Evaluación Supervisora (PRES) del MUS. Banco Central Europeo. https://www.bankingsupervision.europa.eu/ecb/pub/pdf/ssm.supervisory_guide202507.en.pdf

Créditos de imagen

Todas las imágenes y visualizaciones de este artículo fueron creadas por el autor utilizando Python (pandas, matplotlib, seaborn y plotly) y Excel, a menos que se indique lo contrario.

Descargo de responsabilidad

Escribo para aprender, por eso los errores son la norma, aunque hago lo mejor que puedo. Por favor, avíseme si nota alguno. ¡También estoy abierto a cualquier sugerencia de nuevos temas!

Cómo definir el alcance del modelado de un modelo interno de riesgo crediticio

ByEquipo de 7 minutos

Definición de defecto

Definición de filtros

Construcción del conjunto de datos de modelado

Conclusión

Referencias

Créditos de imagen

Descargo de responsabilidad

By Equipo de 7 minutos

Related Post

Baidu lanza OCR ilimitado, un modelo 3B que mantiene plana la caché KV para el análisis de documentos largos

Mejorar la velocidad y la eficiencia energética de los agentes de IA | Noticias del MIT

Cómo diseñar un tiempo de ejecución de agente de estilo OpenHarness con herramientas, memoria, permisos, habilidades y coordinación de múltiples agentes

You missed

Baidu lanza OCR ilimitado, un modelo 3B que mantiene plana la caché KV para el análisis de documentos largos

El gusano barrenador podría ser la primera especie objeto de un ‘impulso de extinción’

El XV Plan Quinquenal de China: lo que está en juego en la economía mundial

Un resumen de las últimas novedades del jueves