ebook img

Approximation du bilan économique sous Solvabilité II via des méthodes d'apprentissage ... PDF

145 Pages·2016·5.46 MB·French
Save to my drive
Quick download
Download
Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.

Preview Approximation du bilan économique sous Solvabilité II via des méthodes d'apprentissage ...

Master Actuariat de Dauphine Mémoire présenté devant l’Université Paris Dauphine pour l’obtention du diplôme de Master Actuariat et l’admission à l’Institut des Actuaires le Buzzi Arnaud Par Titre Approximation du bilan économique sous Solvabilité II via des méthodes d’apprentissage automatique et application à l’ORSA (cid:88)(cid:3) (cid:3) (cid:3) (cid:3) Confidentialité: NON OUI (Durée: 1 an 2 ans) Lessignatairess’engagentàrespecterlaconfidentialitéci-dessus. Membresprésentsdujuryde Signatures l’InstitutdesActuaires Entreprise: Nom Sia Partners Signature Directeur du mémoire en entreprise: Membresprésentsdujurydu Signatures masterActuariatDauphine Nom Khalid JEBBARI Signature ff Autorisation de publication et de mise en ligne sur un site de di usion de docu- ments actuariels (après expiration de l’éventuel délai de confidentialité) Signature du responsable entreprise Secrétariat: Bibliothèque: Signature de l’étudiant UniversitéParis-Dauphine,PlaceduMaréchaldeLattredeTassigny,75775PARISCedex16 Approximation du bilan économique sous Solvabilité II via des méthodes d’apprentissage automatique et application à l’ORSA Buzzi Arnaud Entreprised’accueil:SiaPartners Encadrant:KhalidJEBBARI M ResponsablePédagogique:AndréGRONDIN É M O SiaPartners I 12rueMagellan Paris,France R E Remerciements Cemémoireestlefruitd’untravailréaliséauseinducabinetdeconseilSiaPartners.Iln’auraitpas abouti sans l’aide et l’implication des membres du cabinet et des équipes pédagogiques de l’École Centrale Paris et du Master Actuariat de l’Université Paris Dauphine, et je tiens à ce titre à tous les remercier. Enpremierlieu,jetiensàadressermesplussincèresremerciementsettoutemagratitudeàKhalid JEBBARI, mon encadrant pour ce mémoire. Rien n’aurait été possible sans son aide, son écoute, sa disponibilité,sonsoutien,sessuggestions,sesconseilsetsesinnombrablesidées. Je voudrais également remercier André GRONDIN, qui a encadré ce mémoire pour le compte du Master Actuariat de l’Université Paris Dauphine. Je le remercie chaleureusement pour ses conseils, sessuggestionsetsesretours. Hamza GHRIB, auteur initial du modèle ALM que j’ai utilisé, a toute ma reconnaissance pour la qualitédesontravail,quim’apermisdedémarrercemémoiresurdebonnesbases. Je remercie M. Michael DONIO, directeur du service Actuariat de Sia Partners, ainsi que Mme. DiarraFALL,actuairemanagerenchargedudépartementVie,pourleursdisponibilités,ainsiquele suivietl’intérêtportéàmestravaux. J’aimerais aussi remercier tous les membres du service Actuariat/Assurance de Sia Partners pour l’ambiance chaleureuse et conviviale qu’ils ont su créer, leurs conseils avisés, et tous les échanges constructifsquenousavonspuavoir,avecenparticulierAmélie,Amine,Angèle,Baptiste,Benjamin, Clément,Giacomo,Julien,Louis,MoujibetThibault. Enfin, merci à Valérie FERREBOEUF et à Lionel GABET, responsables respectivement, à l’École CentraleParis,delaFilièreStratégie&Financeetdel’OptionMathématiquesAppliquées,etàMarc HOFFMANN, responsable du Master Actuariat de l’Université Paris Dauphine, pour la qualité de leursenseignements. I Résumé L’Own Risk Solvency Assesment (ORSA), élément central du second pilier de Solvabilité ii, né- cessite la mise en œuvre de lourds processus de calcul qui laissent souvent trop peu de temps à l’analyse.Cetétatdefaitestparticulièrementvraienassurancevie,oùl’utilisationdemodèlesAsset LiabilityManagement(ALM)complexespourprendreenconsidérationlesinteractionsentreactifet passifdubilanrendlessimulationstrèschronophages.Àcetitre,laréglementationlaisseunegrande souplessedanslechoixdesméthodes,àconditiond’êtreenmesuredejustifierleurutilisation.Nous nousdemanderonsdanscemémoiresil’applicationd’algorithmesd’apprentissageautomatiquepeut concrètementconstitueruncomplémentaucalculquipermettraitdepousserd’avantagelesanalyses menées,enparticulierdanslecasdel’ORSA. Les méthodes d’apprentissage automatique supervisé implémentées dans ce mémoire nécessitent une base de données afin d’être calibrées. Pour les générer, un fonds en euros et une modélisation ALM simplifiée de ce dernier ont été considérées. Les entrées ont été générées aléatoirement pour calculerautantdefoisquepossibleBestEstimateofLiabilities(BEL),SolvencyCapitalRequirement (SCR)etratiodesolvabilité.Unebasede11201observationsaainsiétécréée. Une procédure d’analyse de modèles d’apprentissage automatique a été mise en œuvre afin de prédire les trois valeurs mentionnées précédemment. La comparaison de différents modèles, parmi lesquels le Support Vector Machine, les réseaux de neurones ou les forêts aléatoires, permet de sé- lectionnerletreeboostingcommemeilleurprédicteur,àtraverssonimplémentationlaplusrécente, XGBoost. Après optimisation du paramétrage, le modèle permet de prédire le BEL, le SCR, et le ratio de solvabilitéavecdeserreursrelativesmoyennessurlesprédictionsrespectivesde0,5%,9%,et9%. Unautrepointintéressantdelaméthodeestquelenombrededonnéesnécessairesàunecalibra- tion fournissant des résultats acceptables n’est pas si élevé. À peine 1 000 observations suffisent à obteniruneerreursuffisammentfaiblepourappliquerlemodèleenconditionsréelles. Si le modèle par apprentissage automatique n’est pas systématiquement en phase avec les pré- dictions du modèle ALM, il s’avère être un outil complémentaire appréciable. En effet, la méthode permet de générer plusieurs centaines de milliers de simulations presque instantanément. Il est de pluspossibledemontrerque,surungrandnombrederéalisations,tracerladistributiondessorties dumodèleALMoucelledesprédictionsparapprentissageestéquivalentsouscertainesconditions. Aufinal,l’enseignementquiémergedecetteétudeestquelesdonnéesissuesdesimulationsALM sont exploitables à un niveau statistique, et de ce fait, investir dans les technologies permettant de faire tourner en continu les modèles pour générer des données utilisables s’avérerait un choix judi- cieux. À défaut, mettre en place un processus robuste de conservation des données de simulations constitueraitunealternativecrédible,viableetmoinscoûteuse,mêmesilastratégieneporteraitses fruitsqu’àpluslongterme. mots-clés : ORSA, Apprentissage automatique, XGBoost, Algorithmes supervisés, Arbres aléatoires, SCR,BestEstimate,Pilier2,SolvabilitéIIALM,Formulestandard,Fondseuros,Bilan. II Abstract The Own Risk Solvency Assesment (ORSA), key element of the second pillar of Solvency ii, re- quirestheimplementationofveryheavycalculusprocess,thatpreventfromconductingathorough analysis.Thisstateofaffairsisespeciallytrueforlifeinsurance,wheretheuseofcomplexAssetLia- bility Management (ALM) models for taking into account the interactions between the elements of the balance sheet make simulations very time-consuming. On the subject, the european regulation is quite flexible on the methods, provided that they are justified. That is why the use of machine learningalgorithmstoreproducetheALMmodellooksrelevantinordertogofurtherintheORSA. Supervised learning methods require a database in order to be trained. To create it, a euro fund withaslightlysimplifiedALMmodelareconsidered.Theentriesarerandomlygeneratedinorderto calculateasmanytimesaspossiblethevaluesoftheBestEstimateofLiabilities(BEL),theSolvency Capital Requirement (SCR) and the solvency ratio associated to the fund. A database containing 11,201observationsisthuscreated. An analysis process for learning models is then implemented in order to predict the three pre- viously mentioned values. The outcome of the the comparision of different models, which include SVMs,neuralnetworksorrandomforests,istheselectionofoneofthemostrecentimplementations oftreeboosting,XGBoost. Afteroptimizingthecalibration,themodelpredictstheBEL,theSCR,andthesolvencyratiowith relativeerrorsontherespectivepredictionsof0.5%,9%,and9%. Anotherinterestingpointofthemethodisthattheamountofdatarequiredforacalibrationgiving acceptable results is not very high. 1,000 observations are sufficient to get an error low enough to applythemodeltoarealcase. EventhoughthelearningmodelhassomedifficultytostayinlinewiththeALMapproach,itpro- vides the ORSA with a good add-on. Indeed, the method allows to generate hundreds of thousands of scenarii instantaneously. Moreover, it is possible to show that, on a great number of values and with certain conditions, reprenting the distribution of the outcome of the ALM model is equivalent torepresentingtheoutcomeofthemachinelearningproxy. TheconclusioncomingfromthestudyisthatdatafromALMsimulationscanbeusedtoconstruct statisticalmodels,andbecauseofthemeaningstheycarry,itisofutmostimportanceforinsurersto investintechnologiescapableofrunningmodelscontinuouslytogenerateusabledata,oratleastto setuparobustprocessofdataconservation,inordertobuildpredictivemodels. keywords:ORSA,MachineLearning,XGBoost,Supervisedalgorithms,Randomtrees,SCR,BestEsti- mate,Secondpillar,SolvencyII,ALM,Standardformula,Eurofund,Balancesheet. III Synthèse ORSAetApprentissageautomatique L’Own Risk Solvency Assesment (ORSA) est un outil interne d’analyse stratégique et d’aide à la décision, dont l’objectif est d’évaluer les risques spécifiques de l’entreprise qui le mène, de manière prospectiveetcontinue,surunhorizondetempsaumoinségalaupland’activité.Deuxévaluations particulières,auxquelless’intéressecemémoire,sontréaliséesdansceprocessus: 1. L’évaluation du besoin global de solvabilité de l’entreprise, appelé ORSA annuel dans l’étude. L’entreprisedéfinitsonprofilproprederisque,listelesmoyensàmettreenœuvrepouryfaire faceetvérifiequesesrisquessontmaîtriséspourdifférentsscénarios. 2. L’évaluationdurespectpermanentdesobligationsréglementairesconcernantlacouverturedu Solvency Capital Requirement (SCR), du Minimum Capital Requirement (MCR) et le respect des exigences concernant le calcul des provisions techniques, appelé ORSA permanent dans l’étude. Mener à bien ces deux études nécessite de réaliser de nombreux calculs relatifs au bilan d’une compagnied’assurance,dufaitdel’obligationd’évaluerplusieursfoisdesgrandeurscommeleBest Estimate of Liabilities (BEL) ou le SCR. Sachant que la durée du processus permettant d’obtenir ces valeurs se mesure généralement en jours, il est difficile de réaliser un ORSA de manière exhaustive etd’effectuerungrandnombredetests. Unesolutioninnovanteàcetteproblématiqueestl’apprentissageautomatique.Àpartirdedonnées de simulations déjà réalisées, il est possible de calibrer un modèle capable de prédire la valeur du BEL, du SCR, ou du ratio de solvabilité d’une entreprise à partir des variables d’entrée du modèle AssetLiabilityManagement(ALM).Ceprocédépermetd’éliminerlacontraintedetempsinduitepar lessimulationsrequises,maisauprixd’uneapproximation,généralementd’autantplusgrandeque le nombre de données disponibles est faible. Ce mémoire s’interroge sur la possibilité d’utiliser des algorithmes d’apprentissage automatique pour estimer les trois grandeurs évoquées et d’appliquer lesrésultatsauxdeuxpointsdel’ORSAmentionnés. ModélisationALM Afin de mettre en œuvre la démarche suggérée, une modélisation ALM initiale est nécessaire. Étant donné que c’est en assurance vie que les calculs liés au bilan d’un assureur sont les plus com- plexes, à cause des relations qui existent entre actif et passif, l’étude s’intéressera au cas d’un fonds en euros. Bien que des hypothèses fortes et parfois trop simplificatrices d’un point de vue métier IV soient prises, la modélisation ALM développée présente un niveau de complexité suffisant pour la considérer pertinente par rapport aux standards actuels du marché. Le SCR est calculé à l’aide de la formule standard. Parmi les limitations les plus significatives se trouvent l’absence d’ajustement danslaformulestandardetlerassemblementenuneuniqueobligationdel’ensembleduportefeuille obligataire. (a)Bilancomptable (b)Bilanéconomique Figure1–Modélisationdubilan La figure 1 présente les bilans comptable et économique associés au fonds en euros étudié. Ces bilans sont simplifiés, et nombre d’éléments pourtant importants, comme la Provision pour Risque d’ExigibilitéetlaRiskMargin(RM),sontomis.Laformulestandardestquantàelleimplémentéeen agrégeantlessous-modulesderisquesprésentésparlafigure2. Figure2– Agrégationdesdifférentssous-modulesdeSCRdanslecadreétudié Les entrées du modèle ALM sont alors générées aléatoirement, avant que ne leur soit appliqué leditmodèle,pourconstituerunebasededonnéesregroupant11201observationsduBEL,duSCR etduratiodesolvabilitédufondsétudié. V Apprentissageautomatiquesuperviséetcomparaisondemodèles L’apprentissage automatique supervisé consiste à utiliser un ensemble d’observations, pour les- quelleslesentréesetlessortiesd’unmodèlesous-jacentsontconnues,afindeconstruireunefonction de prédiction des sorties au regard des entrées. La fonction de prédiction est calibrée en choisissant parmilesélémentsd’unsous-espacefonctionnelcaractériséparletyped’algorithmemisenœuvre. Plusieursclassesd’algorithmessontalorstestées: (cid:3) Lesmodèleslinéairesgaussiens,quisupposentunefonctiondeprédictionlinéaireparrapport àchacunedesvariables. (cid:3) Lesréseauxdeneurones,inspirésdufonctionnementdesneuronesbiologiques. (cid:3) LesSéparateursàVasteMarge,quireposentsuruneséparationoptimaledesvariables. (cid:3) Les algorithmes CART, qui supposent que la fonction de prédiction est un arbre de décision binaire. (cid:3) Lesforêtsaléatoiresetlebagging,agrégationsdeplusieursarbresCARTindépendants. (cid:3) Le tree boosting, qui est aussi une agrégation d’arbres, mais interdépendants, à travers sont implémentationlaplusrécente:XGBoost. Afin de comparer les capacités prédictives des modèles, la base de données est scindée en deux : 80% des observations serviront à calibrer les modèles, et les 20% restantes serviront à les évaluer. Lestermesapprentissageettestserontrespectivementemployéspourlesdésigner. n pourcentage234 lllllllllllllllllllllllllllllllllllllllllllllllllllllllll llllllllll lllll n pourcentage2300 llllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllll lllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllll lllllllllllllllllllllllllllllllllllllllllllll llllllllllllllllllllllllllllllllllllllllllll lllllllllllllllllllllllllllllllllllllllllllllllllllll n pourcentage2300 llllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllll lllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllll lllllllllllllllllllllllllllllllllllllllllllll llllllllllllllllllllllllllllllllllllllllllll lllllllllllllllllllllllllllllllllllllllllllllllllllll e e e ur ur ur e e e Err1 Err10 Err10 0 0 0 XGRBéosoesatu Neuronal SFVoMrêt aléatoire BagMgiondgèle linéaire CART XGBoost RéSsVeMau Neuronal BaggFionrgêt aléatoire CMARodTèle linéaire XGBoost RéSsVeMau Neuronal BaggFionrgêt aléatoire CMARodTèle linéaire Modèle Modèle Modèle (a)PourleBEL (b)PourleSCR (c)Pourleratiodesolvabilité Figure3–Comparaisondesmodèles Lafigure3comparelesrésultatsdechaquealgorithmeenfournissantl’erreurenpourcentagesur chacune des observations de la base de test pour les trois grandeurs d’intérêt. Dans tous les cas, XGBoostestlemodèleleplusperformant. VI

Description:
quires the implementation of very heavy calculus process, that prevent from mate, Second pillar, Solvency II, ALM, Standard formula, Euro fund, Une solution innovante à cette problématique est l'apprentissage automatique.
See more

The list of books you might like

Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.