´ MATHEMATIQUES DE L’ASSURANCE NON-VIE Tome II : Tarification et Provisionnement Michel Denuit & Arthur Charpentier 7 d´ecembre 2009 Liminaires ASSURANCE [asyra˜s] de asseurance, 16`eme si`ecle —— 1. Sentiment de confiance, de s´ecurit´e, fait de rassurer. =⇒ confiance, qui´etude, s´ecurit´e —— 2. Contrat par lequel un assureur garantit `a l’assur´e, moyennant une prime ou une cotisation le paiement d’une somme convenue en cas de r´ealisation d’un risque d´etermin´e =⇒ Risque, sinistre, dommage. —— 3. Par extension, secteur regroupant les entreprises assurant cette fonction. —— 4. “Le contrat al´eatoire est une convention r´eciproque dont les effets quant aux avantages et aux pertes, soit pour toutes les parties, soit pour l’une d’entre elles, d´ependent d’un ´ev´enement incertain.” (Code Civil, art. 1964) Si le premier tome de ces “Math´ematiques de l’Assurance Non- Vie” ´etait celui de la th´eorie du risque, ce second tome sera celui de l’activit´e d’assurance : la tarification et le provisionnement. Les huit chapitres du premier tome donnent ainsi un certain nombre de pr´erequis fondamentaux qui sont amplement utilis´es dans le second. Contenu du Tome 2 Le neuvi`eme chapitre aborde d’un point de vue plus pr´ecis la notion de tarification (dite a priori) pour des risques de masse (par exemple, l’assurance automobile). La tarification a ´et´e intro- duite d’un point de vue actuariel et probabiliste dans le troisi`eme chapitre (notamment, la notion de prime pure). La recherche d’un prix est ´egalement abord´ee dans le douzi`eme chapitre d’un point de vue ´economique ou` le prix d’un bien (quel qu’il soit) doit ˆetre vu comme un point d’´equilibre atteint par un acheteur et un ven- deur.Ceneuvi`emechapitresesitueauconfluentdesdeux,entenant compte de la notion d’h´et´erog´en´eit´e du portefeuille. vi Liminaires Nous insistons en particulier sur l’utilisation de va- riables “exog`enes”, li´ees a` l’assur´e (ˆage, sexe, cat´egorie socio- professionnelle, etc.), li´ees au bien assur´e (puissance du v´ehicule ou son anciennet´e, en assurance automobile, par exemple), ou li´ees `a l’environnement (zone urbaine ou rurale, par exemple). Nous pr´esentons ainsi en d´etails l’utilisation des mod`eles lin´eaires g´en´eralis´es (GLM pour Generalized Linear Models) afin de mod´eliser une fr´equence ou un couˆt moyen de sinistres, en fonction de variables explicatives. Diderot rappelait dans ses Pens´ees Philosophiques que “celui qui doute parce qu’il ne connaˆıt pas les raisons de la cr´edibilit´e n’est qu’unignorant”.Nousconsacronsainsiledixi`emechapitre`aunoutil tr`es utile en tarification par exp´erience : la th´eorie de la cr´edibilit´e. Contrairement `a ce qui a ´et´e fait au neuvi`eme chapitre, dans lequel les caract´eristiques exog`enes sont utilis´ees afin de pr´edire la sinis- tralit´e, le dixi`eme chapitre utilisera le pass´e sinistres pour r´e´evaluer le montant de la prime. Nous pr´esentons en particulier l’approche bay´esienne, permettant de pr´evoir pour un individu le nombre de sinistres qu’il aura l’ann´ee n (son esp´erance ou plus g´en´eralement sa loi de probabilit´e), conditionnellement aux nombres de sinistres observ´es au cours de n−1 premi`eres ann´ees. Enfin, nous pr´esentons ´egalement la pr´ediction lin´eaire propos´ee par Hans Bu¨hlmann, es- timant le nombre moyen de sinistres de l’ann´ee n comme un ba- rycentre, entre le nombre moyen de sinistres d´eclar´e par l’assur´e au cours des n−1 premi`eres ann´ees, et la fr´equence moyenne sur l’ensemble du portefeuille. La pond´eration donn´ee `a l’exp´erience in- dividuelle est appel´ee coefficient de cr´edibilit´e. Le onzi`eme chapitre aborde un m´ecanisme de tarification par exp´erience (ou a posteriori) fort appr´eci´e en Europe : les syst`emes bonus-malus. Il s’agira, tout comme dans le dixi`eme chapitre, de r´e´evaluer le montant de la prime `a l’aide des sinistres observ´es dans lepass´e,maiscettefoiscelasefera`al’aided’unm´ecanismeuniforme etsimplifi´e,seprˆetantais´ementauformalismecontractuel(alorsque la haute technicit´e de la th´eorie de la cr´edibilit´e la cantonne le plus souvent aux couvertures d’assurance souscrites par les personnes morales).Lem´ecanismebonus-malusincite´egalement`alaprudence et r´eduit les inefficacit´es induites par l’al´ea moral. Nous pr´esentons ainsi deux types de syst`emes : le syst`eme dit “`a classes” (comme celui en vigueur en Belgique), et le syst`eme “`a coefficients r´educteur ou majorateur” (en vigeur en France). Dans les deux cas, la th´eorie Liminaires vii des chaˆınes de Markov permettra de mod´eliser la trajectoire des assur´es dans de tels syst`emes. En travaillant sur les probl`emes de jeux et de paris, Pascal d´eclarait que “s’il y a autant de hasards d’un cˆot´e que de l’autre, le pariest`ajouer´egalcontre´egal”.Ceprobl`emea´et´ereprisparDaniel Bernoulli sous la forme du paradoxe dit “de Saint Petersbourg”, in- troduisantladistinctionfondamentaleentrelegain(pretium)etson utilit´e (emolumentum). Cette th´eorie d’esp´erance morale (comme elle fut parfois appel´ee) a ´et´e formalis´ee et pleinement exploit´ee `a partir des travaux de von Neumann et Morgenstern, en introduisant les bases axiomatiques de l’utilit´e esp´er´ee. Cette th´eorie est le point de d´epart du douzi`eme chapitre qui aborde l’assurance d’un point de vue ´economique, ou` assureur comme assur´e sont des agents, qui n’acceptent de payer pour une couverture (un bien) que si leur uti- lit´e (ou leur esp´erance d’utilit´e) s’en trouve am´elior´ee. Un certain nombre de paradoxes remettent toutefois en cause la plupart des conclusions. Plusieurs approches duales sont alors propos´ees, par exemple la notion de subjectivit´e des probabilit´es de survenance des sinistres. Nous abordons ´egalement les m´ecanismes de couverture pour des risques multiples, assurables ou non-assurables (ces der- niers ´etant parfois qualifi´es de background risk). Comme nous l’avons vu dans le Tome I, le march´e de l’assu- rance se caract´erise par l’inversion du cycle de production. L’assu- reurs’´etantengag´e`averseruneindemnit´eencasdesurvenanced’un sinistreaucoursd’unep´eriode,ildoitconstituerdesprovisionspour les sinistres non encore r´egl´es. C’est autour de cette notion comp- table que le treizi`eme chapitre est articul´e. Comme nous le verrons, les mod`eles utilis´es ne sont pas n´ecessairement tr`es complexes, mais leur diversit´e rend l’exercice p´erilleux pour un actuaire : quel est, au final, le mod`ele qu’il doit retenir pour estimer la charge finale des sinistres pour des exercices non encore clos. Ce chapitre propose un panorama non-exhaustif des diff´erentes m´ethodes, en insistant sur le fait que les erreurs de mod`eles peuvent ˆetre importantes, et difficiles `a quantifier. Une approche unifi´ee bas´ee sur les GLM per- mettra d’aborder le probl`eme `a l’aide de techniques appropri´ees et relativement universelles. Les risques majeurs sont particuli`erement importants `a traiter puisqu’ils repr´esentent (en montant) l’essentiel du passif d’un assu- reur. Mais ils sont d’autant plus difficiles `a appr´ehender qu’il n’est viii Liminaires alors plus possible d’invoquer la plupart des r´esultats fondamen- taux (loi de grands nombres et th´eor`eme central limite), ´evoqu´es dans le Tome I. Le quatorzi`eme chapitre propose ainsi un certain nombre d’outils math´ematiques permettant de mod´eliser au mieux ces´ev´enementsrares,maisextrˆemementcouˆteux.“L’habituel d´efaut de l’homme est de ne pas pr´evoir l’orage par beau temps”,pr´etendait Machiavel, faisant que les catastrophes ont longtemps ´et´e g´er´ees ex-post. Les r´esultats pr´esent´es dans ce chapitre, et les outils mis en place sur les march´es assurantiels (en particulier les trait´es de r´eassurance) sont autant d’´el´ements qui rendent plus solides un march´e de plus en plus sollicit´e, pour offrir des garanties toujours plus ´etendues. Lequinzi`emechapitreestdavantagem´ethodologique.Ilpr´esente un certain nombre d’outils num´eriques afin de calculer des primes, des mesures de risque, des probabilit´es de ruine, etc. En particulier, nous insistons sur les m´ethodes de simulation, en tentant de voir comment obtenir les meilleurs r´esultats, en un minimum de temps de calcul. Enfin, un dernier chapitre en guise de conclusion essaiera de pr´esenter sur quelques cas simples et concrets les limites de l’as- surabilit´e : `a l’aide des outils propos´es dans les deux tomes de ces “Math´ematiques de l’Assurance Non-Vie”, les compagnies d’assu- rance peuvent-elles pour autant tout assurer? Remerciements Avant de conclure cette pr´eface, nos plus sinc`eres remerciements vont `a nos coll`egues, qui ont accept´e de porter un regard critique et constructif sur ce texte, `a diff´erents stades de son ´evolution. Nous voudrions ainsi remercier Meglena Jeleva, Anne-C´ecile Goderniaux, H´el`ene Gu´erin et Claude Lef`evre. Nous souhaitons ´egalement ex- primer notre gratitude envers le professeur Christian Gouri´eroux pour ses nombreux commentaires et suggestions, qui ont permis de corriger et d’am´eliorer sensiblement le texte, mais aussi pour avoir accept´e de nous publier dans cette prestigieuse collection. Les nombreux ´etudiants `a qui les auteurs ont eu le grand plai- sir d’inculquer les sciences actuarielles, ont largement contribu´e `a am´eliorer la pr´esentation de l’expos´e. Nous tenons ici `a nous excu- serdenousˆetreservisd’euxcommeautantdecobayesinvolontaires. Notre gratitude leur est acquise. Liminaires ix Merci ´egalement aux demandes insistantes d’un certain nombre de professionnels de l’assurance souhaitant que leur soient expos´ees de fac¸on claire des m´ethodes r´ecentes afin de traiter des risques de plusenpluscomplexes.Sanseux,cetouvragen’auraitprobablement jamais vu le jour. Qu’ils en soient remerci´es. Et que soient remerci´es ´egalement un certain nombre d’universitaires en math´ematiques ap- pliqu´ees ou en ´economie, qui, nous l’esp´erons, auront trouv´e ici mati`ere `a de nouveaux travaux de recherche. Nous avons essay´e de tenir compte de leurs critiques lors de la r´edaction de ce second tome. Les deux tomes de ces “Math´ematiques de l’Assurance Non- Vie” ont eu l’immense honneur d’ˆetre respectivement introduits par Claude B´eb´ear - fondateur d’AXA et Pr´esident du Conseil de Surveillance, assureur et actuaire reconnu - et conclus par Hans Bu¨hlmann - professeur ´em´erite de l’ETH Zu¨rich, et auteur de l’ou- vrage qui, 35 ans apr`es sa publication, fait encore r´ef´erence en math´ematiquesdel’assurancenon-vie.Mercipourleurbienveillance et leurs encouragements. Enfin, last but not least, nous tenons `a remercier nos employeurs respectifs, pour le cadre de travail agr´eable et les moyens qu’ils mettent `a notre disposition, afin de d´evelopper un travail scienti- fique de qualit´e. Chapitre 9 Tarification a priori 9.1 Introduction Danslatarificationditea priori,l’id´eeestdes´eparerlescontrats (etlesassur´es)enplusieurscat´egories,defa¸conqu’`al’int´erieurd’une cat´egorie, les risques puissent ˆetre consid´er´es comme “´equivalents”. Les bases de la tarification en univers segment´e ont ´et´e jet´ees dans le Tome 1 (voyez la Section 3.8). Comme nous l’avons vu `a la Section 3.7, l’h´et´erog´en´eit´e au sein d’un portefeuille pose un grand nombre de probl`emes, en particu- lier d’antis´election : si la mˆeme prime est appliqu´ee `a l’ensemble du portefeuille, les mauvais risques s’assureront (`a un prix d’ailleurs moins ´elev´e que celui qui devrait leur ˆetre r´eclam´e), mais les bons pourraient ˆetre d´ecourag´es par le tarif trop ´elev´e, ce qui aura ten- dance `a d´egrader le r´esultat1. L’id´ee naturelle qui est d´evelopp´ee dans les premi`eres sections de ce chapitre est de partitionner le portefeuille afin de constituer des sous-portefeuilles sur lesquels les risquespeuventˆetreconsid´er´escommeind´ependantsetdemˆemeloi. On parle alors de classes de risques. Les classes sont dites a priori lorsqu’ils’agitdeclasserlerisqueapartird’informationdisponiblea priori (sur l’assur´e, le bien assur´e...) et a posteriori si l’information sur l’historique des sinistres de l’assur´e est prise en consid´eration (comme cela sera fait dans les deux chapitres suivants). Les Chapitres 3 et 4 du Tome 1 ont pr´esent´e les principes g´en´eraux de calcul des primes, reposant essentiellement sur le cal- 1. Insistonsencoreunefoissurl’absencedecaract`erep´ejoratifdanslequalifi- catif“mauvais”.Ilnes’agitpasdestigmatiserunecertainecat´egoried’individus mais bien de reconnaˆıtre techniquement que certains assur´es causent davantage de sinistres, ou des sinistres plus couˆteux, que d’autres. 2 Chapitre 9. Tarification a priori cul de la prime pure, correspondant `a l’esp´erance math´ematique du couˆt annuel des sinistres d´eclar´es `a l’assureur. Cette prime pure se d´ecomposait toutefois en deux composantes : la fr´equence et le couˆt moyen, en notant simplement que (cid:34) N (cid:35) (cid:88) E X = E[N]×E[X ], i i i=1 pour des montants de sinistres X ,X ,... ind´ependants et de mˆeme 1 2 loi, ind´ependants de leur nombre N (voyez la Propri´et´e 3.2.11). Il convient en effet de s´eparer ces deux notions pour plusieurs rai- sons : les facteurs explicatifs ne sont pas toujours les mˆemes (en assurance automobile, la fr´equence est une variable li´ee essentielle- ment au conducteur, et le couˆt moyen au v´ehicule), le couˆt moyen est soumis `a l’inflation alors que la fr´equence suit des cycles plus complexes, et si la fr´equence peut ˆetre connue rapidement, le couˆt peut ˆetre long `a estimer lors d’accidents corporels par exemple (ce dernier point sera abord´e en d´etails dans le Chapitre ?? sur le pro- visionnement). Exemple 9.1.1. La Figure ?? compare, sur des donn´ees franc¸aises, le couˆt moyen des sinistres et la fr´equence pour des segments de po- pulation diff´erents, avec un d´ecoupage prenant en compte le sexe, l’ˆage (18-25, 25-40, 40-65, plus de 65 ans), l’utilisation du v´ehicule (commerciale ou non), la puissance (gradu´ee de A a` K, K d´esignant les grosses cylindr´ees), pour quelques cat´egories socio-professionelle (profession lib´erale, fonction publique ou agriculture). Les deux axes permettent de repr´esenter le comportement moyen sur l’ensemble de la population (fr´equence de l’ordre de 13,5% et couˆt moyen de 1 100 e correspondant respectivement aux axes verticaux et hori- zontaux de la figure). On note que le point qui se d´etache le plus du nuage est celui des jeune conducteurs (hommes de 18 `a 25 ans, classe H-18-25 en haut `a droite), qui ont `a la fois plus de sinistres et des sinistres plus couˆteux. Les hommes de 25 `a 40 ans se d´etachent ´egalement, en particulier d`es lors qu’ils ont une voiture puissante ou qu’ils ont une profession lib´erale et qu’ils utilisent leur v´ehicule dans le cadre de leur travail. Les femmes exerc¸ant une profession lib´erale sont ´egale mises en avant, avec une fr´equence de sinistres tr`es ´elev´ee, mais un couˆt moyen dans la moyenne. En revanche, les personnes ˆag´ees ou les hommes inactifs ont une fr´equence relative- ment faible pour un couˆt moyen standard. Deplus,silamod´elisationdirectedelaprimepurepeutparaˆıtre plus robuste et plus rapide, elle s’av`ere relativement complexe `a 9.2. Les variables tarifaires 3 mettre en oeuvre puisqu’il est difficile de trouver des lois simples mod´elisantcorrectementlaprimepure.Enrevanche,desloissimples permettent de mod´eliser les fr´equences, et les couˆts moyens (voir Chapitre 2). 9.2 Les variables tarifaires En tarification, par habitude, mais aussi pour des raisons tech- niques que nous allons pr´esenter ici, les variables tarifaires sont g´en´eralement des variables qualitatives. Les variables continues sont alors g´en´eralement regroup´ees par classes. En assurance automobile, la tarification peut d´ependre des ca- ract´eristiques propres du v´ehicule (puissance et vitesse de pointe, anciennet´e du v´ehicule), de son usage, de la zone de circulation (densit´e du trafic), ou de certains traits sp´ecifiques du conducteur habituel. Figure9.1–Statistiquesrelativesaucouplefr´equence/couˆtmoyen en assurance automobile, observation d’un portefeuille d’assurance fran¸cais. Les informations que tente d’avoir l’assureur sur l’assur´e, afin de contrer l’antis´election doivent, d’un point de vue pratique, ˆetre v´erifiables. Certaines informations qui pourraient ˆetre r´ev´elatrices d’un comportement `a risque (c’est-`a-dire fortement corr´el´ees `a la sinistralit´e) ne peuvent ˆetre utilis´ees car elles induiraient une forte fraude (point que nous n’aborderons pas dans ce chapitre) : ainsi, la distance parcourue par le v´ehicule chaque ann´ee est difficilement v´erifiable. Les variables explicatives composant X peuvent ˆetre de diff´erentstypes.Certainesd’entreellespeuventˆetrequantitativeset continues (comme la puissance de la voiture ou l’ˆage de l’assur´e par exemple). D’autres variables explicatives dont l’assureur dispose `a proposdesesassur´espeuventˆetrequantitativesdiscr`etes(lenombre d’enfantsdel’assur´e,parexemple).D’autresencoresontqualitatives ou cat´egorielles (comme le sexe de l’assur´e, par exemple). On peut ´egalementutiliserdesindicesr´esumantlescaract´eristiquesdelazone d’habitation de l’assur´e `a partir de donn´ees publiques, comme celles issues d’un recensement. En condensant l’information pertinente `a propos de la sinistralit´e disponible aupr`es d’un institut national de statistique, on peut ainsi obtenir de nouvelles variables explicatives 4 Chapitre 9. Tarification a priori dont le pouvoir pr´edictif (reconnu par le mod`ele) est souvent tr`es important. Nous reviendrons sur ce point `a la Section ??. Lesvariablesquantitativesn’appellentpasdecommentairespar- ticuliers. En ce qui concerne les variables cat´egorielles, on convient de coder tout facteur partitionnant la population en k cat´egories par les entiers 0,1,...,k − 1. Certains facteurs peuvent ˆetre ordi- naux et r´esulter d’une variable quantitative (comme la puissance d’un v´ehicule que l’on a cod´ee en diff´erentes classes), soit ordinaux mais sans´echelle quantitative (comme le niveau d’´etudes) ou encore ˆetre purement qualitatif, sans induire d’ordre (comme le sexe). Une variable cat´egorielle `a k facteurs est g´en´eralement cod´ee par k −1 variables binaires qui sont toutes nulles pour le niveau de r´ef´erence. Exemple 9.2.1. La plupart du temps, les variables explicatives sont toutes cat´egorielles dans un tarif commercial. Consid´erons par exemple un compagnie segmentant selon le sexe, le caract`ere sportif du v´ehicule et l’ˆage de l’assur´e (3 classes d’ˆages, `a savoir moins de 30 ans, 30-65 ans et plus de 65 ans). Un assur´e sera repr´esent´e par un vecteur binaire donnant les valeurs des variables (cid:26) 0, si l’assur´e est un homme, X = 1 1, si l’assur´e est une femme, (cid:26) 0, si le v´ehicule n’a pas de caract`ere sportif, X = 2 1, si le v´ehicule a un caract`ere sportif, (cid:26) 1, si l’assur´e a moins de 30 ans, X = 3 0, sinon, (cid:26) 1, si l’assur´e a plus de 65 ans, X = 4 0, sinon. Pour chaque variable, on choisit comme niveau de r´ef´erence (i.e. celui pour lequel toutes les variables binaires utilis´ees pour la co- der valent simultan´ement 0) la modalit´e la plus repr´esent´ee dans le portefeuille. Les r´esultats s’interpr`eteront ensuite comme une sur- ou sous-sinistralit´e par rapport `a cette classe de r´ef´erence. Ainsi, le vecteur (0,1,1,0) repr´esente un assur´e masculin de moins de 30 ans conduisant un v´ehicule sportif. 9.3 Principes de base de la statistique Cette section rappelle bri`evement les m´ethodes statistiques ´el´ementaires. Notre pr´esentation est intuitive et informelle. Pour plus de d´etails, nous renvoyons le lecteur par exemple `a Monfort (1996).