ebook img

Méthodes d'Analyses Factorielles ACP et AFCM PDF

28 Pages·2004·0.66 MB·French
by  
Save to my drive
Quick download
Download
Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.

Preview Méthodes d'Analyses Factorielles ACP et AFCM

LTSI Méthodes d’Analyses Factorielles ACP et AFCM Emmanuel ROUX, Alfredo HERNANDEZ et Guy CARRAULT LTSI - INSERM U642 Séminaire « Tahiti » - IRISA - Île de Houat - 26-27 Avril 2004 1 Introduction • Contexte – Nombre important de variables et d’individus statistiques – Pas ou peu de connaissances préalables sur les données • Objectifs des méthodes – Réduction des données • Identifier les variables discriminantes les plus informatives • Identifier des relations entre variables – Juger de la capacité de caractérisation des variables – Identifier des groupes d’individus et/ou des types de comportement 2 Plan de l’Exposé • Principes communs aux méthodes factorielles • Analyse en Composantes Principales (ACP) → Exemple • Analyse des Correspondances – Simple (AFC) – Multiple (AFCM) → Exemple • Étude en cours 3 Principes Communs • Tableau de données × n individus statistiques p variables • Objectif Représenter les données de manière « optimale » • Méthode → – Transformation D X adaptée à l’analyse souhaitée – Définition d’une distance – Critère d’optimisation Principes Communs Analyse en Composantes Principales Analyse des Correspondances Étude en Cours 4 Espace des Individus / des Variables Variables D V1 V2 … Vp I1 d11 d12 Mise en forme Rp I2 Individus Statistiques … In dnp Variables X V1 V2 … Vp Ip I2 I1 x11 x12 H2 I2 Individus Statistiques … I1 In xnp I3 u Rn V1 v ⎛ n ⎞ V2 ∑ ⋅ max⎜ p d (OHi)⎟ i r u ⎝ ⎠ = i 1 Vp Principes Communs Analyse en Composantes Principales Analyse des Correspondances Étude en Cours 5 Propriétés de Base • Dans l’espace des variables Rp λ u = vecteurs propres de XtX associés aux valeurs propres α α • Dans l’espace des individus Rn v = idem avec XXt α Les valeurs propres de XtX est de XXt sont égales !! Rechercher la meilleure représentation des individus revient à chercher la meilleure représentation des variables Principes Communs Analyse en Composantes Principales Analyse des Correspondances Étude en Cours 6 Analyse en Composantes Principales (ACP) • Type de données – Variables continues – ACP normée : données centrées réduites (X) − d d ∈ × = ij j (i, j) [1, n] [1, p], x ij σ j • Distance euclidienne • Critère ⎛ n ⎞ ∑ max⎜ d (GHi)⎟ r u ⎝ ⎠ = i 1 • Recherche des valeurs propres de XtX Principes Communs Analyse en Composantes Principales Analyse des Correspondances Étude en Cours 7 Exemple ACP - Données Activités et Tendances Culturelles : Musique Enregistrée (1998) Vente MusPopNat MusPopInt MusClas TxEnrPirates TxImp LectCD ($ US / Hab) (%) (%) (%) (%) (%) (Nb/ 100 Hab) Allemagne 36,6 43 47 10 3 16 75 Autriche 42,3 15 73 12 2 20 48 Belgique 36,1 20 71 9 4 21 63 Danemark 49,5 35 57 8 1 25 77 Espagne 17,1 42 51 7 2 16 47 Russie 0,6 68 26 6 70 20 2 Finlande 26,9 42 48 10 10 22 43 France 36,4 44 46 10 3 21 68 Grèce 10,9 59 37 4 25 18 22 Hongrie 5,6 32 59 9 25 25 22 Irlande 31,6 16 79 5 5 21 67 Israël 8,3 33 60 7 60 17 27 Italie 10,5 44 51 5 25 20 38 Lettonie 3,9 47 53 0 50 18 4 Norvège 62,8 19 77 4 4 23 44 Pays-Bas 35,7 27 64 9 6 18 99 Pologne 3,9 22 67 11 40 22 20 Portugal 18,7 31 65 4 3 18 30 RépTchèque 7,6 42 48 10 6 22 21 Roumanie 0,3 41 52 7 80 18 6 RoyaumeUni 49,0 48 45 7 1 18 87 Slovaquie 4,0 19 74 7 15 15 21 Suède 44,2 25 71 4 3 25 60 Suisse 45,0 8 82 10 4 8 75 http://www.unesco.org/culture/worldreport/html_fr/stat2/table5f.pdf Principes Communs Analyse en Composantes Principales Analyse des Correspondances Étude en Cours 8 Valeurs Propres Résultats ACP Interprétation λ α Valeurs propres Variances suivant l’axe α λ Σ λ α / % d’inertie expliquée par l’axe α α α Critères de choix des axes principaux • % inertie expliquée > 80% • Valeurs propres > 1 • Différence significative entre 2 valeurs propres successives Dépend du nombre de variables Principes Communs Analyse en Composantes Principales Analyse des Correspondances Étude en Cours 9 Variables Résultats ACP Interprétation Position absolue de la variable Qualité de la représentation dans le plan Cosinus angle entre variables Corrélation Axe : 1 VENTE$/HAB 0,83 LECTCD/100 0,81 MUSPOPINT 0,73 s e MUSCLAS 0,38 l b TXIMP -0,04 a i r MUSPOPNAT -0,78 a v TXENRPIRAT -0,81 s --000,,,879248 e é Axe : 2 n n o MUSPOPINT 0,65 d r TXENRPIRAT 0,33 o o MUSCLAS -0,13 C VENTE$/HAB -0,35 TXIMP -0,37 LECTCD/100 -0,42 MUSPOPNAT -0,60 Principes Communs Analyse en Composantes Principales Analyse des Correspondances Étude en Cours 10

Description:
Simple (AFC). – Multiple (AFCM). → Exemple . Musique Enregistrée (1998) http://www.unesco.org/culture/worldreport/html_fr/stat2/table5f.pdf
See more

The list of books you might like

Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.