Analyse de données avec le logiciel R Michaël Genin, Guillemette Marot UniversitédeLille2 EA2694-SantéPublique:EpidémiologieetQualitédessoins [email protected] [email protected] Programme de la formation M.Genin,G.Marot (UniversitédeLille2) FormationLogicielR Version-23octobre2017 1/48 Programmedelaformation Programme - Module 1 Journée 1 Journée 2 Introduction générale Estimation et Tests statistiques PrésentationdulogicielR usuels InstallationdulogicielRet Intervallesdeconfiance packages Testdenormalité Testsdecomparaisonde Les bases d’utilisation du moyennesoudeproportions logiciel R Testduchi2 Importationetexportationde Initiation à la production de données rapports avec RMarkdown Manipulationdedonnées Lancement du projet phase 1 Statistique descriptive et estimation Représentationsgraphiques Indicateursstatistiques M.Genin,G.Marot (UniversitédeLille2) FormationLogicielR Version-23octobre2017 2/48 Programmedelaformation Programme - Module 2 Journée 3 Journée 4 Correction du Initiation aux analyses multivariées mini-projet donné à la Classificationascendantehiérarchique K-means fin du module 1 Régressionlogistique Lien entre plusieurs Testsmultiples variables Introduction au package ggplot2 Corrélationet régressionlinéaire (visualisation de données) multiple ANOVA Régressionlinéaire multiple M.Genin,G.Marot (UniversitédeLille2) FormationLogicielR Version-23octobre2017 3/48 Programmedelaformation Programme - Module 3 Journée 5 Correction du mini-projet donné après le module 2 Synthèse M.Genin,G.Marot (UniversitédeLille2) FormationLogicielR Version-23octobre2017 4/48 Introductiongénérale Point étudié 1 Introductiongénérale Différentesfaçonsdetravailler PrésentationdulogicielR InstallationdulogicielR 2 UtilisationdulogicielR 3 AnalysededonnéesaveclelogicielR-Partie1 4 InitiationàlaproductionderapportsavecRMarkdown 5 Projet-Phase1 6 AnalysededonnéesaveclelogicielR-Partie2 M.Genin,G.Marot (UniversitédeLille2) FormationLogicielR Version-23octobre2017 4/48 Introductiongénérale Différentesfaçonsdetravailler Point étudié 1 Introductiongénérale Différentesfaçonsdetravailler PrésentationdulogicielR InstallationdulogicielR 2 UtilisationdulogicielR 3 AnalysededonnéesaveclelogicielR-Partie1 4 InitiationàlaproductionderapportsavecRMarkdown 5 Projet-Phase1 6 AnalysededonnéesaveclelogicielR-Partie2 M.Genin,G.Marot (UniversitédeLille2) FormationLogicielR Version-23octobre2017 4/48 Introductiongénérale Différentesfaçonsdetravailler Exemple d’analyse de données avec Excel source X 1 Ouverture du jeu de données (.xls) : feuille ou tableur Excel X 2 Tableaux croisés dynamiques Moyenne, médiane, écart type,... =moy(A :A) Copier / Coller dans un Rapport final 1 j (Word) rapport M.Genin,G.Marot (UniversitédeLille2) FormationLogicielR Version-23octobre2017 5/48 Introductiongénérale Différentesfaçonsdetravailler Exemple d’analyse de données avec SPSS Import du jeu de données à la main source Clic bouton : Analyse1=sortie1 SPSS (graphique/nombre/tableau) commandes commandes Analyse2=sortie2 Analyse3=sortie3 ... source Sorties non utilisables telles quelles pour le rapport Copier / Coller dans un Rapport final rapport (Word) M.Genin,G.Marot (UniversitédeLille2) FormationLogicielR Version-23octobre2017 6/48 Introductiongénérale Différentesfaçonsdetravailler Exemple d’analyse de données : l’esprit R source Ouverture du logiciel R Édition d’un script : Importationdesdonnées console "Nettoyage",définitiondenouvelles variables,typage,etc.=data script management Analyses(descriptiveuni/bivariée, modélisation,...) Editiondegraphiques Exportationd’unrapport Rapport rapport M.Genin,G.Marot (UniversitédeLille2) FormationLogicielR Version-23octobre2017 7/48
Description: