Biostatistiques et statistiques appliqu´ees aux sciences exp´erimentales Introduction Christophe Lalanne [email protected] Cogmaster 2006–2007 Cogmaster A4 – p. 1/52 Pr´esentation de l’Atelier ´ Equipe p´edagogique P. Bessonneau ; C. Lalanne ; J. Mattout {C. Pallier} Description L’atelier a un triple objectif. 1. Maˆıtriser l’analyse exploratoire de donn´ees quantitatives, et fournir des r´esum´es num´eriques et graphiques adapt´es aux structures de donn´ees manipul´ees. 2. Formaliser une d´emarche d’analyse pertinente pour r´epondre a` des hypoth`eses op´erationnelles pr´ecises. 3. Mettre en œuvre les proc´edures inf´erentielles correspondantes (estimation ponctuelle et par intervalles, mod`eles param´etriques et non-param´etriques pour les tests d’hypoth`eses, analyse de comparaisons multiples). Ressources www.aliquote.org/cours/2006 cogmaster A4/ Validation 1 QCM + 1 examen final ou projet (au choix) 26h de cours/TP, 3 ECTS Cogmaster A4 – p. 2/52 Organisation Sommaire (provisoire) • s´eance 1 – Introduction (CL) • s´eances 2 et 3 – Introduction `a R, analyse num´erique et graphique (PB, JM) • s´eance 4 – Comparaison de moyennes, ANOVA `a 1 facteur, Comparaisons multiples (CL, PB/JM) • s´eance 5 – ANOVA `a 2 facteurs, ANOVA ‘`a mesures r´ep´et´ees’ (CL, PB/JM) • s´eance 6 – Corr´elation et R´egression lin´eaire simple (CL, PB/JM) • s´eance 7 – R´egression lin´eaire multiple (CL, PB/JM) • s´eance 8 – GLM (CL, PB/JM) • s´eance 9–13 – `a d´eterminer Principe 1h de cours + 1h de TP Cogmaster A4 – p. 3/52 R´ef´erences • D.C. Howell, M´ethodes Statistiques en re Sciences Humaines, De Boeck, 1998 [1 ed., e 6 tirage, 2004] • B. Falissard, Comprendre et utiliser les statistiques dans les sciences de la vie, Masson, 2005 • P. Dalgaard, Introductory Statistics with R, Springer, 2002 • W.N. Venables & B.D. Ripley, Modern applied Statistics with S, Springer, 2002 • M.J. Crawley, Statistics, An introduction using R, Wiley, 2005 Cogmaster A4 – p. 4/52 Outil informatique (1) , logiciel open-source, disponible pour toutes les plateformes (Windows, Mac, Linux), `a t´el´echarger sur cran.r-project.org (section ‘R Binaries’). • La documentation (abondante) se trouve dans les sections ‘Documentation’ et ‘Manuals’. • De nombreux paquetages additionnels peuvent ˆetre install´es `a partir de R. Cogmaster A4 – p. 5/52 Outil informatique (2) R Pourquoi ? • gratuit et multi-plateformes • possibilit´e de programmer des scripts (r´eutilisables) • extensible • am´elioration permanente, r´epercutant les nouvelles techniques • importante liste de contributeurs • capacit´es graphiques quasi illimit´ees Le prix `a payer ? • apprendre les rudiments du langage • comprendre les analyses que l’on r´ealise Cogmaster A4 – p. 6/52 Outil informatique (3) Cogmaster A4 – p. 7/52 Objet des statistiques (1) • r´esumer transformer les donn´ees brutes en un ensemble d’indicateurs descriptifs (´echantillon) • d´ecrire caract´eriser la distribution des observations (univari´e), comparer les distributions (multivari´e) et analyser les effets des facteurs en fonction du type de variable (quantitative/quantitative, quantitative/qualitative, etc.) (´echantillon) • expliquer/pr´edire g´en´eraliser les r´esultats observ´es sur la population non observ´ee, expliquer la variabilit´e, pr´edire des valeurs non observ´ees en fonction d’un mod`ele lin´eaire (population) Cogmaster A4 – p. 8/52 Objet des statistiques (2) • diff´erentes m´ethodes, diff´erents domaines d’application (agronomie, pharmaceutique, psychologie, sciences sociales, enquˆetes, finances, etc.) • biostatistiques = sous-ensemble parmi l’ensemble des m´ethodes de description et de mod´elisation de la statistique Cogmaster A4 – p. 9/52 Terminologie un peu de vocabulaire : • observation, effectif, individu, unit´e statistique • ´echantillon, groupe, population (parente, de r´ef´erence) • variable, facteur, caract`ere • niveau, modalit´e, traitement R Remarque : sous , on ne parle que de facteurs. Cogmaster A4 – p. 10/52
Description: