94 Sommaire n° Sept. 2014 l Page 2 : Des évaluations omniprésentes dans le système éducatif l Page 10 : Évaluer pour contrôler l Page 19 : Évaluer pour former l Page 27 : Évaluer en pratiques l Page 35 : Conclusion l Page 37 : Bibliographie ÉVALUER POUR (MIEUX) FAIRE É APPRENDRE F I ’ INTRODUCTION l e Face à l’emprise des évaluations en tous genres dans l’espace éducatif, certains d seraient sans doute enclins à détourner Par Olivier Rey et l’adage et se satisfaire d’une maxime telle que « Évaluer, évaluer, il en restera toujours Annie Feyfant e quelque chose ». Les contrôles, épreuves, Chargés d’étude et de examens et concours de toutes sortes ap- l recherche au service paraissent tellement naturels qu’on n’ima- l gine pas de scolarité digne de ce nom sans Veille et Analyses de i leur consécration. Il suffit d’évoquer les l’Institut français de e inconvénients des notes pour s’attirer rapi- l’Éducation (IFÉ) dement la réplique outrée : « Ce n’est pas v en brisant le thermomètre qu’on résoudra les problèmes ! ». e Pourtant, cette métaphore du thermo- seulement un outil approximatif de contrôle mètre est aussi fréquente qu’erronée et mais aussi un levier pour mieux faire ap- d contre-productive. L’idée que l’évaluation prendre l. C’est l’approche retenue pour intervient de façon indépendante ex-post, ce dossier, mise à jour partielle d’un dos- après l’enseignement, méconnait en ef- sier publié en 2008 . Autant l’évaluation externe des systèmes à investir leurs efforts en tenant fortement éducatifs fait désormais l’objet de nom- compte du poids donné à tel ou tel contenu breux travaux (il suf¿t d’évoquer PISA), par l’examen (par le jeu des coef¿cients) autant les examens nationaux (qu’on ou à quel point il est dif¿cile d’obtenir pense au baccalauréat ou au brevet) mais qu’un enseignement « sans évaluation » aussi l’évaluation au quotidien dans la soit pris en considération. Ce travers de la classe sont étonnamment mal connus et réi¿cation de l’évaluation dans l’éducation peu étudiés l. a souvent été dénoncé, puisqu’il conduit le plus souvent à mesurer ce qui est facile l « Bien qu’il s’agisse À partir d’analyses, issues le plus sou- à évaluer plutôt qu’à évaluer ce qui a été d’un rituel quasi-quo- tidien de la classe, les vent de la littérature scienti¿que récente, effectivement appris (Timmis et al., 2012). évaluations constituent nous nous efforcerons donc de clari¿er encore des dispositifs les termes du débat en revenant sur les DE QUELLE ÉVALUATION peu étudiés en didac- dé¿nitions, les fonctions et les formes tique » (Millon-Fauré, PARLE-T-ON ? existantes de l’évaluation. Les pratiques 2013). de notation et les évaluations certi¿catives qui pèsent si lourd, comme l’évaluation Peu de processus semblent pourtant « pour contrôler », seront mises en exa- aussi « naturels » dans l’éducation que men et comparées dans une perspective celui de l’évaluation des apprentissages, internationale. Nous nous interrogerons du fait de l’existence de tout un dispositif ensuite sur les termes d’évaluation for- de contrôles et d’examens aux techniques mative et d’évaluation formatrice et envi- toujours plus raf¿nées et enrichies au fur sagerons leurs implications pour les en- et à mesure du développement des tech- seignants. Des dispositifs et des cadres nologies. Polysémique s’il en est, le mot d’évaluation qui tentent de décliner ces « évaluation » recouvre donc de multiples principes seront ensuite présentés pour processus dans le système éducatif, contribuer à faciliter les aller-retour entre puisqu’il peut servir à désigner aussi bien les théories présentées et les pratiques de un contrôle surveillé de l’enseignant dans classe existantes ou envisageables. sa classe, un examen national comme le baccalauréat, un examen conduisant à un DES ÉVALUATIONS diplôme, un dispositif visant à mesurer la qualité d’un établissement scolaire, voire OMNIPRÉSENTES DANS même une procédure de contrôle des pra- tiques enseignantes, etc. LE SYSTÈME ÉDUCATIF On peut également opérer une distinc- tion entre l’évaluation qui est une part Si l’expression de la « pression évaluative » intégrale du processus d’enseignement a été utilisée par P. Merle en 2005, plusieurs et d’apprentissage et l’évaluation pour ouvrages et articles récents évoquent la la communication, qui vise à fournir des tension, la menace, la frénésie évaluative informations à de potentiels usagers et en même temps que la peur de l’évaluation partenaires de l’éducation, qu’il s’agisse (Butera et al., 2011 ; Hadji, 2012 ; Crahay d’étudiants, d’enseignants, d’institutions et al., 2012). Le stress, la pression (contre- ou de systèmes (Broadfoot, 2007). productive) et les différentes formes de stig- matisation amènent à constater que le sys- Dans le cadre de ce dossier, il n’était donc tème de notation utilisé en France « est une luation selon les fonctions qu’elle remplit La recherche de procédés ¿dèles et va- dans l’apprentissage : diagnostique, pro- lides, exempts de subjectivité, qui jugent nostique, sommative, certi¿cative, forma- à un moment précis et de façon isolée tive… tout ce qui est censé constituer l’acquis d’un individu, n’est plus la priorité, même l Science dont le nom Les « contrôles » ou « examens » de si cela a constitué pendant une période est attribué à Henri Piéron et dont le but type sommatif rencontrés tout au long l’horizon de la docimologie l. est l’étude de l’organi- de la scolarité, auxquels on pense le sation des examens, de plus spontanément, ne sont pas de Évaluer est toujours un jugement en leurs contenus, objec- même nature que les évaluations cer- fonction d’une valeur, et l’enjeu n’est tifs pédagogiques mais ti¿catives (concours diplômants par donc pas tant de rendre l’évaluation plus aussi (et surtout) des méthodes de correc- exemple), les évaluations pronostiques exacte et plus juste, mais plutôt de com- tion des épreuves ainsi (examen d’accès ou d’orientation) ni muniquer à l’évalué ce qu’on attend de que le comportement les évaluations diagnostiques (grandes lui et de l’inciter ainsi à partager les ¿na- des examinateurs et enquêtes par niveau de scolarité), sans lités de la formation. des examinés. enjeu « direct » pour l’évalué. Quant à l’évaluation formative, elle est souvent Si cette mesure « objective » est pourtant mêlée aux autres formes d’évaluation, bien ce qui est souvent encore cherché dans la mesure où c’est son utilisation au travers des pratiques de notation qui dans l’apprentissage qui la distingue. constituent la caractéristique majeure des dispositifs d’évaluation existants, Toutes ces différentes formes d’évalua- la plupart des experts défendent l’idée tion n’ont pas les mêmes effets sur les que l’évaluation est un « message » plus personnes, au-delà même du contexte qu’une « mesure » (voir aussi le dossier scolaire puisque l’évaluation somma- en ligne réalisé par Jacques Nimier : tive, par exemple, devient fréquemment « Cette évaluation impossible et pour- un marqueur de l’identité scolaire de tant nécessaire »). l’élève, du fait qu’elle est souvent enre- gistrée dans un document of¿ciel et pu- ÉVALUER LES ÉLÈVES OU blic, tel que le bulletin scolaire (Allal, in ÉVALUER LE SYSTÈME ? van Zanten, 2008). Si la certi¿cation a longtemps consti- La question de l’évaluation des élèves est tué le seul débouché de l’évaluation, la intimement connectée à celle de l’évalua- démocratisation scolaire qui s’est déve- tion du système éducatif. Que l’on consi- loppée depuis les années 1960 a mis dère les classements des lycées en fonc- en avant le souci d’évaluation comme tion des résultats du bac, les évaluations processus de véri¿cation continue pour diagnostiques réalisées par la Direction guider la démarche d’enseignement et de l’évaluation, de la prospective et de la d’apprentissage (Scallon, 2007). Ce qui performance du ministère de l’Éducation explique que les réexions ne se ré- nationale, ou encore les enquêtes interna- duisent plus aujourd’hui à une question tionales PISA (Rey, 2011), on comprend d’exactitude de la mesure ni de produit qu’à travers les résultats des élèves, c’est ¿ni (résultat du test par exemple) mais souvent la performance des enseignants, portent également sur les progressions des approches pédagogiques, des éta- des élèves. blissements ou des systèmes éducatifs Évaluation n’est pas forcément compa- tion de nouvelles pratiques d’évaluation, raison le modèle de la performance a progres- sivement envahi les écoles primaires mettant un terme à leurs traditions pré- Plusieurs chercheurs s’interrogent sur cédentes d’éducation libérale et progres- la frénésie évaluative qui s’est emparée sive. À l’évaluation basée sur le dévelop- de la société. L’évaluation est très sou- pement personnel et des critères diffus, le vent source de comparaison : comparai- modèle de la performance a substitué une son internationale avec les évaluations évaluation basée sur des productions et PISA ; comparaison entre écoles, avec des critères explicites et chiffrés (levels, la publication des rapports d’inspection targets, standards, league tables, value en Angleterre, etc. added, etc.). Aux yeux des chercheurs, ce modèle a favorisé une tension crois- Black et Wiliam (1998) n’ont cessé de sante dans les établissements scolaires, dénoncer les difficultés posées par une le climat de compétition et de concurrence évaluation basée sur des tests, notes et allant de pair avec un accroissement de la comparaisons. L’esprit de compétition violence et de la polarisation sociale sur influe sur tous les acteurs de cette com- fond de moindre solidarité. Ces effets du pétition : les élèves vont fournir des ef- modèle de la performance peuvent s’avé- forts pour le test et au moment du test ; rer ¿nalement contre-productifs à terme, les enseignants vont encourager la mé- y compris sur un plan économique, car morisation et un apprentissage superfi- contradictoires avec l’idéologie d’une so- ciel (mais rentable). La polarisation sur ciété de la connaissance tout au long de les tests nationaux ou internationaux in- la vie, dans la mesure où la satisfaction duit des apprentissages et un enseigne- d’indicateurs de court terme décourage ment a minima (pour afficher un taux de l’apprentissage à plus long terme, parti- réussite correct) l. Les stratégies péda- culièrement pour ceux qui échouent dans gogiques s’en trouvent détournées au l Les technocrates ont leur scolarité initiale. détriment des besoins d’apprentissage « donné de la valeur à ce qu’ils mesuraient des élèves, les objectifs cognitifs sont Finalement, en matière de politique édu- au lieu de mesurer ce survalorisés au détriment d’objectifs de cative, le mauvais alignement entre les à quoi ils donnaient de socialisation plus larges. la valeur » (Hargreaves évaluations en classe et les évaluations & Shirley, 2009, cités standardisées externes à forts enjeux La montée en puissance, depuis les par Muller & Normand, sont susceptibles de saper les efforts 2013). années 1980, d’une demande générale déployés par les enseignants en classe pour que le système éducatif puisse (Looney, 2011). Dans la plupart des pays, « rendre des comptes » publiquement, les formes d’évaluation restent assez tra- régulièrement et à tous les niveaux, ditionnelles, quelles que soient les évo- sur ses performances (accountability), lutions des contenus d’enseignement. a en effet renforcé cette pression à la Elles tendent à concentrer l’attention des production d’indicateurs standardisés, acteurs éducatifs sur un nombre limité de par des examens ou des tests à grande résultats cognitifs : le curriculum implicite échelle, et la polarisation proportion- mais réel est alors singulièrement plus nelle du système éducatif sur ces étroit que le curriculum of¿ciel (Nusche épreuves sommatives qui concentrent et al., 2013). de nombreux enjeux critiques (high stakes testing). Dans la plupart des l’évaluation des politiques conduites par le Pour l’OCDE (Nusche et(cid:1)al., 2013), ministère de l’Éducation nationale ». Per- formance et évaluation sont associées pour des priorités communes à tous évoquer un outil permettant de piloter l’ins- les pays peuvent être définies en titution par les résultats, de piloter l’établis- matière d’évaluation : sement, d’aider les enseignants dans leurs −(cid:1)les différents composants de pratiques et les familles dans leurs attentes. l’évaluation doivent former un tout cohérent pour être effi- La notion de compétitivité n’est jamais très caces dans l’amélioration des loin quand sont évoqués ces dispositifs. La performances éducatives ; notice consacrée à PISA dans Wikipedia −(cid:1)l’évaluation doit être alignée utilise le terme de performance (des sys- par rapport aux objectifs édu- tèmes éducatifs) et évoque les disparités catifs globaux, qui doivent être entre systèmes et entre établissements, ce clairement compris par les qui témoigne d’une vision courante du pro- acteurs de l’éducation ; gramme de l’OCDE. −(cid:1)tous les types d’évaluation devraient avoir une valeur Ces objectifs induisent un emboîtement des éducative (en sus de leur rôle évaluations, rapidement inextricable pour éventuel de contrôle), c’est-à- qui voudrait modi¿er le système de réfé- dire entraîner un clair bénéfice rence : l’évaluation des élèves sert à l’éva- pour les enseignants et les luation des enseignants (et/ou des écoles) élèves ; qui sert à l’évaluation du système (Hadji, −(cid:1)il convient d’éviter les distor- 2012). sions dues aux évaluations La ¿abilité et la validité attachées à ce type standardisées et à l’utilisation d’évaluation quantitative, selon les critères des résultats pour rendre psychométriques habituels, amènent sou- compte de l’efficacité du sys- vent à oublier que cette approche est nor- tème (accountability), l’un des mative plutôt que critériée : le résultat de moyens étant par exemple l’élève est comparé à un groupe plutôt qu’à de veiller à la diversité des un niveau attendu. Ce type d’évaluation approches pour mesurer la contient donc en lui-même un effet de clas- performance éducative ; sement, même s’il peut être canalisé (ano- −(cid:1)la mesure des performances nymat, publicité, etc.), effet peu compatible doit être large, à la fois quali- avec une évaluation des compétences qui tative et quantitative, et cen- impliquerait plutôt une approche critériée trée sur le développement de (Marcoux et al., 2014). l’élève et ses progrès. On constate donc que même dans le cas d’évaluations qui ne sont pas directement liées à une certi¿cation ou des allocations de moyens, la forme de l’évaluation induit Des enquêtes PISA essentiellement lues un regard déformant sur les acquis des à l’aune de la compétitivité apprentissages et contribue en retour à en légitimer certains plus que d’autres, sans deuxième année (CM2) et de la 6e ou Les évaluations nationales ailleurs, du cours préparatoire (CP), ces évalua- entre contrôle et diagnostic tions ont concerné, selon les années, les élèves du primaire ou du collège, voire Ailleurs, d’autres formes d’évaluations de la seconde (en 1989). L’objectif de ces nationales interpellent aussi sur l’utilisa- évaluations était de connaître le degré de tion qui peut en être faite pour améliorer réalisation des objectifs of¿ciels. À la ¿n l’enseignement. Ainsi, aux États-Unis, la des années 1990, les objectifs af¿chent comparaison de cohortes d’élèves de pri- une volonté plus pédagogique, les éva- maire sur quatre ans, au regard de leurs luations de ¿n de primaire deviennent un résultats aux évaluations standardisées « outil pédagogique pour l’enseignant pour en lecture, a montré que les tests basés dé¿nir ses actions de remédiation » l. sur les standards ne procuraient que des l Chaque année en Elles restent un élément de comparai- informations trop pauvres pour établir un 1997, 1998 ou 1999, son sur une décennie, par exemple, diagnostic utile et masquaient une hété- les Notes d’informa- tion du ministère de mais s’accompagnent d’analyses plus rogénéité signi¿cative des causes de mé- l’Éducation nationale poussées sur les facteurs inuant les diocres performances derrière des résul- dressent le tableau des performances et les acquisitions des tats équivalents (Rupp & Lesaux, 2006). profils et compétences élèves, pour une année donnée et par des élèves en mathé- niveau (CE2 et 6e). À partir de 2001, la matiques. direction de la programmation et du dé- Un exemple d’évaluations stan- veloppement quali¿e l’enquête annuelle dardisées et leurs écueils : en (3 000 élèves par an) non pas comme Pennsylvanie un bilan de l’école primaire mais comme une « mise en avant des compétences acquises ou en cours d’acquisition sur lesquelles l’enseignant pourra s’appuyer En Belgique, la scolarité des élèves de la pour élaborer ses programmes » (Note fédération Wallonie-Bruxelles (FWB) d’information, n° 01.59). est rythmée par plusieurs évaluations externes non certi¿catives organisées À qui sont destinées ces évaluations chaque année pour les élèves inscrits en de masse ? Essentiellement au grand 3e et 5e primaire et pour ceux de 3e, 4e ou public et aux enseignants. Pour le grand de 5e année de l’enseignement secon- public, il s’agit de faire le point sur l’état daire. Elles portent successivement sur la des savoirs et savoir-faire des élèves lecture et la production d’écrit, sur les ma- sur certaines compétences. Les compé- thématiques et sur les sciences et l’éveil. tences sont classées en trois grandes Une extension aux langues vivantes est à catégories : compétences de base, com- l’étude. Les résultats de ces évaluations pétences approfondies et compétences n’affectent pas le parcours scolaire des remarquables. L’évaluation va indiquer si élèves ; ils sont mis à la disposition des l’élève ne maîtrise pas les compétences chefs d’établissement et des enseignants de base, s’il maîtrise uniquement celles- à titre diagnostique. À chaque session, le ci, s’il maîtrise aussi les compétences Service général du pilotage du système approfondies et s’il maîtrise en outre les éducatif de la FWB produit des pistes compétences remarquables. En 1998, on didactiques en vue d’aider les équipes présente les scores moyens par champ enseignantes à améliorer la maîtrise des en français et en mathématiques, et on compétences ciblées et à développer une la scolarité dans les grands domaines (da- Pour lui, la notation (ou plus générale- nois, anglais, mathématiques, géographie, ment la démarche sommative) ne devrait biologie, physique-chimie). Les résultats pas concerner des apprentissages en restent con¿dentiels. Ils ne sont publics cours d’acquisition sauf à produire de qu’à leur niveau national agrégé et ne sont l’échec ou de la réussite abusifs. Le pro- communiqué qu’à la famille, sans les résul- cessus d’évaluation consiste à recueillir tats au niveau de la classe ou de l’école, un ensemble d’informations pertinentes à pour éviter toute dérive en termes de pal- confronter, par une démarche adéquate, à marès. L’objectif est de n’utiliser les tests un ensemble de critères cohérents avec le que comme un outil pédagogique pour les référentiel, valides dans l’opérationnalisa- enseignants, en vue d’adapter leurs pra- tion, ¿ables dans l’utilisation. Les résultats l L’agence Skolverket met également à tiques, si nécessaire (Lassen, 2013). de cette confrontation doivent permettre disposition des ensei- une prise de décision cohérente avec la gnants une banque En Suède, les évaluations externes, orga- fonction visée par l’évaluation (il s’agit nationale de tests dans nisées par Skolverket, rythment la scolarité de donner du sens à l’évaluation, aux plusieurs matières et à la grundskola (en 3e, 6e et 9e années), regards des objectifs d’apprentissage, par travaille au déploie- ment d’une plateforme tandis qu’à la gymnasieskola, elles ciblent exemple). pour l’évaluation en chaque année les élèves qui ont terminé ligne. leurs cours de suédois, de mathématiques Qu’est-ce qu’on évalue vraiment? et d’anglais. Le gouvernement étudie actuellement la possibilité d’étendre les On a vu que de nombreuses confu- épreuves à d’autres matières, pour favo- sions sont souvent opérées entre les riser des pratiques d’évaluation plus ho- méthodes d’évaluation qu’on met en mogènes et assurer un meilleur suivi des œuvre à grande échelle pour mesurer élèves l (Endrizzi, 2013). les acquis des élèves et les évaluations pratiquées quotidiennement par les en- DES CONFUSIONS DANS LES seignants. Or, « il apparaît illusoire de USAGES reproduire à l’échelle de la classe des l De Ketele parle aussi démarches de construction et de valida- de fonction de régu- lation. tion d’instruments comparables à ceux « Une évaluation est valide si elle contient employés dans des recherches évalua- des informations rendant possibles des tives au niveau du système » (Tessaro, apprentissages ultérieurs et si les ensei- 2013). Autrement dit, tenter de repro- gnants les utilisent pour ajuster leur ensei- duire PISA dans son école n’est peut- gnement » (Rémond, 2008). être pas une piste très féconde. Des fonctions à préciser On estime aussi de façon implicite que l’évaluation scolaire n’évalue que les ap- Comme l’explique De Ketele, on peut dis- prentissages dispensées explicitement tinguer trois fonctions différentes de l’éva- par les enseignants : l’évaluation ne por- luation, qui préparent toutes une prise de terait donc que sur ce qui a été ensei- décision : la fonction certi¿cative (échec ou gné : discipline et programme effectif. réussite), la fonction formative (pour amé- Pourtant, la recherche a montré qu’éva- liorer les apprentissages) l et la fonction luer signi¿e bien souvent aussi évaluer d’orientation (pour préparer une nouvelle autre chose, que l’on désigne parfois par action). On constate bien souvent que les le concept de « curriculum caché », pour Par ailleurs, on peut se demander dans et de redoublements » (Serres, 2014). quelle mesure il faut prendre en compte Pourtant, Barrère (2014) constate que l’ensemble des savoirs, compétences de nombreux enseignants vivent l’éva- et habiletés acquises par les élèves, à luation comme une corvée, symbolisée l’occasion de la vie scolaire (voyages par les paquets de copie, et comme scolaires, stages, débat sur la note de une zone d’activité à contingenter vie scolaire, participation aux activités pour qu’elle ne prenne pas le pas sur associatives dans l’établissement, aux les autres activités d’enseignement. instances de représentation, etc.) ou Confrontés au dilemme d’être entraî- à côté de la vie scolaire (engagement neur ou arbitre, les enseignants ne citoyen, activités bénévoles, projets ex- vivent pas toujours très bien leur rôle trascolaires ou parascolaires, etc.). d’évaluateur (Merle, 1998). Le développement des expériences de Ils reprochent aux élèves de donner trop webfolio en France constituent un pas de poids aux évaluations… reproche vers la prise en compte de ce qui est que les élèves leur retournent volon- maîtrisé par la personne, au-delà du tiers ! Pour ces derniers, l’évaluation, cadre et des seules disciplines sco- loin d’être une seule routine technique, laires (voir par exemple l’expérience du est toujours une épreuve qui met en lycée pilote innovant international de jeu la reconnaissance de la personne, Poitiers). Le webfolio à la française est même quand ils affectent une certaine néanmoins essentiellement conçu, pour désinvolture ou revendiquent leur stig- l’instant, dans une perspective d’aide à matisation par les résultats dans une l’orientation et au projet professionnel. sorte de « renversement héroïque » (Barrère, 2009). Ainsi, une « mauvaise » note ou une évaluation ratée peut rapi- Un sujet fréquent de malentendus entre dement générer une blessure affective, car l’évaluation de la personne est sou- élèves et enseignants vent, à tort ou à raison, perçue derrière l’évaluation du travail scolaire. Chacun a intégré plus ou moins consciemment que l’évaluation déborde En outre, le « contrat » qui préside largement sa fonction de « diagnostic » aux normes d’évaluation est souvent ou de « certification » pour imprégner opaque aux yeux des élèves : il n’est l’ensemble de la vie pédagogique. pas toujours évident de comprendre par exemple que l’injonction à l’expression Il suffit par exemple de constater que personnelle (« ne pas répéter bête- les élèves ajustent souvent leurs efforts ment ») ne signifie pas donner « son à la présence (ou non) d’évaluations et opinion », ou que l’existence de critères orientent leur attention en fonction des pour juger de la qualité d’un travail ne épreuves finales. Cet « effet en retour » revient pas à additionner les points des des évaluations sommatives (joliment différentes parties pour calculer la note appelé backwash effect en anglais) est finale. bien connu, mais le malentendu per- dure : on fait toujours comme si l’éva- Certains élèves ne comprennent pas luation arrivait de façon « autonome » non plus que la pression scolaire récur- après l’apprentissage, alors qu’elle fa- L’ÉVALUATION SOUS L’EMPRISE évolue de par la phase d’évaluation, etc. DE LA MESURE (Cardinet, 1989). La théorie de la généra- lisabilité distingue donc quatre différencia- tions : des élèves (mesure de leurs diffé- Les théories de l’évaluation ont d’abord rences) ; des objectifs et domaines d’en- longtemps été caractérisées par la re- seignement ; des conditions d’apprentis- cherche de la « bonne » mesure, même sage ; des niveaux d’apprentissage. si actuellement, cette notion de mesure absolue semble moins centrale dans le Rapprochant évaluation formative et ap- processus d’évaluation. proche par compétences, Scallon (2007) propose de construire une grille permettant Des efforts de modélisation... d’évaluer le degré d’acquisition des com- pétences. Composée « d’échelles descrip- tives » plus ou moins nombreuses, plus ou Les tentatives de modélisation de l’éva- moins détaillées, cette grille suppose de luation ne manquent pas. Divers cadres dé¿nir clairement les caractéristiques des théoriques ont été proposés pour tenter compétences et productions attendues une adéquation entre analyse des tâches puis d’associer à chacun de ces éléments d’apprentissage et dé¿nition des objectifs. descriptifs un niveau de qualité correspon- Il faut resituer les premières analyses du dant à des étapes ou niveaux de progres- début du XXe siècle dans le contexte de sion. On verra plus loin en quoi ces élé- l’époque, alors que l’évaluation ne s’enten- ments apparemment normatifs s’inscrivent dait que comme sommative ou certi¿ca- dans une stratégie d’évaluation pour les tive. Évaluer consistait à mesurer. Dès la apprentissages. ¿n des années 1930, le constat d’un écart important entre correcteurs des épreuves … à la critique de la mesure du baccalauréat a motivé la recherche de mesures plus équitables. Contrairement à ce que pouvaient en pen- En simpli¿ant grandement, on peut tout ser les premiers évaluateurs et les pre- d’abord évoquer l’approche psychomé- miers docimologues, mesurer n’est pas trique (Binet, Cronbach) qui cherche à synonyme d’évaluer. « La mesure peut mesurer les performances des élèves par être un instrument ef¿cace pour traiter une rapport à une moyenne générale (mesure information nombreuse, devant être agré- relative) ou par rapport à l’écart au seuil gée, et comparée sur un large territoire de maîtrise (mesure absolue). par exemple » (Mottier Lopez, 2013). Mais l’évaluation des apprentissages ne peut se L’approche édumétrique va tenter ensuite réduire à un objet technique et statistique. d’adapter la théorie de la généralisabi- Dans les faits, l’évaluation a-t-elle une va- lité de Cronbach, en prenant en compte leur intrinsèque ou extrinsèque ? Que signi- d’autres facteurs (les individus, les ques- ¿e vraiment le point vert (acquis), orange tions posées, les phases d’apprentissage) (en cours d’acquisition), rouge (non acquis) et en introduisant la notion de progrès ou un 12/20 dans telle ou telle matière ? et de marge d’erreur. Pour autant, cette Atteindre la moyenne signi¿e-t-il maîtriser approche reste très statistique et ne per- l’essentiel ou être sur le chemin de sa maî- met toujours pas de prendre en compte trise ? Que signi¿e une moyenne qui agglo- la diversité des élèves, d’une part, et de propres à rendre l’évaluation aussi objec- COMMENT EN EST-ON ARRIVÉ tive que possible » (Rey, 2012), là où cer- À L’« ÉVALUATION TRIAGE » ? tains y verraient de l’arbitraire. L’instruction est pendant longtemps res- On constate aujourd’hui en France, dans tée relativement éloignée des préoccu- les textes of¿ciels, la prise en compte de pations de l’évaluation normée. En fait, certaines critiques et la recherche d’une jusqu’à la ¿n du Moyen-Âge, le modèle évaluation qui ne se cantonne pas à la dominant était le modèle humaniste très fonction de mesure ex-post des appren- lié au préceptorat, pour lequel le contrôle tissages. « Dans l’enseignement primaire, et la mesure n’étaient pas une nécessité. l’évaluation sert à mesurer la progression Seule une élite restreinte avait alors ac- de l’acquisition des compétences et des cès à l’instruction. connaissances de chaque élève. Cette logique d’évaluation est aussi encouragée Avec l’ouverture relative de l’instruction dans l’enseignement secondaire » (Loi au-delà de la noblesse et du clergé, les d’orientation et de programmation pour la jésuites, au XVIe siècle, imaginent une refondation de l’école de la République, évaluation notée et une uniformisation 8 juillet 2013, art. 34). éducative, avec un objectif essentielle- ment idéologique (conquérir les esprits). Dans l’annexe de la loi de programma- L’évaluation est alors plus destinée à for- tion de 2013, un paragraphe est consa- ger des âmes catholiques qu’à connaître cré à l’évaluation et à la nécessité de faire le niveau de chacun. évoluer les modalités d’évaluation et de notation des élèves : « pour éviter une C’est le passage au modèle collectif de la “notation-sanction” à faible valeur pédago- classe à partir de la ¿n du XVIIe siècle, qui gique et privilégier une évaluation positive, amène avec lui le besoin de domestiquer simple et lisible, valorisant les progrès, le corps, de le discipliner, d’assurer une encourageant les initiatives et compréhen- surveillance dans le cadre d’une trans- sible par les familles. En tout état de cause, mission de masse selon un modèle qui l’évaluation doit permettre de mesurer le introduit l’idée d’honnête émulation entre degré d’acquisition des connaissances et élèves. « Ce qui caractérise la pédagogie des compétences ainsi que la progression des Jésuites, c’est la discipline, la répé- de l’élève. Il faut aussi remédier à la dif¿- tition et la concurrence perpétuelle entre culté pour les enseignants d’évaluer les les élèves » (Maulini, 2003). élèves avec des dispositifs lourds et peu coordonnés entre eux. Ainsi, l’évolution Parallèlement, le modèle élitiste se des modalités de notation passe notam- déploie sous l’inuence du mandarinat ment par une réforme du livret personnel chinois, marqué par la méritocratie par de compétences actuel, qui est trop com- concours pour la sélection des admi- plexe, et une diversi¿cation des modalités nistrateurs de l’Empire. Le classement de l’évaluation ». devient une donnée essentielle pour juger un élève au sein d’une hiérarchie Actuellement, la note est encore centrale donnée (la classe, le groupe, l’établisse- dans les dispositifs d’évaluation et les diffé- ment, etc.). rentes parties prenantes du système édu- catif attachent toujours une certaine impor-
Description: