UNIVERSITE SORBONNE NOUVELLE - PARIS 3 École Doctorale 268 – Langage et Langues : description, théorisation, transmission UMR 8094 – Langues, Textes, Traitements informatiques, Cognition (LATTICE) Thèse de doctorat en sciences du langage (VOLUME 1) présentée par Clive E. HAMILTON CARTOGRAPHIE DES ERREURS EN ANGLAIS L2 : VERS UNE TYPOLOGIE INTÉGRANT SYSTÈME ET TEXTE dirigée par Shirley CARTER-THOMAS Soutenue le 4 décembre 2015 Jury : M. David BANKS : Professeur émérite, Université de Bretagne Occidentale Mme. Shirley CARTER-THOMAS : Professeur des universités, Télécom Ecole de Management ; Université Sorbonne Nouvelle Mme. Natalie KÜBLER : Professeur des universités, Université Paris Diderot M. Frédéric LANDRAGIN : Directeur de recherche, CNRS ; Université Sorbonne Nouvelle M. John OSBORNE : Professeur des universités, Université de Savoie (Chambéry) Résumé L’objectif principal de ce travail est d’explorer la frontière entre les erreurs grammaticales d'une part et les erreurs textuelles d'autre part, dans les productions écrites des étudiants francophones rédigeant en anglais langue étrangère (L2) à l’université. Pour ce faire, un corpus de textes d’apprenants en anglais L2 a été recueilli et annoté par le biais de plusieurs schémas d’annotation. Le premier schéma d’annotation est issu de l’UAM CorpusTool, un logiciel qui fournit une taxonomie d’erreurs intégrée. Les premières annotations ont été croisées avec d’autres annotations issues des métafonctions sémantiques que nous avons établies, en nous appuyant sur la linguistique systémique fonctionnelle. En plus de fournir des statistiques en termes de fréquence d’occurrence des erreurs spécifiques chez les apprenants francophones, le croisement des schémas a permis d’identifier certaines valeurs proprement phraséologique, sémantique et textuelle qui semblent poser des problèmes particulièrement épineux. A ce titre, une classification de ce que nous avons appelé des erreurs d’acceptabilité textuelle a été établie, dans le but notamment d’avoir une vue globale sur les erreurs identifiables à ce niveau d’analyse. En bref, le présent travail retrace donc le cheminement de l’ensemble de notre thèse de ses débuts conceptuels jusqu’à la proposition d’un modèle explicatif permettant d’établir la description de toute occurrence erronée identifiée en langue étrangère – qu’elle soit notamment grammaticale (c’est-à-dire, imputable au système linguistique) ou textuelle (c’est-à-dire, imputable au texte). Mots clés : corpus d’apprenants, erreurs d’apprenant, linguistique systémique fonctionnelle, grammaticalité, acceptabilité, anglais de spécialité ii Abstract The main objective of this study is to try and pinpoint the frontier between grammatical (or sentence-level) errors on the one hand and textual errors on the other in university student essays. Accordingly, a corpus of English L2 learner texts, written by French learners, was collected and annotated using several annotation schemes. The first annotation scheme used is based on a model from the UAM CorpusTool software package, which provided us with an integrated error taxonomy. The annotations obtained were then cross-analyzed using the semantic metafunctions identified in systemic functional linguistics. In addition to providing statistics in terms of specific error frequency, our cross analysis has identified some areas that appear to pose particularly difficult problems, i.e. phraseology, and certain semantic and textual constructions. A classification of what we have called textual acceptability errors has thus been established. In short, the thesis begins with an examination of conceptual issues and ends with the proposal for an explanatory model that can describe erroneous occurrences identified in a foreign language – whether they are grammatical (i.e., linked to the language system itself) or textual (i.e. linked to the text) in nature. Keywords: learner corpus, learner errors, grammaticality, acceptability, English for Specific Purposes, systemic functional linguistics iii Remerciements Qu’il me soit en premier lieu permis de remercier Shirley Carter-Thomas, ma directrice de thèse, d’avoir accepté de diriger ce travail. Que Frédéric Landragin trouve également l’expression de ma reconnaissance d’avoir été mon co-encadrant. L’intérêt qu’ils ont tous les deux témoigné pour mes recherches, leurs disponibilités sans faille, leurs rigueurs scientifiques et nos échanges fréquents m’ont permis de cultiver un esprit critique et de porter ce projet à terme. En second lieu, qu’il me soit permis de remercier David Banks, Natalie Kübler et John Osborne d’avoir accepté de faire partie de mon jury de thèse et de m’avoir ainsi témoigné leur confiance. Plus personnellement, je voudrais remercier toutes les personnes qui m’ont apporté une aide technique ou matérielle notamment : - les étudiants en première année de licence LSO de l’université Paris Dauphine (promotion, 2011) : d’avoir accepté de participer à l’étude - Lise Fontaine, Cassandra Bartlett, Danielle McShine et Shirley Carter-Thomas : d’avoir accepté d’être des annotateurs indépendants - Karolina Krawczak : d’avoir accepté de vérifier certains de mes tests et mes calculs - Samuel Arrindell, Charmaine Gabriel, Christophe Naejus et tout particulièrement Bernard Frouin : d’avoir accepté de faire des relectures et d’apporter des suggestions/conseils Enfin, une pensée particulière à mes co-équipiers du laboratoire LaTTiCe, mes amis et ma famille pour leurs soutien moral. iv Sommaire LISTE DES SIGLES, ABREVIATION ET CONVENTIONS .................................................................................. IX LISTE DES FIGURES .................................................................................................................................................... X LISTE DES TABLEAUX ............................................................................................................................................ XII INTRODUCTION ............................................................................................................................................................ 1 0.1 Objectif de notre de thèse ................................................................................................................................... 1 0.2 Objectifs et enjeux de l’analyse des erreurs ....................................................................................................... 5 0.3 Organisation de la thèse ..................................................................................................................................... 7 (CHAPITRE I) GENESE D’UN COURANT EPISTEMOLOGIQUE : FOCUS SUR L’UNITE LEXICALE ......................................... 11 1.1 L’étude de l’erreur en sciences humaines et sociales ....................................................................................... 12 1.2 L’erreur comme objet linguistique ................................................................................................................... 14 1.2.1 En langue maternelle ................................................................................................................................................... 16 1.2.1.1 Wilson (1909, 1920-29) ......................................................................................................................................... 17 1.2.1.2 Frei (1929) ............................................................................................................................................................. 22 1.2.2 En langue étrangère ..................................................................................................................................................... 25 1.2.2.1 Palmer (1917, 1921, 1924, …) .............................................................................................................................. 26 1.2.2.2 Corder (1967, 1971a, 1971b, …) ........................................................................................................................... 28 1.2.2.3 James (1998).......................................................................................................................................................... 33 1.3 Quelques définitions et taxonomies résultantes ................................................................................................ 34 1.3.1 Erreur, faute et écart .................................................................................................................................................... 35 1.3.2 Interférence, interlangue et transfert ............................................................................................................................ 37 1.3.3 Tendance actuelle : vers une approche textuelle de l’erreur ........................................................................................ 38 (CHAPITRE II) GENESE D’UN COURANT DIDACTIQUE : FOCUS SUR L’UNITE TEXTE ..................................................... 41 2.1 Réflexion métalinguistique ................................................................................................................................ 42 2.1.1 Connaissances grammaticales explicites ..................................................................................................................... 42 2.1.2 Maturité syntaxique ..................................................................................................................................................... 44 2.2 Réflexion sur les pratiques discursives culturelles ........................................................................................... 45 2.2.1 Rhétorique contrastive ................................................................................................................................................. 46 2.2.2 L’ancrage des styles intellectuels institutionnalisés..................................................................................................... 47 2.2.2.1 L’apport de Clyne & de Mauranen ........................................................................................................................ 48 2.2.2.2 L’écrit comme reader-oriented ou writer-oriented ............................................................................................... 52 2.3 Réflexion sur la textualisation .......................................................................................................................... 53 2.3.1 L’influence des genres textuels ................................................................................................................................... 54 2.3.2 Cohérence et cohésion ................................................................................................................................................. 55 2.3.3 Vers une compétence textuelle .................................................................................................................................... 58 (CHAPITRE III) L’APPORT DE LA LINGUISTIQUE SYSTEMIQUE FONCTIONNELLE ............................................................ 65 3.1 Qu’est-ce que la linguistique systémique fonctionnelle (LSF) ? ....................................................................... 65 3.1.1 L’origine de la théorie systémique .............................................................................................................................. 66 3.1.2 L’application de la théorie ........................................................................................................................................... 70 3.2 Le modèle architectural de la langue en LSF ................................................................................................... 72 v 3.2.1 La stratification ........................................................................................................................................................... 72 3.2.2 L’instanciation ............................................................................................................................................................. 74 3.2.3 L’ordre syntagmatique (structure) ............................................................................................................................... 76 3.2.4 L’ordre paradigmatique (système) ............................................................................................................................... 79 3.2.5 Les métafonctions........................................................................................................................................................ 82 3.3 Quelques cas d’utilisations de la LSF réalisés avec corpus ............................................................................. 94 3.3.1 En didactique des langues maternelles et étrangères ................................................................................................... 95 3.3.2 En recherche et modélisation linguistique ................................................................................................................. 100 3.4 L’apport de la LSF à notre étude .................................................................................................................... 101 (CHAPITRE IV) LE CADRE METHODOLOGIQUE ............................................................................................................ 105 4.1 L’avènement informatique .............................................................................................................................. 106 4.1.1 Le cas de la linguistique de corpus ............................................................................................................................ 107 4.1.1.1 Recueil de données authentiques et comparables ................................................................................................ 109 4.1.1.2 La « montée en puissance » des corpus d’apprenants .......................................................................................... 112 4.1.2 Le cas de la linguistique outillée : outils d’analyse et d’annotation ........................................................................... 115 4.1.2.1 Les outils d’analyse ............................................................................................................................................. 116 4.1.2.2 Les outils d’annotation ........................................................................................................................................ 119 4.1.2.3 La validité des annotations .................................................................................................................................. 120 4.1.3 L’apport de ces deux branches complémentaires à notre analyse .............................................................................. 121 4.2 Recueil et traitement du corpus ...................................................................................................................... 121 4.2.1 Le besoin d’un corpus propre : les étapes préparatoires ............................................................................................ 122 4.2.1.1 Pré-enquête : préparation du terrain..................................................................................................................... 123 4.2.1.2 Questionnaire sur l’historique langagier : étude pilote et distribution ................................................................. 124 4.2.1.3 Les sujets-participants : groupe d’essai et sélection élargie ................................................................................. 126 4.2.1.4 Les copies d’examen : contexte de rédaction, collecte et tri ................................................................................ 128 4.2.2 Traitement des données : numérisation, saisie de textes et anonymisation ................................................................ 128 4.2.3 Logiciels et schémas d’annotation d’erreurs.............................................................................................................. 129 4.2.3.1 Le logiciel d’annotation d’UAM CorpusTool ..................................................................................................... 130 4.2.3.2 Les modèles exploratoires issus des métafonctions LSF ..................................................................................... 134 4.2.4 La répartition du corpus final en quatre sous-ensembles ........................................................................................... 136 4.3 Les test d’accord inter-annotateurs ................................................................................................................ 137 4.3.1 Le degré de fiabilité des annotations : tests d’accord inter-annotateurs ..................................................................... 137 4.3.2 Est-ce bien une erreur ? Quelle concordance entre annotateurs ? .............................................................................. 139 4.3.3 L’étiquetage des erreurs : quelle fiabilité entre annotateurs ? .................................................................................... 141 4.3.4 L’étiquetage issu de la linguistique systémique fonctionnelle est-il fiable ? ............................................................. 141 4.3.5 Le bilan de l’ensemble des tests d’accord inter-annotateurs ...................................................................................... 143 (CHAPITRE V) RESULTATS DES ERREURS DU SYSTEME LINGUISTIQUE ........................................................................ 145 5.1 Les schémas d’annotation d’UAM CorpusTool v.2.8 ..................................................................................... 146 5.1.1 Les erreurs lexicales .................................................................................................................................................. 148 5.1.1.1 « Spelling errors » ............................................................................................................................................... 149 5.1.1.2 « False-friend errors » ......................................................................................................................................... 150 5.1.1.3 « Coinage errors » ............................................................................................................................................... 150 5.1.1.4 « Borrowing errors » ........................................................................................................................................... 151 5.1.1.5 « Other word choice errors » ............................................................................................................................... 152 vi 5.1.1.6 « Vocabulary errors » .......................................................................................................................................... 153 5.1.2 Les erreurs grammaticales ......................................................................................................................................... 153 5.1.2.1 « Np-error » ......................................................................................................................................................... 155 5.1.2.2 « Vp-error » ......................................................................................................................................................... 162 5.1.2.3 « Prep-phrase-error » ........................................................................................................................................... 166 5.1.2.4 « Clause error » ................................................................................................................................................... 168 5.1.2.5 « Les autres erreurs grammaticales » ................................................................................................................... 170 5.1.3 Les erreurs de ponctuation ......................................................................................................................................... 171 5.2 Le schéma expérientiel : problème de transitivité .......................................................................................... 173 5.2.1 Les erreurs de procès ................................................................................................................................................. 174 5.2.2 Les erreurs de participants ......................................................................................................................................... 176 5.2.3 Les erreurs de circonstance........................................................................................................................................ 177 5.2.4 Le bilan des annotations du schéma expérientiel ....................................................................................................... 178 5.3 Le schéma textuel ............................................................................................................................................ 180 5.4 Le bilan des annotations d’erreurs du système linguistique ........................................................................... 183 (CHAPITRE VI) RESULTATS DES ERREURS TEXTUELLES ............................................................................................. 185 6.1 Les erreurs textuelles du schéma d’annotation UAM (volet 1) ....................................................................... 186 6.1.1 Les erreurs pragmatiques ........................................................................................................................................... 186 6.1.1.1 « Pragmatic-error → erreurs de cohésion » ......................................................................................................... 186 6.1.1.2 « Pragmatic-error → erreurs de cohérence » ....................................................................................................... 188 6.1.1.3 « Pragmatic-error → erreurs de registre » ........................................................................................................... 190 6.1.2 Les erreurs de mise en phrase .................................................................................................................................... 190 6.1.3 Les erreurs de connecteur .......................................................................................................................................... 193 6.1.4 Les chevauchements entre système et texte ............................................................................................................... 194 6.2 Les erreurs textuelles (volet 2) ........................................................................................................................ 195 6.2.1 La catégorisation des erreurs d’acceptabilité textuelle .............................................................................................. 195 6.2.2 Le schéma expérientiel appliqué aux erreurs d’acceptabilité textuelle ...................................................................... 205 6.2.3 Le schéma interpersonnel appliqué aux erreurs d’acceptabilité textuelle .................................................................. 208 6.2.4 Le schéma textuel appliqué aux erreurs d’acceptabilité textuelle .............................................................................. 212 6.3 Le bilan des erreurs textuelles ........................................................................................................................ 214 (CHAPITRE VII) L’INFLUENCE DU TEMPS ET DES CONTACTS LINGUISTIQUES SUR LES ERREURS ................................. 217 7.1 L’incidence des contacts linguistiques ............................................................................................................ 218 7.1.1 Commencer l’anglais à la maternelle ou au collège : quels avantages ? .................................................................... 218 7.1.2 Séjourner en pays anglophones : quel bilan ? ............................................................................................................ 220 7.2 Les liens de causalité avec la langue maternelle ............................................................................................ 227 7.2.1 L’influence de la langue française sur l’anglais ........................................................................................................ 227 7.2.2 Les limites de la notion de transfert et d’interférence ................................................................................................ 231 7.2.3 Vers la réhabilitation de l’interlangue ....................................................................................................................... 233 7.3 Bilan de l’influence du temps et des différentes rencontres linguistiques ....................................................... 234 (CHAPITRE VIII) CONCLUSION : TYPOLOGIE DES ERREURS REVISITEE ET PERSPECTIVES............................................ 237 8.1 Synthèse des principaux résultats et leurs implications didactiques .............................................................. 238 8.1.1 Volet 1 (Les erreurs du système linguistique) ........................................................................................................... 238 8.1.2 Volet 2 (Les erreurs d’acceptabilité textuelle) ........................................................................................................... 240 vii 8.1.3 Synthèse .................................................................................................................................................................... 241 8.2 Quelques observations notables ..................................................................................................................... 242 8.2.1 Les problèmes de calculs sémantiques ...................................................................................................................... 242 8.2.1.1 La concordance des temps et des auxiliaires modaux .......................................................................................... 243 8.2.1.2 L’accord en nombre : SN tête (PR1 et PR2) ........................................................................................................ 245 8.2.1.3 Les problèmes des chaînes de référence .............................................................................................................. 247 8.2.2 Les erreurs de mise en phrase .................................................................................................................................... 248 8.2.2.1 Les erreurs de phraséologie lexicale .................................................................................................................... 249 8.2.2.2 Les erreurs de parataxe et les structures asyndétiques ......................................................................................... 251 8.2.3 Quelques réflexions sur les résultats .......................................................................................................................... 252 8.3 Des comparaisons avec d’autres études et notre modèle de restructuration .................................................. 254 8.3.1 L’interface entre erreurs lexicales, syntaxiques et sémantiques ................................................................................ 254 8.3.1.1 Les erreurs lexicales ............................................................................................................................................ 254 8.3.1.2 Les erreurs morphosyntaxiques ........................................................................................................................... 257 8.3.1.3 Les erreurs sémantiques....................................................................................................................................... 260 8.3.2 Vers une restructuration [de la prise en charge] des erreurs ...................................................................................... 261 8.4 Limites et perspectives .................................................................................................................................... 265 8.4.1 Rédaction en langue étrangère : un défi multifactoriel .............................................................................................. 266 8.4.2 Limites et l’étude et pistes pour la suite .................................................................................................................... 270 BIBLIOGRAPHIE ....................................................................................................................................................... 276 ANNEXES ..................................................................................................................................................................... 294 A2.1 Lés résultats obtenus du questionnaire ........................................................................................................ 297 A2.1.1 Les précisions sociodémographiques ...................................................................................................................... 297 A2.1.2 Les parcours linguistiques institutionnels ............................................................................................................... 302 A2.1.3 Les contacts linguistiques ampliatifs ...................................................................................................................... 306 A2.2 Le bilan du questionnaire ............................................................................................................................. 307 viii Liste des sigles, abréviation et conventions ARCTA Aide à la Rédaction de Textes en Anglais (ARCTA) AE ; EA Analyse d’erreurs ; Error analysis ANGLISH corpus Corpus de données comparatives de l’anglais lu, répété et parlé en L1 & L2 B1, B2 ; C1, C2 Approximativement niveau intermédiaire et avancé, selon le CECRL CECRL Cadre européen commun de référence pour les langues CEFLE Corpus Corpus Écrit de Français Langue Étrangère Dire Autrement Corpus de textes de types variés produits par les apprenants de français L2 EFL English as a Foreign Language FLLOC Corpus French Learner Language Oral Corpora FRIDA French Interlanguage Database IBLC Indianapolis Business Learner Corpus ICLE International Corpus of Learner English KWIC key-word-in-context L1 (LM), L2, L3 Langue maternelle, langue étrangère, troisième langue étrangère LANSAD Langues pour Spécialistes d'Autres Disciplines LLC London-Lund Corpus LP Learner Profile LSF linguistique systémique fonctionnelle métafonctions métafonctions sémantiques ( ? à garder, ou pas ?) MeLLANGE Multilingual eLearning in Language Engineering MR.I – MR.IV (Méta)règles de bonne formation textuelle NLP Natural language processing POS part-of-speech SCG Scale and Category Grammar Scientext Ensemble de quatre sous-corpus : 2 en anglais L1 & L2 ; 2 en français SEU Survey of English Use TAL Traitement automatique des langues TREACLE Teaching Resource Extraction from an Annotated Corpus of Learner English T-unit Minimal terminable units UAM UAM CorpusTool : le logiciel utilisé pour effectuer les annotations USE corpus Uppsala Student English Corpus Volet 1 Premier volet d’annotation : recueil des erreurs du système linguistique Volet 2 Deuxième volet d’annotation : recueil des erreurs textuelles WriCLE Written Corpus of Learner English « * » Signale le caractère erroné d’une occurrence à l’étude « […] » Signale le caractère interrompu de la phrase « [sic] » Signale une erreur qui n’est pas prise en compte dans l’analyse « $...$ » Signale une possibilité de correction « $♯♯$ » Signale qu’une seule réponse ne peut être clairement inférée «(??)» Signale qu’un doute persiste vis-à-vis d’un mot dans la version numérisée. Le mot en question est retranscrit, suivi de deux points d’interrogation : « mot(??) » (cf. Annexe : A6) « (????)» Signale l’illisibilité totale d’un mot dans la version numérisée. Le mot n’est donc pas retranscrit. (cf. Annexe : A6) ix Liste des figures Figure 1: Language Competence de Lyle Bachman (1990) ........................................................................................ 60 Figure 2 : La compétence textuelle de Heribert Rück (1991) ..................................................................................... 61 Figure 3 : Les influences principales de la linguistique systémique fonctionnelle .................................................... 69 Figure 4 : La schématisation grammaticale ................................................................................................................. 71 Figure 5 : Un exemple de stratification dans la production en L2 ............................................................................. 73 Figure 6 : L'axe d'instanciation de Halliday& Matthiessen 2004 (reprise et adaptée par Matthiessen 2007) ...... 75 Figure 7 : Le regroupement des axes d’instanciation et de stratification (Halliday 2002, Matthiessen 2007) ....... 76 Figure 8: Les deux axes en grammaire traditionnelle ................................................................................................. 79 Figure 9 : Une conceptualisation en LSF montrant les deux axes en opposition ...................................................... 80 Figure 10 : Schématisation de la phrase interrogative en anglais .............................................................................. 81 Figure 11 : Cheminement hypothétique des différentes conditions d’entrée de la langue ....................................... 81 Figure 12 : Schéma simplifié des constituants de la Transitivité ............................................................................... 87 Figure 13 : Le système de mode en LSF ....................................................................................................................... 90 Figure 14 : Exemple d’analyse interpersonnelle .......................................................................................................... 91 Figure 15 : le système de métafonction textuelle.......................................................................................................... 93 Figure 16 : La conceptualisation du genre, adapté de Martin (2003) ........................................................................ 98 Figure 17 : L’interface d’UAM CorpusTool illustrant des schémas d’annotation exploités dans notre étude .... 131 Figure 18 : La structure de base du modèle d'UAM ................................................................................................. 132 Figure 19 : La structure de base du modèle d’ICLE ................................................................................................. 132 Figure 20 : Le 2ème niveau de profondeur du modèle ICLE (intégré à l’UAM CorpusTool, v.2.8)..................... 133 Figure 21 : Le 2ème niveau de profondeur du modèle d’UAM ................................................................................ 134 Figure 22 : Le schéma d'annotation n°2 (niveau interpersonnel) ............................................................................ 135 Figure 23 : Le schéma d'annotation n°3 (niveau textuel) ......................................................................................... 135 Figure 24 : Le schéma d'annotation n°1 (niveau expérientiel) ................................................................................. 136 Figure 25 : Calcul et résultat du test de student ......................................................................................................... 147 Figure 26 : L'écart relatif des erreurs grammaticales entre les semestres .............................................................. 155 Figure 27: L’écart observé entre sm1 et sm2 dans le groupe verbal ........................................................................ 163 Figure 28 : La comparaison entre semestres des erreurs prépositionnelles ............................................................ 166 Figure 29 : L'écart relatif des erreurs de procès entre les semestres ....................................................................... 175 Figure 30 : L'écart relatif des erreurs des participants entre les semestres ............................................................ 176 Figure 31 : L'écart relatif des erreurs circonstancielles entre les semestres ........................................................... 177 Figure 32 : Mise en rapport graphique des erreurs au niveau expérientiel ............................................................ 179 Figure 33 : La distribution schématique des erreurs de thème ................................................................................ 181 Figure 34 : Le schéma expérientiel au service des erreurs textuelles ....................................................................... 207 Figure 35 : Le schéma interpersonnel au service des erreurs textuelles .................................................................. 209 Figure 36 : Le schéma textuel au service des erreurs textuelles ............................................................................... 213 Figure 37 : l'influence d'un apprentissage précoce ................................................................................................... 219 Figure 38 : L'évolution semestrielle (E+CLR, F-CLR, F+CLR) (volet 1) ............................................................... 221 Figure 39 : L'évolution semestrielle des erreurs d’acceptabilité textuelle (E+CLR, F-CLR, F+CLR) (volet 2) .. 223 x
Description: