ebook img

Modélisation computationnelle de l'interprétation cognitive des expressions numériques appr PDF

216 Pages·2017·3.9 MB·French
by  
Save to my drive
Quick download
Download
Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.

Preview Modélisation computationnelle de l'interprétation cognitive des expressions numériques appr

E´cole Doctorale Informatique, T´el´ecommunications et El´ectronique (Paris) “How much is ‘about’ ?” Mod´elisation computationnelle de l’interpr´etation cognitive des expressions num´eriques approximatives ` THESE pr´esent´ee et soutenue publiquement le 19 septembre 2017 pour l’obtention du Doctorat de l’Universit´e Pierre et Marie Curie (mention intelligence artificielle) par S´ebastien Lefort Composition du jury Jean Baratgin Rapporteur Olivier Pivert Rapporteur Jean-Franc¸ois Bonnefon Examinateur Jean-Gabriel Ganascia Examinateur Marie-Jeanne Lesot Directrice de th`ese Elisabetta Zibetti Codirectrice de th`ese Marcin Detyniecki Codirecteur de th`ese Charles Tijus Codirecteur de th`ese Laboratoire d’Informatique de Paris 6 - UMR7606 Laboratoire CHArt-LUTIN - EA4004 Résumé Nos travaux portent sur les Expressions Numériques Approximatives (ENA), définies comme des expressions linguistiques impliquant des valeurs numériques et illustrées par des exemples tels que “environ 100”. Nous nous intéressons d’abord à l’interprétation des ENA non contextualisées, définie commeladéterminationdelasignificationdelaportéedumodificateurnumériqueenviron, à la fois dans ses aspects humain et computationnel. Plus spécifiquement, après avoir défini et formalisé les dimensions arithmétiques et cognitive pertinentes permettant de caractériser les ENA, nous avons conduit une étude empirique pour collecter les intervalles correspondant aux plages de valeurs dénotées de 24 ENA. Nous montrons ainsi que les dimensions que nous proposons sont impliquées dans l’interprétation des ENA et qu’elles rendent mieux compte des intervalles collectés que les modèles existant dans la littérature. Cesrésultats nousconduisent, dansun deuxième temps,à proposer unprincipegénéral d’interprétation des ENA impliquant des nombres naturels, fondé sur l’hypothèse d’un compromis entre la saillance cognitive des bornes des intervalles et leur distance à la valeur numérique de référence impliquée dans l’ENA considérée. Ce principe général est ensuite instancié dans deux types de modèles computationnels. Le premier est conçu pour estimer l’intervalle de valeurs dénotées par une ENA alors que le second génère un intervalle flou représentant l’imprécision qui lui est associée. Ces modèles sont validés expérimentalement à partir des données collectées et nous montrons qu’ils offrent de meilleures performances que les modèles d’interprétation existants. Nous montrons également l’intérêt du modèle flou d’interprétation des ENA que nous proposons en l’implémentant dans le cadre de moteursderequêtesflexibles.Enfin,nousproposonsuneextensiondesmodèlespermettant d’interpréter des ENA impliquant des nombres décimaux. Nousavonségalementconduituneétudepourexaminerl’effetd’uncontextesémantique et les différences entre interprétations explicite et implicite d’une ENA. Nous montrons que, bien que le contexte et le type d’interprétation considérés aient peu d’effet sur les intervalles collectés, les dimensions arithmétiques et cognitive que nous proposons sont bien impliquées dans l’interprétation des ENA. Nous nous intéressons ensuite à la combinaison d’ENA dans le calcul arithmétique imprécis, par exemple dans l’évaluation de la surface d’une pièce mesurant “environ 10 mètres” et “environ 20 mètres” de côtés. Plus précisément, nous considérons deux opéra- tions arithmétiques, l’addition et la multiplication. Nous avons mené une étude empirique pour collecter les résultats de calculs imprécis. Nous montrons que les imprécisions liées aux opérandes ne semblent pas prises en compte lors de l’estimation de l’imprécision du résultat; en particulier, nous montrons que les résultats sont sensibles aux paradoxes so- rites et qu’ils ne correspondent pas aux résultats fournis par l’arithmétique des intervalles et l’arithmétique floue. Mots-clés: Expressions numériques approximatives, Imprécisions, Interprétation cogni- tive, Approximateurs, Calcul imprécis, Propagation de l’imprécision, Logique floue, Re- quêtes approximatives Abstract Approximate Numerical Expressions (ANE) are imprecise linguistic expressions imply- ingnumericalvalues,illustratedbyexamplessuchas“about 100” andpervasiveineveryday communication between human beings. Our work focuses on two major tasks related to ANE, namely their interpretation and their combination in arithmetical calculation. We first focus on the interpretation of uncontextualised ANEs, defined as the determi- nation of the signification of the numerical modifier about, both in its human and compu- tational aspects. More specifically, after defining and formalising the relevant arithmetical dimensions that allow to characterise ANEs, we conducted an empirical study to collect intervals corresponding to range of values denoted by 24 ANEs. We show that the dimen- sions we propose are involved in the interpretation of ANEs and that they better account for the collected intervals than existing models. Theseresultsleadus,inasecondstep,toproposeageneralprincipletointerpretANEs involvingnaturalnumbers,basedontheassumptionofacompromisebetweenthecognitive salience of the endpoints and their distance to the numerical value of the considered ANE. This general principle is then instantiated in two types of computational models. The first one is designed to estimate the interval of values denoted by an ANE. The second one generates a fuzzy interval representing the imprecision it conveys. Both models are experimentally validated using the collected data and we show that they offer better per- formances than existing models. We also show the relevance of the proposed fuzzy model by implementing it in the framework of flexible queries of numerical databases. Finally, we propose an extension of the models to interpret ANEs involving decimal numbers. We also conducted an empirical study to examine the effect of a semantic context and the differences between implicit and explicit interpretations of ANEs. We show that, even if the context and the type of interpretation have a weak effect on the collected intervals, the arithmetic and cognitive dimensions we propose are involved in ANEs interpretation. Finally, we consider the task of ANE combination, in imprecise arithmetic calculations, for instance in the estimation of the area of a room whose are “about 10 meters” and “about 20 meters” long. More specifically, we consider two arithmetic operations, additions and products. We conducted an empirical study to collect the results of imprecise calcu- lations. We show that the imprecision associated with the operands does not seem to be taken into account during the estimation of the final imprecision. We show that the results of the calculations are sensitive to the sorites paradox and that they do not correspond to the operations performed in the formal frameworks of interval arithmetic nor of fuzzy arithmetic. Keywords: Approximate numerical expressions, Imprecisions, Cognitive interpretation, Approximators, Imprecise calculation, Imprecision propagation, Fuzzy logic, Approxima- tive queries v Les travaux présentés dans cette thèse ont fait l’objet des publications suivantes : Lefort, S., Lesot, M.-J., Zibetti, E., Tijus, C. & Detyniecki, M. (2016). How much is “about”? Fuzzy interpretation of approximate numerical expressions. Proc. of the 16th Int Conf on Information Processing and Management of Uncertainty in Knowledge-Based Sys- tems (IPMU’16) (pp. 226-237). Eindhoven : Springer. Lefort, S., Lesot, M.-J., Zibetti, E., Tijus, C. & Detyniecki, M. (2016). Interprétation floue des expressions numériques approximatives. Proc. of Rencontres Francophones sur la Logique Floue et ses Applications (LFA’16). La Rochelle, France. Lefort, S., Lesot, M.-J., Zibetti, E., Tijus, C. & Detyniecki, M. (2017). Interpretation of approximate numerical expressions : Computational model and empirical study. Inter- national Journal of Approximate Reasoning, 82, 193-209. Lefort, S., Zibetti, E., Lesot, M.-J., Detyniecki, M. & Tijus, C. (2017). Dimensions for automatic interpretation of approximate numerical expressions : An empirical study. Proc. of the 22nd Int Conf on Intelligent User Interfaces (pp. 107-117). Cyprus : ACM. Lefort, S., Lesot, M.-J., Zibetti, E., Tijus, C. & Detyniecki, M. (2017). How arithme- tically fuzzy are we? An empirical comparison of human imprecise calculation and fuzzy arithmetic. FUZZ-IEEE - 2017 IEEE Int Conf on Fuzzy Systems. Naples, Italy. Cettethèseaétéréaliséedanslecadred’unecodirectionentrel’UniversitéPierreetMa- rie Curie et l’Université Paris 8, au Laboratoire d’Informatique de Paris 6 et au laboratoire CHArt-LUTIN. CetravailétéeffectuédanslecadreduLabexSMART(ANR-11-LABX-65)etabénéfi- ciéd’uneaidedel’Etatgéréeparl’AgenceNationaledelaRechercheautitreduprogramme Investissements d’Avenir portant la référence ANR-11-IDEX-0004-02. vi Sommaire 1 Introduction générale 1 2 Contexte 7 2.1 Aspects du vague dans le langage naturel . . . . . . . . . . . . . . . . . 7 2.1.1 Concepts vagues . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 2.1.2 Expressions linguistiques vagues . . . . . . . . . . . . . . . . . . 12 2.1.3 Les approximateurs . . . . . . . . . . . . . . . . . . . . . . . . . 15 2.1.4 Représentations formelles du vague . . . . . . . . . . . . . . . . 17 2.2 Cognition humaine des nombres . . . . . . . . . . . . . . . . . . . . . . 17 2.2.1 L’usage des nombres . . . . . . . . . . . . . . . . . . . . . . . . . 18 2.2.2 Représentation et traitement cognitifs des nombres . . . . . . . . 18 2.2.3 Les ENA à la lumière de la cognition des nombres . . . . . . . . 20 2.3 Bilan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 3 Etat de l’art : représentation, interprétation et calcul d’ENA 23 3.1 Représentation formelle des ENA . . . . . . . . . . . . . . . . . . . . . . 23 3.1.1 L’approche par intervalles . . . . . . . . . . . . . . . . . . . . . . 23 3.1.2 L’approche par sous-ensembles flous . . . . . . . . . . . . . . . . 24 3.2 Interprétation des ENA . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 3.2.1 Modèle proportionnel RM : la magnitude . . . . . . . . . . . . . 29 3.2.2 Modèle basé sur des échelles SBM : la granularité . . . . . . . . 30 3.2.3 Modèle régressif REGM : magnitude, granularité et fiveness . . 32 3.2.4 Modèles d’interprétation des ENA : synthèse . . . . . . . . . . . 33 3.3 Combinaison des ENA dans le calcul . . . . . . . . . . . . . . . . . . . . 34 3.4 Bilan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 4 Interprétation des ENA : définition et validation empirique des di- mensions 37 4.1 Définition et formalisation des dimensions des ENA . . . . . . . . . . . 38 vii viii Sommaire 4.1.1 Dimensions arithmétiques . . . . . . . . . . . . . . . . . . . . . . 38 4.1.2 Dimension cognitive : la complexité . . . . . . . . . . . . . . . . 39 4.2 Validation des dimensions arithmétiques : problématique et hypothèses 41 4.3 Méthodes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 4.3.1 Population . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 4.3.2 Matériel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 4.3.3 Procédure. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 4.3.4 Pré-traitement des données . . . . . . . . . . . . . . . . . . . . . 46 4.3.5 Nettoyage des données. . . . . . . . . . . . . . . . . . . . . . . . 46 4.3.6 Analyses statistiques. . . . . . . . . . . . . . . . . . . . . . . . . 47 4.4 Résultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 4.4.1 Statistiques descriptives et observation préliminaire . . . . . . . 50 4.4.2 Différence entre les intervalles selon l’usage des mathématiques et le niveau en calcul mental . . . . . . . . . . . . . . . . . . . . 51 4.4.3 Magnitude, granularité et dernier chiffre significatif (H1) . . . . 51 4.4.4 Modèle tridimensionnel à l’échelle logarithmique (H2) . . . . . . 53 4.4.5 Symétrie des intervalles (H3) . . . . . . . . . . . . . . . . . . . . 55 4.4.6 Heuristiques mises en place par les participants (H4) . . . . . . . 55 4.5 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 4.6 Bilan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 5 Interprétation des ENA : modélisation computationnelle 61 5.1 Principegénéral:compromisentresaillancecognitiveetplagedevaleurs dénotées. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 5.1.1 Principe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 5.1.2 Mise en œuvre : construction de fronts de Pareto . . . . . . . . . 64 5.1.3 Validation préliminaire . . . . . . . . . . . . . . . . . . . . . . . 66 5.2 Exploitation 1 : modèle d’interprétation à intervalles . . . . . . . . . . . 66 5.2.1 Modèle log-linéaire LLM . . . . . . . . . . . . . . . . . . . . . . 67 5.2.2 Modèle des rangs RKM . . . . . . . . . . . . . . . . . . . . . . . 68 5.2.3 Validation expérimentale : protocole . . . . . . . . . . . . . . . . 69 5.2.4 Validation expérimentale : résultats . . . . . . . . . . . . . . . . 76 5.3 Exploitation 2 : modèle flou d’interprétation fRKM . . . . . . . . . . . 80 5.3.1 Modèle proposé fRKM . . . . . . . . . . . . . . . . . . . . . . . 81 5.3.2 Validation expérimentale : protocole . . . . . . . . . . . . . . . . 82 5.3.3 Validation expérimentale : résultats . . . . . . . . . . . . . . . . 83 5.4 Bilan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

Description:
first one is designed to estimate the interval of values denoted by an ANE. répond : “Continuez sur 100 mètres puis tournez à droite et vous . une méthodologie originale d'analyse des données Soyons plus spécifiques et considérons que l'on parle d'un homme. maternelle le français.
See more

The list of books you might like

Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.