Introducci´on al Razonamiento Aproximado F. J. D´ıez Dpto. Inteligencia Artificial UNED Primera edici´on: Octubre 1998 Revisi´on: Noviembre 2005 A mi hija Nuria II Prefacio Esta Introducci´on al Razonamiento Aproximado est´a destinada principalmente a los estu- diantes de Razonamiento y Aprendizaje, asignatura optativa del tercer curso de la Ingenier´ıa T´ecnica de Inform´atica de Sistemas, de la UNED. La redacci´on inicial se bas´o en la tesis doctoral del autor y en las transparencias del curso de doctorado Razonamiento Aproximado. El cap´ıtulo 4, especialmente en lo relativo a la teor´ıa de la confimaci´on (secs. 4.1.2 y 4.4.1), se bas´o tambi´en en un documento redactado para esta obra por Enrique Nell, quien ha aportado adem´as referencias bibliogr´aficas y comentarios muy acertados. La primera edici´on apareci´o en octubre de 1998. Desde entonces cada an˜o hemos publi- cado una nueva versi´on corregida y a veces aumentada. En esta labor hemos contado con la ayuda de Carlos Cabezas, Ildefonso Bell´on, Flavio Cu´ellar, Ismael Falc´on, Jos´e Antonio Fern´andez, Jos´eMelgar, EvaMill´an, EnriqueNell, DavidPenas, LourdesP´erez, Jos´eRabane- da, Montserrat Sans, O´scar Sanz y Xavier Torres, quienes nos han sen˜alado un buen nu´mero de erratas. El autor y los lectores de futuras ediciones, especialmente los alumnos que tendr´an que esforzarse por comprender y aprender su contenido, agradecen sinceramente todas las correc- ciones y sugerencias recibidas hasta la fecha y las que se reciban en el futuro: erratas detec- tadas, puntos que no est´an claros, omisiones importantes, cuestiones que conviene matizar, o incluso errores conceptuales, que es posible que los haya. Todos los comentarios ser´an bien recibidos. En la p´agina de Internet http://www.ia.uned.es/~fjdiez/libros/razaprox.html pondremos informaci´on actualizada sobre este texto (fe de erratas, versiones actualizadas, etc.), material complementario y enlaces de inter´es. Francisco Javier D´ıez Vegas UNED, Madrid, noviembre de 2005 III IV ´ Indice general 1 Razonamiento aproximado en Inteligencia Artificial 1 1.1 Fuentes de incertidumbre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2 Breve historia del tratamiento de la incertidumbre . . . . . . . . . . . . . . . 3 1.3 Bibliograf´ıa recomendada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 2 M´etodo probabilista cl´asico 9 2.1 Definiciones b´asicas sobre probabilidad . . . . . . . . . . . . . . . . . . . . . . 9 2.2 Independencia, correlaci´on y causalidad . . . . . . . . . . . . . . . . . . . . . 14 2.2.1 Independencia y correlaciones . . . . . . . . . . . . . . . . . . . . . . . 14 2.2.2 Independencia condicional . . . . . . . . . . . . . . . . . . . . . . . . . 15 2.2.3 Representaci´on gr´afica de dependencias e independencias . . . . . . . 17 2.2.4 Diferencia entre causalidad y correlaci´on . . . . . . . . . . . . . . . . . 18 2.3 Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 2.3.1 Enunciado y demostraci´on . . . . . . . . . . . . . . . . . . . . . . . . . 20 2.3.2 Aplicaci´on del teorema de Bayes . . . . . . . . . . . . . . . . . . . . . 22 2.4 M´etodo probabilista cl´asico . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 2.4.1 Forma racional del m´etodo probabilista cl´asico . . . . . . . . . . . . . 30 2.4.2 Paso de mensajes en el m´etodo probabilista cl´asico . . . . . . . . . . . 31 2.4.3 Discusi´on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 2.5 Bibliograf´ıa recomendada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 3 Redes bayesianas 35 3.1 Presentaci´on intuitiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 3.2 Definici´on formal de red bayesiana . . . . . . . . . . . . . . . . . . . . . . . . 48 3.2.1 Estructura de la red. Teor´ıa de grafos . . . . . . . . . . . . . . . . . . 48 3.2.2 Definici´on de red bayesiana . . . . . . . . . . . . . . . . . . . . . . . . 51 3.2.3 Factorizaci´on de la probabilidad . . . . . . . . . . . . . . . . . . . . . 52 3.2.4 Sem´antica de las redes bayesianas . . . . . . . . . . . . . . . . . . . . 53 3.3 Propagaci´on de evidencia en poli´arboles . . . . . . . . . . . . . . . . . . . . . 55 3.3.1 Definiciones b´asicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 3.3.2 Computaci´on de los mensajes . . . . . . . . . . . . . . . . . . . . . . . 57 3.3.3 Comentarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 3.3.4 Implementaci´on distribuida . . . . . . . . . . . . . . . . . . . . . . . . 61 3.4 La puerta OR/MAX . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 V 3.4.1 La puerta OR binaria . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 3.4.2 Definici´on de la puerta MAX . . . . . . . . . . . . . . . . . . . . . . . 66 3.4.3 Algoritmo de propagaci´on . . . . . . . . . . . . . . . . . . . . . . . . . 70 3.4.4 Implementaci´on distribuida . . . . . . . . . . . . . . . . . . . . . . . . 72 3.4.5 Sem´antica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 3.5 Bibliograf´ıa recomendada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 4 Modelo de factores de certeza de MYCIN 77 4.1 El sistema experto MYCIN . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 4.1.1 Caracter´ısticas principales . . . . . . . . . . . . . . . . . . . . . . . . . 77 4.1.2 Motivaci´on del modelo de factores de certeza . . . . . . . . . . . . . . 79 4.2 Definici´on de los factores de certeza. . . . . . . . . . . . . . . . . . . . . . . . 81 4.2.1 Factor de certeza de cada regla . . . . . . . . . . . . . . . . . . . . . . 81 4.2.2 Factor de certeza de cada valor . . . . . . . . . . . . . . . . . . . . . . 83 4.3 Propagaci´on de la evidencia en una red de inferencia . . . . . . . . . . . . . . 83 4.3.1 Modus ponens incierto . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 4.3.2 Combinaci´on de reglas convergentes . . . . . . . . . . . . . . . . . . . 84 4.3.3 Combinaci´on secuencial de reglas . . . . . . . . . . . . . . . . . . . . . 87 4.3.4 Combinaci´on de evidencia en el antecedente . . . . . . . . . . . . . . . 89 4.4 Problemas del modelo de factores de certeza . . . . . . . . . . . . . . . . . . . 90 4.4.1 Creencia absoluta frente a actualizaci´on de creencia . . . . . . . . . . 92 4.4.2 La supuesta modularidad de las reglas . . . . . . . . . . . . . . . . . . 93 4.4.3 ¿Por qu´e MYCIN funcionaba tan bien? . . . . . . . . . . . . . . . . . 95 4.5 Bibliograf´ıa recomendada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 5 L´ogica difusa 97 5.1 L´ogica de proposiciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 5.1.1 L´ogica cl´asica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 5.1.2 L´ogicas multivaluadas . . . . . . . . . . . . . . . . . . . . . . . . . . . 104 5.1.3 L´ogica difusa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 5.2 L´ogica de predicados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120 5.2.1 Predicados unitarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120 5.2.2 Modus ponens para predicados . . . . . . . . . . . . . . . . . . . . . . 125 5.3 Teor´ıa de conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 5.3.1 Conjuntos y predicados . . . . . . . . . . . . . . . . . . . . . . . . . . 127 5.3.2 Funciones caracter´ısticas . . . . . . . . . . . . . . . . . . . . . . . . . . 128 5.3.3 Igualdad de conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . 132 5.3.4 Inclusi´on de conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . 135 5.3.5 Composici´on de conjuntos: complementario, uni´on e intersecci´on . . . 137 5.3.6 Recapitulaci´on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140 5.4 Relaciones e inferencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141 5.4.1 Predicados n-arios y relaciones . . . . . . . . . . . . . . . . . . . . . . 141 5.4.2 Composici´on de relaciones . . . . . . . . . . . . . . . . . . . . . . . . . 143 5.4.3 Modus ponens difuso . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147 VI 5.5 Bibliograf´ıa recomendada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150 Bibliograf´ıa 151 VII VIII ´ Indice de figuras 2.1 Dos variables independientes. . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 2.2 Dependencia causal entre dos variables. . . . . . . . . . . . . . . . . . . . . . 17 2.3 Dependencia causal entre un nodo padre y dos hijos. . . . . . . . . . . . . . . 18 2.4 Dependencia causal de tres variables en cadena. . . . . . . . . . . . . . . . . . 18 2.5 Dependencia causal entre dos padres y un hijo. . . . . . . . . . . . . . . . . . 18 2.6 Diagrama causal en forma de bucle. . . . . . . . . . . . . . . . . . . . . . . . 19 2.7 La correlaci´on entre nu´mero de cigu¨en˜as y nu´mero de nacimientos no implica causalidad. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 2.8 La correlaci´on entre el consumo de teracola y la aparici´on de manchas en la piel no implica causalidad. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 2.9 La raz´on de probabilidad RP(X) como funci´on de la probabilidad P(+x). . . 25 2.10 Valor predictivo positivo (prevalencia=0’1). . . . . . . . . . . . . . . . . . . . 26 2.11 Valor predictivo negativo (prevalencia=0’1). . . . . . . . . . . . . . . . . . . . 27 2.12 M´etodo probabilista cl´asico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 2.13 El piloto luminoso (L) y la temperatura (T) son signos de aver´ıa (D). . . . . 30 2.14 Paso de mensajes en el m´etodo probabilista cl´asico. . . . . . . . . . . . . . . . 31 3.1 Nodo X con un hijo Y . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 1 3.2 Nodo X con dos hijos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 3.3 Nodo X con dos padres. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 3.4 Nodo X con dos padres y dos hijos. . . . . . . . . . . . . . . . . . . . . . . . 46 3.5 Un pequen˜o poli´arbol. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 3.6 Un ciclo y dos bucles. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 3.7 Propagaci´on de evidencia mediante intercambio de mensajes. . . . . . . . . . 56 3.8 Padres de Y . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 j 3.9 Computaciones realizadas en el nodo X. . . . . . . . . . . . . . . . . . . . . . 62 3.10 Computaci´on distribuida de los mensajes π y λ. . . . . . . . . . . . . . . . . . 64 3.11 Ejemplo de puerta MAX. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 3.12 Computaciones realizadas en la puerta OR. . . . . . . . . . . . . . . . . . . . 73 4.1 Estructura t´ıpica de un sistema basado en reglas. . . . . . . . . . . . . . . . . 78 4.2 Combinaci´on de reglas convergentes. . . . . . . . . . . . . . . . . . . . . . . . 84 4.3 Pequen˜a red de inferencia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 4.4 Nodo C con dos causas y un efecto.. . . . . . . . . . . . . . . . . . . . . . . . 94 5.1 Funci´on caracter´ıstica del conjunto A de nu´meros pr´oximos a 0 (β=50). . . . 130 5.2 Funci´on µ(cid:48) (y): grado de pertenencia al conjunto A de personas altas, en fun- A ci´on de la estatura en cent´ımetros, y. . . . . . . . . . . . . . . . . . . . . . . . 131 IX