View metadata, citation and similar papers at core.ac.uk brought to you by CORE provided by Universidad Carlos III de Madrid e-Archivo U C III M NIVERSIDAD ARLOS DE ADRID Escuela Polite´cnica Superior A A ´ PRENDIZAJE UTOMATICO EN C C ONJUNTOS DE LASIFICADORES H ´ M ETEROGENEOS Y ODELADO A DE GENTES T D ESIS OCTORAL Agapito Ismael Ledezma Espino Legane´s, 2004 Departamento de Informa´tica Escuela Polite´cnica Superior Universidad Carlos III de Madrid A A ´ PRENDIZAJE UTOMATICO EN C C ONJUNTOS DE LASIFICADORES H ´ M ETEROGENEOS Y ODELADO A DE GENTES AUTOR: Agapito Ismael Ledezma Espino DIRECTORES: Ricardo Aler Mur Araceli Sanchis de Miguel TribunalnombradoporelMgfco.yExcmo.Sr.RectordelaUniversidadCar- losIIIdeMadrid,eld´ıa.........de............................de2004. Presidente:D................................................................. Vocal:D................................................................. Vocal:D................................................................. Vocal:D................................................................. Secretario:D................................................................. Realizado el acto de defensa y lectura de la Tesis el d´ıa ......... de .........................de2004en.............................. Calificacio´n:................................. ELPRESIDENTE LOSVOCALES ELSECRETARIO Amiesposa,Yolanda Amit´ıo,V´ıctor Agradecimientos Odisea,esaeslapalabraconlacualpodr´ıadescribirloquehasidoparam´ıla culminacio´n de este trabajo. Nadie me dijo hace an˜os, en aquel pequen˜o pa´ıs lla- mado Panama´, lo que era una tesis doctoral. Quiza´s, si en aquel momento en que decid´ı salir del pa´ıs hubiese sabido lo que ello implicaba, me lo hubiera pensado dosveces,...creoqueno. As´ı como Ulises no hizo su recorrido solo, tampoco yo lo he realizado solo. Ahora es cuando tengo que agradecer a las personas que de alguna forma me han ayudadoaterminarloqueenestaspa´ginasserefleja. En primer lugar a mis directores de tesis, Araceli Sanchis y Ricardo Aler, por el tiempo que me han dedicado, por los consejos que me han dado y, porque no decirlo, por soportar mi constante autocr´ıtica que en algunas ocasiones rozaba el pesimismo ma´s puro y por haberme ayudado a superarlo y de esa forma concluir estetrabajo. A Daniel, por sus consejos y por el valioso tiempo que me ha dedicado desde quedecid´ıhacerlatesisdoctoralenelGrupodeSistemasComplejosAdaptativos. A mis compan˜eros de SCALAB por su apoyo. A mis amigos de dentro y fuera del Departamento de Informa´tica de la Universidad Carlos III, por hacerme sentir comoencasa,auncuandomeencontrabatanlejos. A la Agencia Espan˜ola de Cooperacio´n Internacional, por haber financiado, aunque fuese en parte, mis estudios de doctorado, da´ndole as´ı el toque tra´gico de quetodabuenaodiseahacealarde.AlDepartamentodeInforma´ticadelaUniver- sidad Carlos III de Madrid, por permitirme formar parte de e´l y gracias a cuyos medios,experienciaysoportehasidoposiblelafinalizacio´ndeestainvestigacio´n. A mi mama Lety y mi viejo, que a pesar de la distancia siempre han estado a mi lado, y porque se´ lo que esto significa para ellos. A mi hermano, Leo, por ser comoes. Amit´ıoV´ıctoryamit´ıaMay,porsermissegundospadresyporsusconsejos ysoportealolargodetodosestosan˜ostanlejosdecasa. Al resto de mi familia, por estar ah´ı los d´ıas que llame´, y por hacerme sentir ma´scercadecasa. Por u´ltimo, mi agradecimiento ma´s profundo y sabiendo que con palabras no puedo expresar lo que siento, a Yolanda. Gracias por haber cre´ıdo en m´ı desde siempre, por querer ser parte de mi proyecto de vida, y por haber dejado todo en Panama´ paraapoyarme.Aelladeboengranmedidaelconcluirestatesisyespero tenerlasiempreconmigoparapodercompensarlaportodoloquehahechoporm´ı. I Resumen Unadelasa´reasquema´saugehatenidoenlosu´ltimosan˜osdentrodelapren- dizajeautoma´ticoesaque´llaendondesecombinanlasdecisionesdeclasificadores individuales con la finalidad de que la decisio´n final de a que´ clase pertenece un ejemplo sea realizada por un conjunto de clasificadores. Existen diversas te´cnicas para generar conjuntos de clasificadores, desde la manipulacio´n de los datos de entradaalautilizacio´ndemeta-aprendizaje.Unadelasmanerasenlasquesecla- sificanestaste´cnicasesporelnu´merodealgoritmosdeaprendizajediferentesque utilizan con el fin de generar los miembros del conjunto. Aquellas te´cnicas que utilizan un u´nico algoritmo para generar todos los miembros del conjunto se dice que generan un conjunto homoge´neo. Por otra parte, aquellas te´cnicas que utili- zan ma´s de un algoritmo para generar los clasificadores se considera que generan un conjunto de clasificadores heteroge´neo. Entre los algoritmos de generacio´n de conjuntos heteroge´neos se encuentra Stacking, el cual, adema´s de generar los cla- sificadoresdelconjuntoapartirdedistintosalgoritmosdeaprendizaje,utilizados niveles de aprendizaje. El primer nivel de aprendizaje o nivel-0 utiliza los datos del dominio de manera directa, mientras que el meta-nivel o nivel-1 utiliza datos generadosapartirdelosclasificadoresdelnivel-0. UnproblemainherenteaStackingesdeterminarlaconfiguracio´ndelospara´me- tros de aprendizaje del algoritmo, entre ellos, que´ y cua´ntos algoritmos deben ser utilizadosenlageneracio´ndelosclasificadoresdelconjunto.Trabajoprevioshan determinadoquenohayunnu´meroexactodealgoritmosautilizarqueseaelo´pti- moparatodoslosdominios.Tampocoesta´ perfectamentedefinidoque´ algoritmos sedeber´ıanutilizar,aunqueexistentrabajosqueutilizanalgoritmosrepresentativos decadatipo. Unodelosobjetivosdeestatesisdoctoraleslautilizacio´ndealgoritmosgene´ti- cos como te´cnica de optimizacio´n para determinar los algoritmos que deben ser utilizadosparagenerarelconjuntodeclasificadores,aligualquelaconfiguracio´n delospara´metrosdeaprendizajedee´stos.Deestamaneraelme´todoquesepropo- neesindependientedeldominio,mientrasquelaconfiguracio´ndelospara´metros deStackingencontrada,dependera´ deldominio. El crecimiento del comercio electro´nico y las aplicaciones en la World-Wide- Webhamotivadoelincrementodelosentornosendondeintervienenagentes.Estos entornos incluyen situaciones competitivas y/o colaborativas en donde el conoci- miento que se posea sobre los individuos involucrados en el entorno, proporciona II III una clara ventaja a la hora de tomar una decisio´n sobre que´ accio´n llevar a cabo. Existendiversasformasdeadquiriresteconocimiento.Unadeellasesatrave´sdel modeladodelcomportamientodelosagentes. Asuvez,existendiversasformasdeconstruirelmodelodeunagente.Algunas te´cnicasutilizanmodelospreviamenteconstruidosysuobjetivoesintentarempa- rejarelcomportamientoobservadoconunmodeloexistente.Otraste´cnicasasumen uncomportamientoo´ptimodelagenteamodelarconelfindecrearunmodelode sucomportamiento. Un segundo objetivo de esta tesis doctoral es la creacio´n de un marco general paraelmodeladodeagentesbasa´ndoseenlaobservacio´ndelcomportamientodel agente a modelar. Para ello se propone la utilizacio´n de te´cnicas de aprendizaje automa´ticoconelpropo´sitodellevaracabolatareademodeladobasa´ndoseenla relacio´nexistenteentrelaentradaylasalidadelagente. Abstract In the last years, one of the most active research areas in Machine Learning is that of ensembles of classifiers. Their purpose is to combine the decisions of individual classifiers so that all classifiers in the ensemble are taken into account in order to classify new instances. There are many techniques that generate such ensembles.Somemanipulatetheinputdata,whileothersusemeta-learning.Inge- neral,ensemblescanbehomogeneousorheterogeneous.Homogeneousensembles consist of several classifiers generated by the same learning technique, whereas heterogeneous ensembles contain classifiers generated by different algorithms. A well-known approach to generate heterogeneous ensembles is Stacking. Stacking usestwolevelsoflearning.Thefirstlearninglevelorlevel-0usesdirectdatafrom the domain, whereas the meta-level or level-1 uses data generated by classifiers fromlevel-0. AninherentproblemtoStackingistodeterminetherightconfigurationofthe learning parameters, like how many classifiers, and which learning algorithms, must be used in the generation of the ensemble of classifiers. Previous work ha- ve shown that there is no optimal decision for all the domains, although there are worksthatuserepresentativealgorithmsfromeachtype. OnegoalofthisthesisistouseGeneticAlgorithmsasanoptimizationtechni- queinordertodeterminethetypeandnumberofalgorithmstobeusedtogenerate theensembleofclassifiers,aswellastheconfigurationofthelearningparameters ofthesealgorithms.Theproposedmethodisdomainindependent,andtheGenetic Algorithmwillbeabletoadapttoparticulardomains. The growth of the e-commerce and applications over the World-Wide-Web hasmotivatedtheincreaseofenvironmentswhereagentscaninteract.Theseenvi- ronment include competitive and/or colaborative situations where the knowledge about other individuals involved in the environment, provides a clear advantage whenmakingdecisionaboutactionstoperform.Thereareseveralwaystoacquire thisknowledge.Oneofthemisbymodelingthebehaviorofotheragents. There are several ways to construct an agent’s model. Some techniques use previously constructed models and its goal to match the observed behavior with anexistingmodel.Othertechniquesassumethattheagenttomodelcarriesoutan optimalstrategyinordertocreateamodelofitsbehavior. In this thesis, a second approach to model agents will be used based on the observationofotheragentsbehavior.Inordertodothis,ageneralframeworkthat usesmachinelearningtechniquesforagentmodelingisproposed. IV V “So´lolosqueconstruyensobreideas,construyenparalaeternidad” -Emerson- ´ Indice general I Introduccio´n 1 1. Introduccio´n 2 1.1. GA-Stacking . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.2. ModeladodeAgentesmedianteAprendizaje Automa´tico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.3. ObjetivosdelaTesis . . . . . . . . . . . . . . . . . . . . . . . . 5 II GA-Stacking 7 2. Introduccio´n 8 3. EstadodelArte 10 3.1. AprendizajeAutoma´tico . . . . . . . . . . . . . . . . . . . . . . 10 3.1.1. AprendizajeSupervisado . . . . . . . . . . . . . . . . . . 11 3.1.2. AprendizajeNoSupervisado . . . . . . . . . . . . . . . . 12 3.1.3. AprendizajeporRefuerzo . . . . . . . . . . . . . . . . . 12 3.1.4. Taxonom´ıaBasadaenOtrosCriterios . . . . . . . . . . . 13 3.2. ConjuntosdeClasificadores . . . . . . . . . . . . . . . . . . . . 13 3.2.1. ¿Porque´ FuncionanlosConjuntosdeClasificadores? . . . 14 3.2.2. Construccio´ndeConjuntosdeClasificadores . . . . . . . 16 3.3. StackedGeneralization . . . . . . . . . . . . . . . . . . . . . . . 18 3.3.1. Definicio´n . . . . . . . . . . . . . . . . . . . . . . . . . . 18 3.3.2. TrabajosRelacionados . . . . . . . . . . . . . . . . . . . 20 3.4. AlgoritmosGene´ticos . . . . . . . . . . . . . . . . . . . . . . . . 25 3.4.1. Definicio´n . . . . . . . . . . . . . . . . . . . . . . . . . . 25 3.4.2. Optimizacio´nmedianteAG’s . . . . . . . . . . . . . . . . 28 3.5. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 4. GA-Stacking 29 4.1. MarcoGeneral:GA-Stacking . . . . . . . . . . . . . . . . . . . . 30 4.2. Codificacio´ndelasSoluciones . . . . . . . . . . . . . . . . . . . 30 4.3. Evaluacio´ndelFitness . . . . . . . . . . . . . . . . . . . . . . . 33 4.4. OtrosPara´metrosdelosAG’s . . . . . . . . . . . . . . . . . . . . 34 VI
Description: