Table Of Content

U C III M NIVERSIDAD ARLOS DE ADRID Escuela Politećnica Superior A A ´ PRENDIZAJE UTOMATICO EN C C ONJUNTOS DE LASIFICADORES H ´ M ETEROGENEOS Y ODELADO A DE GENTES T D ESIS OCTORAL Agapito Ismael Ledezma Espino Legane´s, 2004 Departamento de Informa´tica Escuela Politećnica Superior Universidad Carlos III de Madrid A A ´ PRENDIZAJE UTOMATICO EN C C ONJUNTOS DE LASIFICADORES H ´ M ETEROGENEOS Y ODELADO A DE GENTES AUTOR: Agapito Ismael Ledezma Espino DIRECTORES: Ricardo Aler Mur Araceli Sanchis de Miguel TribunalnombradoporelMgfco.yExcmo.Sr.RectordelaUniversidadCar- losIIIdeMadrid,eld´ıa.........de............................de2004. Presidente:D................................................................. Vocal:D................................................................. Vocal:D................................................................. Vocal:D................................................................. Secretario:D................................................................. Realizado el acto de defensa y lectura de la Tesis el d´ıa ......... de .........................de2004en.............................. Calificacioń:................................. ELPRESIDENTE LOSVOCALES ELSECRETARIO Amiesposa,Yolanda Amit´ıo,V´ıctor Agradecimientos Odisea,esaeslapalabraconlacualpodr´ıadescribirloquehasidoparam´ıla culminacioń de este trabajo. Nadie me dijo hace anõs, en aquel pequenõ pa´ıs lla- mado Panama´, lo que era una tesis doctoral. Quiza´s, si en aquel momento en que decid´ı salir del pa´ıs hubiese sabido lo que ello implicaba, me lo hubiera pensado dosveces,...creoqueno. As´ı como Ulises no hizo su recorrido solo, tampoco yo lo he realizado solo. Ahora es cuando tengo que agradecer a las personas que de alguna forma me han ayudadoaterminarloqueenestaspa´ginasserefleja. En primer lugar a mis directores de tesis, Araceli Sanchis y Ricardo Aler, por el tiempo que me han dedicado, por los consejos que me han dado y, porque no decirlo, por soportar mi constante autocr´ıtica que en algunas ocasiones rozaba el pesimismo ma´s puro y por haberme ayudado a superarlo y de esa forma concluir estetrabajo. A Daniel, por sus consejos y por el valioso tiempo que me ha dedicado desde quedecid´ıhacerlatesisdoctoralenelGrupodeSistemasComplejosAdaptativos. A mis compan˜eros de SCALAB por su apoyo. A mis amigos de dentro y fuera del Departamento de Informa´tica de la Universidad Carlos III, por hacerme sentir comoencasa,auncuandomeencontrabatanlejos. A la Agencia Espanõla de Cooperacioń Internacional, por haber financiado, aunque fuese en parte, mis estudios de doctorado, dańdole as´ı el toque tra´gico de quetodabuenaodiseahacealarde.AlDepartamentodeInforma´ticadelaUniver- sidad Carlos III de Madrid, por permitirme formar parte de e´l y gracias a cuyos medios,experienciaysoportehasidoposiblelafinalizaciońdeestainvestigacioń. A mi mama Lety y mi viejo, que a pesar de la distancia siempre han estado a mi lado, y porque se´ lo que esto significa para ellos. A mi hermano, Leo, por ser comoes. Amit´ıoV´ıctoryamit´ıaMay,porsermissegundospadresyporsusconsejos ysoportealolargodetodosestosanõstanlejosdecasa. Al resto de mi familia, por estar ah´ı los d´ıas que llame´, y por hacerme sentir ma´scercadecasa. Por u´ltimo, mi agradecimiento ma´s profundo y sabiendo que con palabras no puedo expresar lo que siento, a Yolanda. Gracias por haber cre´ıdo en m´ı desde siempre, por querer ser parte de mi proyecto de vida, y por haber dejado todo en Panama´ paraapoyarme.Aelladeboengranmedidaelconcluirestatesisyespero tenerlasiempreconmigoparapodercompensarlaportodoloquehahechoporm´ı. I Resumen Unadelasa´reasquema´saugehatenidoenlosu´ltimosanõsdentrodelapren- dizajeautoma´ticoesaque´llaendondesecombinanlasdecisionesdeclasificadores individuales con la finalidad de que la decisioń final de a que´ clase pertenece un ejemplo sea realizada por un conjunto de clasificadores. Existen diversas tećnicas para generar conjuntos de clasificadores, desde la manipulacioń de los datos de entradaalautilizaciońdemeta-aprendizaje.Unadelasmanerasenlasquesecla- sificanestastećnicasesporelnu´merodealgoritmosdeaprendizajediferentesque utilizan con el fin de generar los miembros del conjunto. Aquellas tećnicas que utilizan un uńico algoritmo para generar todos los miembros del conjunto se dice que generan un conjunto homogeńeo. Por otra parte, aquellas tećnicas que utilizan ma´s de un algoritmo para generar los clasificadores se considera que generan un conjunto de clasificadores heterogeńeo. Entre los algoritmos de generacioń de conjuntos heterogeńeos se encuentra Stacking, el cual, adema´s de generar los cla- sificadoresdelconjuntoapartirdedistintosalgoritmosdeaprendizaje,utilizados niveles de aprendizaje. El primer nivel de aprendizaje o nivel-0 utiliza los datos del dominio de manera directa, mientras que el meta-nivel o nivel-1 utiliza datos generadosapartirdelosclasificadoresdelnivel-0. UnproblemainherenteaStackingesdeterminarlaconfiguraciońdelospara´metros de aprendizaje del algoritmo, entre ellos, que´ y cuańtos algoritmos deben ser utilizadosenlageneraciońdelosclasificadoresdelconjunto.Trabajoprevioshan determinadoquenohayunnu´meroexactodealgoritmosautilizarqueseaelo´pti- moparatodoslosdominios.Tampocoesta´ perfectamentedefinidoque´ algoritmos sedeber´ıanutilizar,aunqueexistentrabajosqueutilizanalgoritmosrepresentativos decadatipo. Unodelosobjetivosdeestatesisdoctoraleslautilizaciońdealgoritmosgene´ticos como tećnica de optimizacioń para determinar los algoritmos que deben ser utilizadosparagenerarelconjuntodeclasificadores,aligualquelaconfiguracioń delospara´metrosdeaprendizajedee´stos.Deestamaneraelme´todoquesepropo- neesindependientedeldominio,mientrasquelaconfiguraciońdelospara´metros deStackingencontrada,dependera´ deldominio. El crecimiento del comercio electrońico y las aplicaciones en la World-Wide- Webhamotivadoelincrementodelosentornosendondeintervienenagentes.Estos entornos incluyen situaciones competitivas y/o colaborativas en donde el conoci- miento que se posea sobre los individuos involucrados en el entorno, proporciona II III una clara ventaja a la hora de tomar una decisioń sobre que´ accioń llevar a cabo. Existendiversasformasdeadquiriresteconocimiento.Unadeellasesatrave´sdel modeladodelcomportamientodelosagentes. Asuvez,existendiversasformasdeconstruirelmodelodeunagente.Algunas tećnicasutilizanmodelospreviamenteconstruidosysuobjetivoesintentarempa- rejarelcomportamientoobservadoconunmodeloexistente.Otrastećnicasasumen uncomportamientoo´ptimodelagenteamodelarconelfindecrearunmodelode sucomportamiento. Un segundo objetivo de esta tesis doctoral es la creacioń de un marco general paraelmodeladodeagentesbasańdoseenlaobservaciońdelcomportamientodel agente a modelar. Para ello se propone la utilizacioń de tećnicas de aprendizaje automa´ticoconelpropo´sitodellevaracabolatareademodeladobasańdoseenla relaciońexistenteentrelaentradaylasalidadelagente. Abstract In the last years, one of the most active research areas in Machine Learning is that of ensembles of classifiers. Their purpose is to combine the decisions of individual classifiers so that all classifiers in the ensemble are taken into account in order to classify new instances. There are many techniques that generate such ensembles.Somemanipulatetheinputdata,whileothersusemeta-learning.Inge- neral,ensemblescanbehomogeneousorheterogeneous.Homogeneousensembles consist of several classifiers generated by the same learning technique, whereas heterogeneous ensembles contain classifiers generated by different algorithms. A well-known approach to generate heterogeneous ensembles is Stacking. Stacking usestwolevelsoflearning.Thefirstlearninglevelorlevel-0usesdirectdatafrom the domain, whereas the meta-level or level-1 uses data generated by classifiers fromlevel-0. AninherentproblemtoStackingistodeterminetherightconfigurationofthe learning parameters, like how many classifiers, and which learning algorithms, must be used in the generation of the ensemble of classifiers. Previous work have shown that there is no optimal decision for all the domains, although there are worksthatuserepresentativealgorithmsfromeachtype. OnegoalofthisthesisistouseGeneticAlgorithmsasanoptimizationtechni- queinordertodeterminethetypeandnumberofalgorithmstobeusedtogenerate theensembleofclassifiers,aswellastheconfigurationofthelearningparameters ofthesealgorithms.Theproposedmethodisdomainindependent,andtheGenetic Algorithmwillbeabletoadapttoparticulardomains. The growth of the e-commerce and applications over the World-Wide-Web hasmotivatedtheincreaseofenvironmentswhereagentscaninteract.Theseenvi- ronment include competitive and/or colaborative situations where the knowledge about other individuals involved in the environment, provides a clear advantage whenmakingdecisionaboutactionstoperform.Thereareseveralwaystoacquire thisknowledge.Oneofthemisbymodelingthebehaviorofotheragents. There are several ways to construct an agent’s model. Some techniques use previously constructed models and its goal to match the observed behavior with anexistingmodel.Othertechniquesassumethattheagenttomodelcarriesoutan optimalstrategyinordertocreateamodelofitsbehavior. In this thesis, a second approach to model agents will be used based on the observationofotheragentsbehavior.Inordertodothis,ageneralframeworkthat usesmachinelearningtechniquesforagentmodelingisproposed. IV V “So´lolosqueconstruyensobreideas,construyenparalaeternidad” -Emerson- ´ Indice general I Introduccioń 1 1. Introduccioń 2 1.1. GA-Stacking . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.2. ModeladodeAgentesmedianteAprendizaje Automa´tico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.3. ObjetivosdelaTesis . . . . . . . . . . . . . . . . . . . . . . . . 5 II GA-Stacking 7 2. Introduccioń 8 3. EstadodelArte 10 3.1. AprendizajeAutoma´tico . . . . . . . . . . . . . . . . . . . . . . 10 3.1.1. AprendizajeSupervisado . . . . . . . . . . . . . . . . . . 11 3.1.2. AprendizajeNoSupervisado . . . . . . . . . . . . . . . . 12 3.1.3. AprendizajeporRefuerzo . . . . . . . . . . . . . . . . . 12 3.1.4. Taxonom´ıaBasadaenOtrosCriterios . . . . . . . . . . . 13 3.2. ConjuntosdeClasificadores . . . . . . . . . . . . . . . . . . . . 13 3.2.1. ¿Porque´ FuncionanlosConjuntosdeClasificadores? . . . 14 3.2.2. ConstrucciońdeConjuntosdeClasificadores . . . . . . . 16 3.3. StackedGeneralization . . . . . . . . . . . . . . . . . . . . . . . 18 3.3.1. Definicioń . . . . . . . . . . . . . . . . . . . . . . . . . . 18 3.3.2. TrabajosRelacionados . . . . . . . . . . . . . . . . . . . 20 3.4. AlgoritmosGene´ticos . . . . . . . . . . . . . . . . . . . . . . . . 25 3.4.1. Definicioń . . . . . . . . . . . . . . . . . . . . . . . . . . 25 3.4.2. OptimizaciońmedianteAG’s . . . . . . . . . . . . . . . . 28 3.5. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 4. GA-Stacking 29 4.1. MarcoGeneral:GA-Stacking . . . . . . . . . . . . . . . . . . . . 30 4.2. CodificaciońdelasSoluciones . . . . . . . . . . . . . . . . . . . 30 4.3. EvaluaciońdelFitness . . . . . . . . . . . . . . . . . . . . . . . 33 4.4. OtrosPara´metrosdelosAG’s . . . . . . . . . . . . . . . . . . . . 34 VI

Description:

Odisea, esa es la palabra con la cual podrıa describir lo que ha sido para mı la culminación de este trabajo. Nadie me dijo hace a˜nos, en aquel peque˜no paıs lla- mado Panamá, lo que era una tesis doctoral. Quizás, si en aquel momento en que decidı salir del paıs hubiese sabido lo que el

Aprendizaje automático en conjuntos de clasificadores heterogéneos y modelado de agentes PDF

175 Pages·2004·1.23 MB·Spanish

Checking for file health...

Save to my drive

Quick download

Download

Upgrade Premium

Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.

Preview Aprendizaje automático en conjuntos de clasificadores heterogéneos y modelado de agentes

Description:

See more

The list of books you might like

Upgrade Premium

Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.