Ant Colony Algorithms for the Resolution of Semantic Searches in P2P Networks by Kamil Krynicki Supervised by Dr. Javier Jaen December 4, 2015 Ph.D Thesis Ant Colony Algorithms for the Resolution of Semantic Searches in P2P Networks by Kamil Krynicki supervised by Dr. Javier Jaen UNIVERSITAT POLITÈCNICA DE VALÈNCIA December 4, 2015 Summary The long-lasting trend in the field of computation of stress and resource distri- bution has found its way into computer networks via the concept of peer-to-peer (P2P) connectivity. P2P is a symmetrical model, where each network node is enabled a comparable range of capacities and resources. It stands in a stark contrasttotheclassical,stronglyasymmetricalclient-serverapproach. P2P,origi- nallyconsideredonlyacomplimentary,server-sidestructuretothestraightforward client-server model, has been shown to have the substantial potential on its own, with multiple, widely known benefits: good fault tolerance and recovery, satisfac- tory scalability and intrinsic load distribution. However, contrary to client-server, P2P networks require sophisticated solutions on all levels, ranging from network organization, to resource location and managing. In this thesis we address one of the key issues of P2P networks: performing ef- ficient resource searches of semantic nature under realistic, dynamic conditions. There have been numerous solutions to this matter, with evolutionary, stigmergy- based, and simple computational foci, but few attempt to resolve the full range of challenges this problem entails. To name a few: real-life P2P networks are rarely static,nodesdisconnect,reconnectandchangetheircontent. Inaddition,atrivial incorporation of semantic searches into well-known algorithms causes significant decrease in search efficiency. In our research we build a solution incrementally, starting with the classic Ant ColonySystem(ACS)withintheAntColonyOptimizationmetaheuristic(ACO). ACO is an algorithmic framework used for solving combinatorial optimization problems that fits contractually the problem very well, albeit not providing an immediate solution to any of the aforementioned problems. First, we propose an efficient ACS variant in structured (hypercube structured) P2P networks, by enabling a path-post processing algorithm, which called Tabu Route Optimization (TRO). Next, we proceed to resolve the issue of network dy- namism with an ACO-compatible information diffusion approach. Consequently, weattempttoincorporatethesemanticcomponentofthesearches. Thisinitialap- proximationtotheproblemwasachievedbyallowingACStodifferentiatebetween iii search types with the pheromone-per-concept idea. We called the outcome of this merger Routing Concept ACS (RC-ACS). RC-ACS is a robust, static multiphe- romone implementation of ACS. However, we were able to conclude from it that the pheromone-per-concept approach offers only limited scalability and cannot be considered a global solution. Thus, further progress was made in this respect when we introduced to RC-ACS our novel idea: dynamic pheromone creation, which replaces the static one-to-one assignment. We called the resulting algorithm Angry Ant Framework (AAF). In AAF new pheromone levels are created as needed and during the search, rather than prior to it. The final step was to enable AAF, not only to create pheromone levels, but to reassign them to optimize the pheromone usage. The resulting algorithm is called EntropicAAF and it has been evaluated as one of the top- performing algorithms for P2P semantic searches under all conditions. iv Resumen La popular tendencia de distribución de carga y recursos en el ámbito de la com- putación se ha transmitido a las redes computacionales a través del concepto de la conectividad peer-to-peer (P2P). P2P es un modelo simétrico, en el cual a cada nodo de la red se le otorga un rango comparable de capacidades y recur- sos. Se trata de un fuerte contraste con el clásico y fuertemente asimétrico en- foque cliente-servidor. P2P, originalmente considerado solo como una estructura del lado del servidor complementaria al sencillo modelo cliente-servidor, ha de- mostrado tener un potencial considerable por sí mismo, con múltiples beneficios ampliamente conocidos: buena tolerancia a fallos y recuperación, escalabilidad satisfactoria y distribución de carga intrínseca. Sin embargo, al contrario que el modelo cliente-servidor, las redes P2P requieren de soluciones sofisticadas a to- dos los niveles, desde la organización de la red hasta la gestión y localización de recursos. Esta tesis aborda uno de los problemas principales de las redes P2P: la búsqueda eficiente de recursos de naturaleza semántica bajo condiciones dinámicas y realis- tas. Ha habido numerosas soluciones a este problema basadas en enfoques evolu- cionarios, estigmérgicos y simples, pero pocas han tratado de resolver el abanico completo de desafíos. En primer lugar, las redes P2P reales son raramente estáti- cas: los nodos se desconectan, reconectan y cambian de contenido. Además, la incorporación trivial de búsquedas semánticas en algoritmos conocidos causa un decremento significativo de la eficiencia de la búsqueda. Enestainvestigaciónsehaconstruidounasolucióndemaneraincremental,comen- zando por el clásico Ant Colony System (ACS) basado en la metaheurística de Ant Colony Optimization (ACO). ACO es un framework algorítmico usado para búsquedas en grafos que encaja perfectamente con las condiciones del problema, aunque no provee una solución inmediata a las cuestiones mencionadas anterior- mente. En primer lugar, se propone una variante eficiente de ACS para redes P2P estruc- turadas(conestructuradehipercubo)permitiendoelpostprocesamientodelasru- tas, al que hemos denominado Tabu Route Optimization (TRO). A continuación, v sehatratadoderesolverelproblemadeldinamismodelaredmedianteladifusión de la información a través de una estrategia compatible con ACO. En consecuen- cia, se ha tratado de incorporar el componente semántico de las búsquedas. Esta aproximación inicial al problema ha sido lograda permitiendo al ACS diferenciar entre tipos de búsquedas através de la idea de pheromone-per-concept. El resul- tadodeestafusiónsehadenominadoRoutingConceptACS(RC-ACS).RC-ACS es una implementación multiferomona estática y robusta de ACS. Sin embargo, a partir de esta implementación se ha podido concluir que el enfoque pheromone- per-concept ofrece solo escalabilidad limitada y que no puede ser considerado una solución global. Porlotanto,paralograrunamejoraaesterespecto,sehaintroducidoalRC-ACS una novedosa idea: la creación dinámica de feromonas, que reemplaza la asig- nación estática uno a uno. En el algoritmo resultante, al que hemos denominado Angry Ant Framework (AAF), los nuevos niveles de feromona se crean conforme se necesitan y durante la búsqueda, en lugar de crearse antes de la misma. La mejora final se ha obtenido al permitir al AAF no solo crear niveles de feromona, sino también reasignarlos para optimizar el uso de la misma. El algoritmo resul- tante se denomina EntropicAAF y ha sido evaluado como uno de los algoritmos más exitosos para las búsquedas semánticas P2P bajo todas las condiciones. vi Resum La popular tendència de distribuir càrrega i recursos en el camp de la computació s’haestèscapalesxarxesd’ordinadorsatravésdelconceptedeconnexionsd’igual a igual (de l’anglès, peer to peer o P2P). P2P és un model simètric on cada node de la xarxa disposa del mateix nombre de capacitats i recursos. P2P, considerat originàriamentnomésunaestructurasituadaalservidorcomplementàriaalmodel client-servidor simple, ha provat tindre el suficient potencial per ella mateixa, ambmúltiplesbeneficisbenconeguts: unabonatolerànciaaerradesirecuperació, una satisfactòria escalabilitat i una intrínseca distribució de càrrega. No obstant, contràriament al client-servidor, les xarxes P2P requereixen solucions sofisticades a tots els nivells, que varien des de l’organització de la xarxa a la localització de recursos i la seua gestió. En aquesta tesi s’adreça un dels problemes clau de les xarxes P2P: ser capaç de realitzar eficientment cerques de recursos de naturalesa semàntica sota condicions realistes i dinàmiques. Existeixen nombroses solucions a aquest tema basades en la computació simple, evolutiva i també basades en l’estimèrgia (de l’anglès, stigmergy), però pocs esforços s’han realitzat per intentar resoldre l’ampli conjunt de reptes existent. En primer lloc, les xarxes P2P reals són rarament estàtiques: els nodes es connecten, desconnecten i canvien els seus continguts. A més a més, la incorporació trivial de cerques semàntiques als algorismes existents causa una disminució significant de l’eficiència de la cerca. En aquesta recerca s’ha construït una solució incremental, començant pel sistema clàssic de colònia de formigues (de l’anglés, Ant Colony System o ACS) dins de lametaheurísticad’optimitzaciódecolòniesdeformigues(del’anglès, AntColony Optimization o ACO). ACO és un entorn algorísmic utilitzat per cercar en grafs i que aborda el problema de forma satisfactòria, tot i que no proveeix d’una solució immediata a cap dels problemes anteriorment mencionats. Primer, s’ha proposat una variant eficient d’ACS en xarxes P2P estructurades (en forma d’hipercub) a través d’un algorisme de processament post-camí el qual s’ha anomenat en anglès Tabu Route Optimization (TRO). A continuació, s’ha procedit a resoldre el problema del dinamisme de les xarxes amb un enfocament vii de difusió d’informació compatible amb ACO. Com a conseqüència, s’ha intentat incorporar la component semàntica de les cerques. Aquest enfocament inicial al problema s’ha realitzat permetent a ACS diferenciar entre tipus de cerques amb la idea de ”feromona per concepte”, i s’ha anomenat a aquest producte Routing Concept ACS o RC-ACS. RC-ACS és una implementació multi-feromona robusta i estàtica d’ACS. No obstant, s’ha pogut concloure que l’enfocament de feromona perconcepteofereixnomésunaescalabilitatlimitadainopotserconsideradauna solució global. Enaquestrespectes’harealitzatprogrésposteriormentintroduintunanovaideaa RC-ACS: la creació dinàmica de feromones, la qual reemplaça a l’assignació un a un de les mateixes. A l’algorisme resultant se l’ha anomenat en anglès Angry Ant Framework (AAF). En AAF es creen nous nivells de feromones a mesura que es necessiten durant la cerca, i no abans d’aquesta. El progrés final s’ha aconseguit quan s’ha permès a AAF, no sols crear nivells de feromones, sinó reassignar-los per optimitzar la utilització de feromones. L’algorisme resultant s’ha anomenat EntropicAAF ihasigutavaluatcomundelsalgorismesperacerquessemàntiques P2P amb millors prestacions. viii Acknowledgments I would like to express my highest gratitude to my thesis director and mentor, Dr Javier Jaén, who made all of this possible, dedicated me an unmeasurable amount of effort and shared his wisdom and experience with me. I would like to offer my thanks to Dr Michael E. Houle, who devoted his time to my research, as well as guided me in art of science and scientific writing. I want to reserve my special thanks for two people who helped me out in what are the most difficult momentsofanylargeendeavor, thebeginningandtheend: JoseAntonioMocholí and Patricia Pons. I would like to thank my friends and colleagues, who showed interest in my work throughout these years: Javier Gonzalez Huerta, Alejandro Catalá,PriscillaCedillo,FernandoGarcia,VicenteNacher,FaizyAhsan,Oussama ChellyandJarekKowalczyk. MostofallIwanttothankmymotherandmyfather, who helped out immensely, each in his own, unique way. ix
Description: