ANNÉE 2015 THÈSE / UNIVERSITÉ DE RENNES 1 sous le sceau de l’Université Européenne de Bretagne pour le grade de DOCTEUR DE L’UNIVERSITÉ DE RENNES 1 Mention : Informatique Ecole doctorale Matisse présentée par Ali Gouta Préparée à l’unité de recherche UMR 6074 IRISA Equipes d’accueil : Orange Labs IDA/CDS - Irisa/ASAP Convention Cifre N 1326/2011 Thèse soutenue à Rennes Caching and le 15 janvier 2015 prefetching for devant le jury composé de : Felber Pascal efficient video Professeur - Université de Neuchâtel / rapporteur Noel Crespi services in mobile Professeur - Télécom Sud Paris / rapporteur Guillaume Pierre networks Professeur - Irisa / examinateur David Hausheer Professeur - université de Darmstadt / examinateur Anne Marie Kermarrec Directrice de recherche - Irisa / directeur de thèse Yannick Lelouédec Ingénieur - Orange Labs / co-directeur de thèse Wingsareaconstraintthatmakes itpossibletofly. —RobertBringhurst Tomyparents... Acknowledgments Iammostgratefultomyadvisors,YannickLelouedecandPr.Anne-MarieKermarrec.Their guidanceandinsightsovertheyearshavebeeninvaluabletome.Ifeelespeciallyfortunatefor thepatiencethattheyhaveshownwithmewhenIfirstlysteppedintothefieldofdataanalysis, cachingandprefetchinginmobilenetworks. Iamindebtedtothemforteachingmeboth researchandwritingskills.Withouttheirendlessefforts,knowledgeandpatience,itwould havebeenextremelychallengingtofinishallmydissertationresearchandPh.Dstudyin3 years.Ithasbeenagreathonorandpleasureformetodoresearchundertheirsupervision.I wouldliketothankPr.GuillaumePierre,Pr.DavidHausheer,Pr.NoelCrespiandPr.Pascal FelberforservingasmyPh.Dcommitteemembersandreviewingmydissertation.Ialsoowe thankstoZiedAouiniandSaifallhKsibi,whohelpedmetoaddresstechnicalandscientific problems.BeforecomingtotheUniversityofRennes1,Ireceivedmyengineeringdegreefrom Sup’CominTunis. IthankDr. YvonGhourantforintroducingmetothefieldofcomputer networkingandforhelpingmetocompletemythesisoncomputernetworks. ImustthankmyfamilyinTunisia,whosupportedmealot. Withouttheirendlessloveand encouragementIwouldhavenevercompletedthisdissertation. i Abstract Cellularnetworkshavewitnessedphenomenaltrafficgrowthrecentlyfueledbynewhigh speed broadband cellular access technologies. This growth is in large part driven by the emergenceoftheHTTPAdaptiveStreaming(HAS)asanewvideodeliverymethod.InHAS, several qualities of the same videos are made available in the network so thatclients can choosethequalitythatbestfitstheirbandwidthcapacity.Thisstronglyimpactstheviewing patternoftheclients,theirswitchingbehaviorbetweenvideoqualities,andthusbeyondon contentdeliverysystems. OurfirstcontributionconsistsinprovidingananalysisofarealHASdatasetcollectedinFrance andprovidedbythelargestFrenchmobileoperator.Firstly,weanalyzeandmodeltheviewing patternsofVoDandlivestreamingHASsessionsandweproposeanewcachereplacement strategy,namedWA-LRU.WA-LRUleveragesthetimelocalityofvideosegmentswithinthe HAScontent.WeshowthatWA-LRUimprovesthecachehit-ratiomostlyattheloadingphase whileitreducessignificantlytheprocessingoverheadatthecache. Inoursecondcontribution,weanalyzeandmodeltheadaptationlogicbetweenthevideo qualitiesbasedonempiricalobservations. Weshowthathighswitchingbehaviorsleadto suboptimalcachingperformance,sinceseveralversionsofthesamecontentcompetetobe cached.InthiscontextweinvestigatethebenefitsofaCacheFriendlyHASsystem(CF-DASH) whichaimsatimprovingthecachingefficiencyinmobilenetworksandtosustainthequality ofexperienceofmobileclients.WeevaluateCF-dashbasedontrace-drivensimulationsand test-bedexperiments.Ourvalidationresultsarepromising.SimulationsonrealHAStraffic showthatweachieveasignificantgaininhit-ratiothatrangesfrom15%upto50%. Inthesecondpartofthisthesis,weinvestigatethemobilevideoprefetchingopportunities. Onlinemediaservicesarereshapingthewayvideocontentiswatched.Peoplewithsimilar intereststendtorequestsamecontent.Thisprovidesenormouspotentialtopredictwhich iii Chapter0. Abstract contentusersareinterestedin.Besides,mobiledevicesarecommonlyusedtowatchvideos whichpopularityislargelydrivenbytheirsocialsuccess.Wedesignasystem,named"Central PredictorSystem(CPsys)",whichaimsatpredictingandprefetchingrelevantcontentforeach mobileclient.Tofinetuneourprefetchingsystem,werelyonalargedatasetcollectedfroma largemobilecarrierinEurope.Therationaleofourprefetchingstrategyisfirsttoformagraph andbuildimplicitorexplicittiesbetweensimilarusers.Ontopofthisgraph,weproposethe MostPopularandMostRecent(MPMR)policytopredictrelevantvideosforeachuser. We showthatCPSyscanachievehighperformanceasregardspredictioncorrectnessandnetwork utilizationefficiency. WefurthershowthatCPSysoutperformsotherprefetchingschemes fromthestateoftheart. Attheend,weprovideaproof-of-conceptimplementationofour prefetchingsystem. Keywords:caching,HAS,DASH,HLS,prefetching,collaborativefiltering,mobilenetworks, passivemeasurements,dataset. iv Résumé Lesréseauxcellulairesontconnuunecroissancephénoménaledutraficalimentéeparles nouvellestechnologiesd’accèscellulaireàlargebande.Cettecroissanceesttiréeengrande partieparletraficHTTPadaptatifstreaming(HAS)commeunenouvelletechniquedediffu- siondecontenusaudiovisuel.LeprincipeduHASestderendredisponibleplusieursqualités delamêmevidéoenligneetquelesclientschoisissentlameilleurequalitéquicorrespond àleurbandepassante.Chaqueniveaud’encodageestsegmentéendespetitsvidéosqu’on appellesegments ouchunks etdontladuréevarieentre2à10secondes.L’émergencedu HASaintroduitdesnouvellescontraintessurlessystèmesdelivraisondescontenusvidéo enparticuliersurlessystèmesdecache.Danscettethèse,nousnousintéressonsàl’étudede cetimpactetàproposerdesalgorithmesetdessolutionsquioptimisentlesfonctionnalités decessystèmes.D’autrepart,laconsommationdescontenusestfortementimpactéepar lesnouvellestechnologiesduWeb2.0telquel’émergencedesréseauxsociaux.Danscette thèse,nousexploitonslesréseauxsociauxafindeproposerunservicedepréchargementdes contenusVoDsurterminauxmobiles.Notresolutionpermetl’améliorationdelaQoEdes utilisateursetpermetdebiengérerlesressourcesréseauxmobile. Nouslistonsnoscontributionscommesuit: Notrepremièrecontributionconsisteàmeneruneanalysedétailléedesdonnéessuruntrafic HASréelcollectéenFranceetfournieparleplusgrandopérateurdetéléphoniemobiledu pays.Toutd’abord,nousanalysonsetmodélisonslecomportementdesclientsquidemandent descontenuscatch-upetlive.Nousconstatonsquelenombrederequêtesparsegmentsuit deux types de distribution : La loi log-normal pour modéliser les 40 premiers chunks par session de streaming, ensuite on observe une queue qui peut être modélisé par la loi de Pareto.Cetteobservationsuggèrequelesclientsneconsommentpaslatotalitéducontenu catch-up.Onmontreparsimulationquesilecacheimplémentedeslogiquesdecachingqui v Chapter0. Abstract netiennentpasencomptelescaractéristiquesdesfluxHAS,saperformancediminuerait considérablement. Danscecontexte,nousproposonsunnouvelalgorithmederemplacementdescontenusque nousappelonsWorkloadAware-LRU(WA-LRU).WA-LRUpermetd’améliorerlaperformance dessystèmesdecacheenaugmentantleHit-Ratioenparticulierpourlespremierssegments etendiminuantletempsrequispourlamiseàjourdelalistedesobjetscachés.Enfonction delacapacitéducacheetdelachargedutraficdansleréseau,WA-LRUestimeunseuilsurle rangdusegmentàcacher.Silerangduchunkdemandédépasseceseuil,lechunknesera pascachésinonilseracaché.CommeWA-LRUdépenddelachargedutraficdansleréseau, celasupposequeleseuilchoisitparWA-LRUestdynamiquesurlajournée.WA-LRUestplus agressifpendantlesheureschargées(i.e.ilcachemoinsdechunks,ceuxquisontlesplus demandés)quependantlesheurescreusesoùleréseauestmoinschargé. Dansnotredeuxièmecontribution,nousétudionsplusendétaillesfacteursquipoussent lesclientsHASàchangerdequalitélorsd’unesessionvidéo.Nousmodélisonségalementce changementdequalitéensebasantsurdesdonnéesempiriquesprovenantdenotretrace detrafic.Auniveauducache,nousmontronsquelechangementfréquentdequalitécrée unecompétitionentrelesdifférentsprofilesd’encodages.Celaréduitlesperformancesdu systèmedecache.Danscecontexte,nousproposonsCacheFriendly-DASH(CF-DASH),une implémentationd’unplayerHAScompatibleaveclestandardDASH,quiassureunemeilleure stabilitéduplayer.NousmontronsàtraversdessimulationsetdesexpérimentationsqueCF- DASHamélioreexpérienceclientetpermetaussid’atteindreungainsignificatifduhit-ratio quipeutvarierentre15%à50%. Dansladeuxièmepartiedecettethèse,nousproposonsunsystèmedepréchargementde contenusvidéossurterminauxmobile.Laconsommationdescontenusvidéoenligneest fortement impactée par les nouvelles technologies du Web2.0 et les réseaux sociaux. Les personnesquipartagentdesintérêtssimilairesonttendanceàdemanderlemêmecontenu. Celapermetdeprédirelecomportementdesclientsetidentifierlescontenusquipeuvent lesintéresser.Parailleurs,lessmartphonesettablettessontdeplusenplusadaptéspour visionnerdesvidéosetassurerunemeilleurequalitéd’expérience.Danscettethèse,nous concevonsunsystèmequ’onappelleCPSys(CentralPredictorSystem)permettantd’identifier lesvidéoslespluspertinentespourchaqueutilisateur.Pourbienparamétrernotresystème vi
Description: