Bachelorarbeit Bianca O(cid:425) Erstellung von Bedarfsprognosen durch Künstliche Neuronale Netze am Beispiel von Backmengenempfehlungen im Einzelhandel FakultätTechnikundInforma(cid:415)k FacultyofEngineeringandComputerScience StudiendepartmentInforma(cid:415)k DepartmentofComputerScience Bianca O(cid:425) Erstellung von Bedarfsprognosen durch Künstliche Neuronale Netze am Beispiel von Backmengenempfehlungen im Einzelhandel BachelorarbeiteingereichtimRahmenderBachelorprüfung imStudiengangAngewandteInforma(cid:415)k amDepartmentInforma(cid:415)k derFakultätTechnikundInforma(cid:415)k derHochschulefürAngewandteWissenscha(cid:332)enHamburg BetreuenderPrüfer:Prof.Dr.rer.nat.MichaelNeitzke Zweitgutachter:Prof.Dr.StefanSarstedt Eingereichtam:13.05.2013 Bianca O(cid:425) Erstellung von Bedarfsprognosen durch Künstliche Neuronale Netze am Beispiel von Backmengenempfehlungen im Einzelhandel S(cid:415)chworte KünstlichesNeuronalesNetz,Bedarfsprognose,Zeitreihenprognose,kausalePrognose Kurzzusammenfassung ZuverlässigeBedarfsprognosenentscheidenimEinzelhandelo(cid:332)überGewinnoderVerlust.Bei einergeringenGewinnmargeistesunerlässlich,dasseinerseitseineausreichendeAnzahleines Ar(cid:415)kelsvorrä(cid:415)gist,damitalleKäuferdengewünschtenAr(cid:415)kelvorfindenaberandererseitsso wenigAbschri(cid:332)enwiemöglichproduziertwerden.DievorliegendenBachelorarbeituntersucht inwiefernsichKünstlicheNeuronaleNetzedazueignendenBedarfanBackwareninFilialen einesEinzelhandel-DiscountersfürdenFolgetagzuverlässigzuprognos(cid:415)zieren.Voraussetzung dafür ist eine Modellierung des Anwendungsfalls, um die passenden Informa(cid:415)onen und die geeignete Form der Daten zur ermi(cid:425)eln, die ein Künstliches Neuronales Netz benö(cid:415)gt, um op(cid:415)maleBedarfsprognosenliefernzukönnen.UntersuchtwerdenindiesemZusammenhang Zeitreihen-,kausaleundkombiniertePrognosemodelle,diedurchKünstlicheNeuronaleNetze implemen(cid:415)ert werden. Die daraus resul(cid:415)erenden Prognoseergebnisse werden abschließend miteinanderverglichen,umdiebestmöglicheModellierungsformzuermi(cid:425)eln. Bianca O(cid:425) Crea(cid:415)on of demand forecasts by ar(cid:415)ficial neural networks using the example of baking amount recommenda(cid:415)ons in retail Keywords Ar(cid:415)ficialNeuralNetwork,DemandForecast,Time-SeriesForecast,CausalForecast Abstract Reliabledemandforecastsinretailo(cid:332)endecideoverprofitorloss.Atalowprofitmargin,itis essen(cid:415)al,thatasufficientquan(cid:415)tyofanitemisinstock,sothatallbuyersfindtheitemthey arelookingforandatthesame(cid:415)methereisasli(cid:425)leoverproduc(cid:415)onaspossible.Theaimofthis thesisistoinves(cid:415)gatetowhatextentar(cid:415)ficialneuralnetworksaresuitabletoreliablypredict thedemandofbakedgoodsinaretailstorediscounter,forthefollowingday.Thisrequiresa modelingoftheusecasetodeterminethenecessaryinforma(cid:415)onandtheappropriateformof thedataanar(cid:415)ficialneuralnetworkneedsinordertoprovideop(cid:415)maldemandforecasts.The- refore(cid:415)meseries,causalandcompositeforecas(cid:415)ngmodelsareexaminedandimplemented byar(cid:415)ficialneuralnetworks.Inconclusiontheresul(cid:415)ngpredic(cid:415)onsarecomparedtodetermine thebestforecas(cid:415)ngmodel. iii Inhaltsverzeichnis I. Einführung 1 1. Einleitung 2 1.1. Problemstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.1.1. Abgrenzung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2. Mo(cid:415)va(cid:415)onundZielsetzung 4 3. Au(cid:297)auderArbeit 5 II. Theore(cid:415)scheGrundlagen 6 4. BedarfsprognosenundihreEinordnung 7 5. ModellierungvonPrognoseverfahrenimHandel 9 5.1. UrteilsbasiertePrognoseverfahren . . . . . . . . . . . . . . . . . . . . . . . . 9 5.2. DatenbasiertePrognoseverfahren . . . . . . . . . . . . . . . . . . . . . . . . 10 5.2.1. Zeitreihenprognosen . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 5.2.2. KausalePrognosen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 5.2.3. VergleichvonZeitreihen-undkausalerModellierung . . . . . . . . . . 14 5.2.4. KombiniertePrognose . . . . . . . . . . . . . . . . . . . . . . . . . . 15 5.2.5. AnnahmenundNota(cid:415)onzurModellierungvonPrognosen . . . . . . . 18 5.2.6. ÜberblicküberKlassenvondatenzentriertenPrognoseverfahren . . . . 19 6. BeurteilungvonKünstlichenNeuronalenNetzenalsPrognoseverfahrenimHandel 21 6.1. NachteileKünstlicherNeuronalerNetze . . . . . . . . . . . . . . . . . . . . . 24 6.2. VorteileKünstlicherNeuronalerNetze . . . . . . . . . . . . . . . . . . . . . . 25 7. GrundlagenKünstlicherNeuronalerNetze 29 7.1. DasFeedforwardMul(cid:415)layer-Perceptron(MLP) . . . . . . . . . . . . . . . . . . 30 7.1.1. Verarbeitungsschri(cid:425)eimNeuron(V) . . . . . . . . . . . . . . . . . . 33 7.1.2. Informa(cid:415)onsverarbeitungundPropagierung(I) . . . . . . . . . . . . . 36 7.1.3. ParametrisierungdesLernprozesses(L) . . . . . . . . . . . . . . . . . 39 iv Inhaltsverzeichnis III. Prak(cid:415)scheGrundlagen 43 8. Prak(cid:415)scheAnwendungKünstlicherNeuronalerNetze 44 8.1. ModellierungvonPrognosenmitKünstlichenNeuronalenNetzen . . . . . . . 45 8.2. StrukturierungvonhistorischenDatenpaaren . . . . . . . . . . . . . . . . . . 49 8.2.1. Zeitreihenmodellierung. . . . . . . . . . . . . . . . . . . . . . . . . . 49 8.2.2. KausaleModellierung. . . . . . . . . . . . . . . . . . . . . . . . . . . 50 8.2.3. KombinierteModellierung . . . . . . . . . . . . . . . . . . . . . . . . 50 8.3. Trainingsphase . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 8.4. Validierungsphase . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 8.4.1. Over-undUnderfi(cid:427)ng . . . . . . . . . . . . . . . . . . . . . . . . . . 52 8.5. Testphase . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 8.6. ErstellungvonTrainings-,Validierungs-undTestsets . . . . . . . . . . . . . . . 60 IV. Prak(cid:415)scheUmsetzung 62 9. WahldesFrameworks 63 9.1. JOONE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 9.2. Neuroph . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 9.3. Encog . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 10.AnalysederProblemstellung 66 10.1.BeschreibungvonDatenbasisundPrognosegegenstand . . . . . . . . . . . . . 66 10.2.AlgorithmuszurBedarfsannäherung . . . . . . . . . . . . . . . . . . . . . . . 67 10.3.VergleichbarkeitderangestrebtenmitderbestehendenLösung . . . . . . . . 68 10.3.1. ÜbersichtüberbestehendeArchitektur . . . . . . . . . . . . . . . . . 68 10.3.2. ÜbersichtüberKNN-Architektur . . . . . . . . . . . . . . . . . . . . . 70 10.3.3. Vergleichbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 10.3.4. Defini(cid:415)oneinerTeillösung . . . . . . . . . . . . . . . . . . . . . . . . 71 11.Konfigura(cid:415)on,ModellierungundImplemen(cid:415)erung 75 11.1.Konfigura(cid:415)ondesKNN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 11.1.1. Konfigura(cid:415)onderVerarbeitungsschri(cid:425)eimNeuronV . . . . . . . . . . 75 11.1.2. Konfigura(cid:415)onderInforma(cid:415)onsverarbeitungundPropagierungI . . . . 76 11.1.3. Konfigura(cid:415)onderParametrisierungdesLernprozessesL . . . . . . . . 77 11.1.4. ZusammenfassungderKonfigura(cid:415)on . . . . . . . . . . . . . . . . . . 78 11.2.Modellierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 11.2.1. Bes(cid:415)mmungprognoserelevanterVariablen . . . . . . . . . . . . . . . 79 11.2.2. Modellierungsformen . . . . . . . . . . . . . . . . . . . . . . . . . . 81 11.3.Implemen(cid:415)erung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 11.3.1. Normalisierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 11.3.2. MaximaleInput-Matrix . . . . . . . . . . . . . . . . . . . . . . . . . . 85 v Inhaltsverzeichnis 11.4.BewertungderHandhabbarkeitderImplemen(cid:415)erungKNN . . . . . . . . . . . 89 11.4.1. BewertungdesKNN-FrameworksEncog . . . . . . . . . . . . . . . . . 89 11.4.2. BewertungderKomplexitätundHandhabbarkeitderImplemen(cid:415)erung 90 12.Versuchsau(cid:297)auundAuswertung 92 12.1.EingrenzungderModellmenge . . . . . . . . . . . . . . . . . . . . . . . . . . 92 12.1.1. Analyse1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 12.1.2. Analyse2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 12.2.Op(cid:415)mierungdereingegrenztenModellmenge . . . . . . . . . . . . . . . . . . 104 12.2.1. Op(cid:415)mierungdesZeitreihenmodellsZrP(14) . . . . . . . . . . . . . . . 104 12.2.2. Op(cid:415)mierungdeskausalenModellsKaP . . . . . . . . . . . . . . . . . 106 12.2.3. Op(cid:415)mierungdeskombiniertenModellsKoP(7) . . . . . . . . . . . . . 108 12.3.AuswertungundTestdesbestenModells . . . . . . . . . . . . . . . . . . . . 110 12.3.1. AuswertungValidierungsfehler . . . . . . . . . . . . . . . . . . . . . . 110 12.3.2. AuswertungTes(cid:414)ehler . . . . . . . . . . . . . . . . . . . . . . . . . . 114 12.4.ZusammenfassungderVersuchsergebnisse . . . . . . . . . . . . . . . . . . . 117 V. Schlussbetrachtungen 119 13.Fazit 120 14.Ausblick 122 VI. Anhang 123 Glossar 124 Literaturverzeichnis 125 VersicherungüberSelbstständigkeit 131 vi Teil I. Einführung 1 1. Einleitung ZuverlässigeBedarfsprognosenentscheidenimEinzelhandelo(cid:332)überGewinnoderVerlust.Bei einergeringenGewinnmargeistesunerlässlich,dasseinerseitseineausreichendeAnzahleines Ar(cid:415)kelsvorrä(cid:415)gist,damitalleKäuferdengewünschtenAr(cid:415)kelvorfindenaberandererseitsso wenigAbschri(cid:332)enwiemöglichproduziertwerden. Beidurchschni(cid:425)lichenGewinnmargenimLebensmi(cid:425)elEinzelhandelvonuntereinemProzent (Jacobsen,2013)schlägtjederzuvielproduzierteAr(cid:415)kel,jedeStundeunnö(cid:415)geLagerhaltung und jeder ungenutzte Regalmeter nega(cid:415)v zu Buche. Gleichzei(cid:415)g kann ein guter Umsatz nur dann verbucht werden, wenn jeder einzelne Ar(cid:415)kel möglichst o(cid:332) verkau(cid:332) wird. Die Zielset- zung muss also stets lauten: soviel wie nö(cid:415)g und so wenig wie möglich eines Ar(cid:415)kels vorrä- (cid:415)gzuhaben.Dochwielässtsichdiese'goldene'Menge,dienichtzuvielundnichtzuwenig seindarf,ermi(cid:425)eln?HerkömmlicherWeisewirdsicheinesgroßenSpektrumsmathema(cid:415)scher Verfahrenbedient.VonnaivenVerfahren,dieeinePrognoseanhandderletztenVerkaufszahl ermi(cid:425)eln, bis hin zu hochkomplexen sta(cid:415)s(cid:415)schen Verfahren, die ohne die Betreuung durch Wirtscha(cid:332)smathema(cid:415)kernichteingesetztwerdenkönnen.SeitEndedesletztenJahrtausends kommen aber vermehrt Künstliche Neuronale Netze (KNN) zum Einsatz (Vemuri und Rogers, 1994),diedeutlichbessereErgebnisseliefern,alsdienaivenVerfahrenunddeutlichweniger komplexinderAnwendungsindalsdiehochspezialisiertensta(cid:415)s(cid:415)schenPrognoseverfahren. DievorliegendenBachelorarbeituntersuchtinwiefernsichKünstlicheNeuronaleNetzedazu eignen den Bedarf an Backwaren in Filialen eines Einzelhandel-Discounters für den Folgetag zuverlässig zu prognos(cid:415)zieren. Voraussetzung dafür ist eine Modellierung des Anwendungs- falls, um die passenden Informa(cid:415)onen und die geeignete Form der Daten zur Ermi(cid:425)eln, die einKNNbenö(cid:415)gt,umop(cid:415)maleBedarfsprognosenliefernzukönnen. 1.1. Problemstellung ImRahmeneinergroßenSo(cid:332)warelösungfüreinenEinzelhandelsdiscounterhatdieFirmamgm technologypartnerseinModulentwickelt,dasBackmengenempfehlungenerrechnetunddie- sejederFilialetäglichperE-MailzurVerfügungstellt. Die Anforderung besteht darin für alle Filialen mit Backstraßen - also solche die Backwaren selbstbacken-eineBackmengenempfehlungfürdenFolgetagzuerstellen.Diesemusstagge- nau,filialgenauundar(cid:415)kelgenausein.Dasheißt,dassfürjedenÖffnungstag,jedeFilialeund jedendortgebackenenAr(cid:415)keleineBackmengenempfehlungerrechnetwird. 2 1. Einleitung InderbestehendenSo(cid:332)warelösungwirdanjedemTagt(Ermi(cid:425)lungszeitpunkt)fürjedeFiliale einnächtlicherBatchgestartet,derfürjedendortgebackenenAr(cid:415)keleineBackmengenemp- fehlungfürdenTagt+1(Prognosezeitpunkt)errechnet.DerBerechnungsalgorithmus¹basiert aufdenhistorischenAbverkaufszahlendieserFiliale,dieüberdieScannerkassenundeinan- gebundenes Datawarehouse bereitgestellt werden. Aus dieser Datenmenge wählt der Algo- rithmusnVergleichstagezut+1,streichtdenTagmitdemgeringstenAbverkaufundbildet über die restlichen Werte den Mi(cid:425)elwert. Die Vergleichbarkeit der Tage ist über die Gleich- heitdesWochentagesdefiniert.DieserVorgangistinderfolgendenTabelle1.1exemplarisch dargestellt. Vergleichstag Abverkaufzahl MontagKW20 17 MontagKW21 15 MontagKW22 13 MontagKW23 11 MontagKW24 8 MontagKW25 23 MontagKW26 19 SummeAbverkauf 106 BereinigteSumme 98 Mi(cid:425)elwertüberbereinigteSumme 98/6=16 Prognose:MontagKW27 16 Tabelle1.1.:Mi(cid:425)elwertbildungüberVergleichstagemitn = 7 1.1.1. Abgrenzung Die hier erwähnte Backmengenempfehlung ist das Endprodukt der Implemen(cid:415)erung beim Kunden.DessenGrundlageeinezuvorermi(cid:425)elteBedarfsprognoseist.Dieserprognos(cid:415)zierte Bedarfwirddannaberu.a.nochaufverschiedenenZei(cid:414)ensterverteilt,eswerdenBackblech- belegungenerrechnetundÜberhängeaufZusatzblechenzusammengefasst.AmEndedieses Prozesses,stehteinversandfer(cid:415)gesPDFmitallennö(cid:415)genInforma(cid:415)onenfürdieeinzelnenFili- alleiter.DieBackmengenempfehlungist,imGegensatzzurBedarfsprognose,nichtGegenstand dieserArbeit. ¹DerBerechnungsalgorithmusdarfauslizenzrechtlichenGründenhiernurvereinfachtundinAnsätzendarge- stelltwerden. 3 2. Mo(cid:415)va(cid:415)on und Zielsetzung Wie in Abschni(cid:425) 1.1 beschrieben, handelt es sich bei der vorliegenden Problemstellung um einenAnwendungsfallauseinerbereitsproduk(cid:415)venSo(cid:332)warelösung.DerbeschriebeneAnsatz istseitJahrenbeimKundenimEinsatzundsolldurchdieseArbeiteinemöglicheAlterna(cid:415)ve aufgezeigtbekommen. DazuwerdenfolgendeFragestellungenuntersucht: 1. WielässtsichdieProblemstellungop(cid:415)malmodellieren,ummitHilfevonKNNgelöstzu werden? 2. WieguteignensichKNNzurErmi(cid:425)lungvonBedarfsprognosenfürBackwarenimEinzel- handel und wie schneiden diese Prognosen im Vergleich zum bisher eingesetzten Pro- gnoseverfahrenab? AußerdemsollenwährendderBearbeitungdergenanntenFragestellungen,Erfahrungenbzgl. derHandhabbarkeiteinerKNN-Lösung,imUmfeldeinerklassischenJavaSo(cid:332)wareentwicklung, gesammeltundkompaktzusammengefasstwerden. 4
Description: