Obsah 1 Pˇredmluva 4 2 U´VOD DO REGRESN´I ANALY´ZY 9 3 LINERN´I REGRESN´I MODEL 19 3.1 Odhad regresn´ıch koeficient˚u . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 3.2 Odhad rozptylu n´ahodny´ch fluktuac´ı . . . . . . . . . . . . . . . . . . . . . . . . . 35 4 DIAGNOSTIKA ODHADU REGRESN´IHO MODELU 43 4.1 Rozdˇelen´ı kvadraticky´ch forem . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 4.2 Rozdˇelen´ı odhadu rozptylu n´ahodny´ch fluktuac´ı a studentizovany´ch odhad˚u re- gresn´ıch koeficient˚u . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 4.3 Koeficient determinace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 4.4 Intervaly a p´asy spolehlivosti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 4.5 Testov´an´ı submodel˚u . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 4.6 Vy´bˇer modelu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 5 VY´STUPY Z POCˇTACˇOVY´CH KNIHOVEN 60 5.1 Tabulky vy´sledk˚u . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 5.2 Grafy rezidu´ı . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 6 OVEˇRˇOVA´N´I ZA´KLADN´ICH PRˇEDPOKLADU˚ 72 6.1 Homoskedasticita a heteroskedasticita . . . . . . . . . . . . . . . . . . . . . . . . 72 6.1.1 Pˇr´ıklady situac´ı s heteroskedasticky´mi fluktuacemi . . . . . . . . . . . . . 72 6.1.2 Modely heteroskedasticity . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 6.1.3 Testy homoskedasticity . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 6.1.4 Z´avˇer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 6.2 Normalita n´ahodny´ch fluktuac´ı . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 6.3 Nez´avislost n´ahodny´ch fluktuac´ı . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 6.4 Nez´avislost vysvˇetluj´ıc´ıch promˇenny´ch a n´ahodny´ch fluktuac´ı . . . . . . . . . . . 92 6.4.1 vod a pˇr´ıklady situac´ı poruˇsen´ı nez´avislosti . . . . . . . . . . . . . . . . . 92 6.4.2 Instrument´aln´ı promˇenn´e . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 6.4.3 Hausman˚uv test nez´avislosti regresor˚u a n´ahodny´ch fluktuac´ı . . . . . . . 97 6.4.4 Z´avˇer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 7 U´VAHY O SENSITIVITEˇ MODELU 100 7.1 Efekt podurˇcen´ı . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 7.2 Efekt pˇreurˇcen´ı . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102 7.3 Vliv jednoho pozorov´an´ı . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 7.4 Kolinearita . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 7.4.1 Zdroje a rozpozn´an´ı kolinearity . . . . . . . . . . . . . . . . . . . . . . . . 107 7.4.2 Hˇrebenov´a regrese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 7.4.3 Odhady s line´arn´ımi ohraniˇcuj´ıc´ımi podm´ınkami . . . . . . . . . . . . . . 113 7.4.4 Alternativn´ı indik´atory kolinearity a jejich z´aludnosti . . . . . . . . . . . 120 7.4.5 Alternativn´ı ˇreˇsen´ı probl´emu kolinearity . . . . . . . . . . . . . . . . . . . 123 7.4.6 Z´avˇer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 8 NEˇKTERE´ SPECIA´LN´I TYPY REGRESN´IHO MODELU 128 8.1 Zobecnˇeny´ regresn´ı model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 8.2 Model s diskr´etn´ı vysvˇetlovanou promˇennou . . . . . . . . . . . . . . . . . . . . . 129 8.2.1 Probl´emyspouˇzit´ımklasick´ehoregresn´ıhomodeluprobin´arn´ıvysvˇetlovanou veliˇcinu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130 8.2.2 Model s bin´arn´ı moˇznost´ı vy´bˇeru . . . . . . . . . . . . . . . . . . . . . . . 131 8.2.3 Odhady parametr˚u v line´arn´ım pravdˇepodobnostn´ım modelu . . . . . . . 132 8.2.4 Odhady parametr˚u v probitov´em a logitov´em modelu . . . . . . . . . . . 134 8.2.5 Diskuze k pouˇzit´ı probitov´eho a logitov´eho modelu . . . . . . . . . . . . . 138 8.3 Model s kategori´aln´ımi vysvˇetluj´ıc´ımi promˇenny´mi . . . . . . . . . . . . . . . . . 139 8.4 Vysvˇetluj´ıc´ı promˇenn´e mˇeˇren´e s n´ahodny´mi chybami . . . . . . . . . . . . . . . . 141 8.5 Aproximace nepˇr´ıstupny´ch vysvˇetluj´ıc´ıch veliˇcin. . . . . . . . . . . . . . . . . . . 143 9 MODEL S V´ICEROZMEˇRNOU VYSVEˇTLOVANOU PROMEˇNNOU 144 9.1 Zd´anlivˇe nesouvisej´ıc´ı rovnice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144 9.2 Simult´an´ı rovnice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147 9.2.1 Probl´em identifikace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151 9.2.2 Identifikace pomoc´ı omezen´ı na kovarianˇcn´ı matici n´ahodny´ch fluktuac´ı . 154 9.2.3 Dvoustupnˇovy´ odhad metodou nejmenˇs´ıch ˇctverc˚u . . . . . . . . . . . . . 155 9.2.4 Trojstupnˇovy´ odhad metodou nejmenˇs´ıch ˇctverc˚u . . . . . . . . . . . . . . 157 10 ANALY´ZA VARIANCE 159 10.1 Jednoduch´e tˇr´ıdˇen´ı . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159 10.2 Dvojn´e tˇr´ıdˇen´ı . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163 11 NEˇKTERE´ NETRADICˇN´I METODY REGRESN´I ANALY´ZY 171 12 Literatura 174 13 Autorsky´ rejstˇr´ık 181 14 Vˇecny´ rejstˇr´ık 184 4 1 Pˇredmluva Zpracov´an´ıdat,at’uˇzjsounumerick´ehoˇcikategori´aln´ıcharakteru,sestalovmodern´ıvˇedˇejednou ze standarn´ıch metod vyhodnocov´an´ı informace. Zpracov´an´ı samo je pak obvykle zaloˇzeno na nˇejak´e naˇs´ı pˇredstavˇe o charakteru dat, ˇci chcete-li o mechanizmu, ktery´ generoval dan´a data. Zm´ınˇen´a pˇredstava je zpravidla formalizov´ana do nˇejak´e vˇedeck´e, ˇci se tak alesponˇ tv´aˇr´ıc´ı, teorie. Koneˇcnˇe pak vy´sledky zpracov´an´ı jsou pokl´ad´any za objektivn´ı zjiˇstˇen´ı o svˇetˇe, ktery´ n´as obklopuje a ktery´ se takto pokouˇs´ıme pochopit a (naivnˇe) ovl´adnout. Cely´ tento postup je obklopen, ˇci sp´ıˇse “proniknut” celou ˇradou my´t˚u a zav´adˇej´ıc´ıch pˇredstav, kter´e maj´ı sv´e historick´e koˇreny v renesanci a osv´ıcenectv´ı, a sv´e ideov´e a moˇzn´a, ˇze by bylo pˇresnˇejˇs´ı ˇr´ıci ideologick´e, koˇreny v py´ˇse ˇclovˇeka, coby p´ana pˇr´ırody. Nˇekdy jdou pˇredstavy tˇech, kteˇr´ı toto zpracov´an´ı aplikuj´ı aˇz tak daleko, ˇze kaˇzd´e jin´e zpracov´an´ı informace pokl´adaj´ı pˇrinejmenˇs´ım za druhoˇrad´e, ne-li rovnou za bezcenn´e. Dodejme rovnou, ˇze obvykle jsou to ti, kteˇr´ı nekriticky obdivuj´ı vˇedeck´e pozn´an´ı a neuvˇedomuj´ı si ani re´aln´e moˇznosti modern´ı vˇedy, na stranˇe jedn´e, ani jej´ı nepˇrekroˇciteln´e hranice, na stranˇe druh´e. Skripta, kter´a m´ate pˇred sebou, jsou vy´kladem jedn´e z metod zpracov´an´ı dat, a dodejme, ˇze jedn´e z nejefektivnˇejˇs´ıch, totiˇz regresn´ı analy´zy. Jako takov´a nab´ıdnou propracovanou teorii, ˇci pˇresnˇeji ˇreˇceno, jej´ı ˇc´ast, kterou bychom dnes mohli nazvat snad klasickou ˇc´ast´ı regresn´ı analy´zy. Tato je t´emˇeˇr vy´hradnˇe zaloˇzena na metodˇe nejmenˇs´ıch ˇctverc˚u a zhruba po tˇrech desetilet´ıch budov´an´ı robustn´ı statistiky, je jiˇz souˇcasn´e dobˇe menˇs´ıˇc´ast´ı teorie regrese. D˚uvody, proˇc se t´eto klasick´e teorii budeme vˇenovat, jsou n´asleduj´ıc´ı. Mezi uˇzivateli je mimo jakoukoliv pochybnost st´ale nejv´ıce zn´ama a nejv´ıce uˇz´ıv´ana, aˇc se snadno prok´aˇze, ˇze metoda nejmenˇs´ıch ˇctverc˚u je jednou z nejn´achylnˇejˇs´ıch k “vyprodukova´n´ı” zav´adˇej´ıc´ıch vy´sledk˚u. T´ım sp´ıˇse je tˇreba si ji osvojit tak, abychom vˇcas rozpoznali, kdy k nˇeˇcemu takov´emu m˚uˇze doj´ıt. Dalˇs´ım d˚uvodem je pak to, ˇze jsou jej´ı vy´sledky velmi ˇcasto chybnˇe interpretov´any a to i v pˇr´ıpadˇe, ˇze jej´ı vy´sledky jsou korektn´ı. T´ım sp´ıˇse je tˇreba si ji osvojit tak, abychom vˇcas rozpoznali, kdy k nˇeˇcemutakov´emudoˇsloaumˇelitouv´estnapravoum´ıru.Dalˇs´ımd˚uvodemjenepochybnˇetak´eto, ˇzenab´ız´ısnadnoakceptovatelnougeometrickouinterpretaci(ted’mluv´ımeointerpretacimetody nikoliv o interpretaci vy´sledk˚u, aby bylo jasno). Pochopen´ı t´eto interpretace metody nejmenˇs´ıch ˇctverc˚u n´as snad nejl´epe vyzbroj´ı k rozpozn´an´ı v´yhod i nev´yhod jin´ych metod odhadu regresn´ıch koeficient˚u.Koneˇcnˇepakkomplexnostt´etoklasick´eteorie,zejm´enapakjej´ırozs´ahl´ediagnostick´e partie napov´ıdaj´ı a zkuˇsenosti to potvrzuj´ı,ˇze bez zevrubn´e a eficientn´ı aposteriorn´ı diagnostiky nen´ı nadˇeje na spolehlivost odhadnut´eho modelu solidnˇe podepˇrena. To n´am umoˇzn´ı postavit se kriticky k tˇem metod´am, obvykle ad hoc vyvinut´ych na z´akladˇe zd´anlivˇe rozumn´e heuristiky, 1 kter´e takov´yto “doprovodn´y” apar´at nenab´ızej´ı ˇci jej alesponˇ neumoˇznˇuj´ı pˇrevz´ıt z klasick´e regrese. Dˇr´ıve neˇz se vˇsak pust´ıme do vlastn´ıho vy´kladu, vrat’me se alesponˇ velmi struˇcnˇe k tomu, 1Vpr˚ubˇehudalˇs´ıhovy´kladubudenˇekolikra´tpouˇzitoslovo heuristika,kter´enepatˇr´ımezinejbˇeˇznˇejipouˇz´ıvana´ slova kaˇzdodenn´ı ˇceˇstiny. Upˇresnˇeme proto, co budeme t´ımto slovem rozumˇet. T´ımto slovem budeme oznaˇcovat jaky´si soubor idej´ı a pˇredstav, ˇci “rozumovy´ch” argument˚u, kter´e cosi vysvˇetluj´ı, obvykle d˚uvody, proˇc urˇcitou teorii ˇci jej´ı ˇca´st vytv´aˇr´ıme pr´avˇe tak, jak pak d´ale n´asleduje. Nejde tedy jen o filozofick´e pˇredstavy, ale o cosi ˇsirˇs´ıho, zaloˇzen´eho na “racion´aln´ım” pˇr´ıstupu ke svˇetu, coˇz vˇsak, pr´avˇe d´ıky t´e “zˇrejm´e racionalitˇe” se m˚uˇze uk´azatvr´amciformalizovan´eteorieinkonsistentn´ı,lich´eˇcizava´dˇej´ıc´ı.Vzpomenˇmejentoho,ˇzevzhledemktomu, ˇze mezi kaˇzdy´mi dvˇema racion´aln´ımi ˇc´ısly je iracion´aln´ı a kaˇzdy´mi dvˇema iracion´aln´ımi je racion´aln´ı, “zdravy´” rozum (nˇekdy t´eˇz oznaˇcovany´ jako “selsky´”) usoud´ı,ˇze je jich stejn´e mnoˇzstv´ı. 5 co bylo ˇreˇceno na zaˇc´atku, totiˇz k nˇektery´m my´t˚um, ˇci chcete-li k filozofii, kter´a stoj´ı v pozad´ı zpracov´an´ı dat, zejm´ena v pozad´ı interpretace vy´sledk˚u. Renesance pˇrinesla lidstvu osvobozen´ı od mnoha dogmat, kter´a jej do t´e doby svazovala, ale z dneˇsn´ıho pohledu jsme jiˇz schopni zˇretelnˇe nahl´ednout, ˇze nastolila mnoh´a jin´a dogmata, kter´aˇzelBohust´alejeˇstˇepˇreˇz´ıvaj´ı.Jedn´ımznichjenekriticky´ obdivkvˇedˇe,ktery´ jevˇsakproni obvykle medvˇed´ı sluˇzbou. Mˇejme vˇzdy na pamˇeti, byt’ budeme st´at v tv´aˇri v tv´aˇr neju´ˇzasnˇejˇs´ım metod´am, kter´e modern´ı vˇeda nab´ız´ı, ˇze je tato jen a jen vy´tvorem lidsk´eho ducha a zasluhuje si n´aˇs obdiv, nikoliv vˇsak nekriticky´. Nav´ıc omezenost jej´ıch moˇznosti je v´ıc neˇz patrn´a. Staˇc´ı si uvˇedomit, ˇze na ˇradu velmi z´avaˇzny´ch, ne-li nejpodstatnˇejˇs´ıch probl´em˚u lidsk´eho ˇzivota, vˇeda nem´a a ani nem˚uˇze m´ıt uspokojivou odpovˇed’. Jsou to napˇr. ot´azky po smyslu lidsk´eho ˇzivota, po tom, odkud se bere l´aska, touha ˇci nadˇeje. Odpovˇedi na tyto ot´azky mus´ıme hledat jinde, napˇr. v teologii, kter´a vˇsak zase pˇrirozenˇe neum´ı tak dobˇre pˇredpov´ıdat, jaky´ ˇze bude napˇr. hruby´ n´arodn´ı d˚uchod v pˇr´ıˇst´ım ˇctvrtlet´ı. Renesance vˇsak pˇrinesla jeˇstˇe dalˇs´ı pˇredstavy, kter´e se dnes jev´ı jiˇz jen tˇeˇzko udrˇziteln´e (z hlediska modern´ı filozofie vˇedy), ale kter´e jeˇstˇe st´ale ovlivnˇuj´ı pohled modern´ıho ˇclovˇeka na to, co to vlastnˇe vˇeda je. Jednou z nich je pˇredstava, ˇze za abstrakc´ı, kterou uˇcin´ıme na z´akladˇe pozorov´an´ı (mnoha) opakov´an´ı t´ehoˇz jevu, ˇcasto navozen´eho pevnˇe dany´mi okol- nostmi, napˇr. upuˇstˇeny´ k´amen vˇzdy pad´a k zemi, stoj´ı jak´asi entita (gravitace), kterou sice nem˚uˇzeme “na vlastn´ı oˇci” vidˇet (tak jak nem˚uˇzeme napˇr. vidˇet vzduch), ale kter´a, podobnˇe jako vzduch objektivnˇe existuje a projevuje se nˇejakou kauz´aln´ı z´akonitost´ı (viz vy´ˇse zm´ınˇen´a pˇredstava o mechanizmu, ktery´ generoval data). Tato z´akonitost je pak pops´ana teori´ı, pˇriˇcemˇz za ide´aln´ı se povaˇzuje matematicky zformalizovan´a teorie. K jej´ı verifikaci se pak pouˇzije pokus, ve kter´em se zkouman´e objekty zachovaj´ı tak, jak to “pˇredpov´ı” tato teorie. Renesaˇcn´ı vˇeda pak pˇredpokl´adala, ˇze svˇet se vlastnˇe skl´ad´a z (koneˇcn´eho) poˇctu takovy´ch z´akonitost´ı, ˇci chcete-li princip˚u, kter´e byly jednoznaˇcnˇe do svˇeta veps´any jeho p˚uvodn´ım hybatelem ˇci se (po velk´em tˇresku2) samy od sebe nˇejak objektivnˇe ustavily. Pokusme se ponˇekud hloubˇeji proniknout do toho, co bylo pr´avˇe ˇreˇceno. Jiˇz v 18. stolet´ı napsal Immanuel Kant, ˇze Galileo Galilei podrobil pˇr´ırodu v´yslechu a idealizoval ji, to jest zmrzaˇcil ji tak, aˇz byla ochotna hovoˇrit jazykem, kter´y od n´ı chtˇel slyˇset, tj. jazykem matematiky. Aˇz pˇriznala, ˇze se odjakˇziva ˇr´ıd´ı onˇemi jednoduch´ymi principy, tj. z´akonitostmi. Galileo Galilei nenaslouchal pˇr´ırodˇe jako ˇz´ak uˇciteli, naslouchal ji jako soudce u´trpn´eho pr´ava. (Viz Prigogine a Stengers (1977).) Zamysl´ıme-li se nad celou vˇec´ı, snadno nahl´edneme onu “troufalost”, kter´a si mysl´ı, ˇze vysvˇetlen´ı, zejm´ena kauz´aln´ı vysvˇetlen´ı, kter´e jsme tou ˇci onou teori´ı podali, je jedin´e moˇzn´e. Ostatnˇe jiˇz Karl R. Popper v B´ıdˇe historicismu (Popper (1957)) naznaˇcil, ˇze vˇsichni ti, kteˇr´ı si mysl´ı, ˇze naˇsli jedin´e moˇzn´e z´akonit´e, pokud moˇzno deterministicky kauz´aln´ı vysvˇetlen´ı trp´ı jen nedostatkem fantazie (ne-li i nˇeˇc´ım horˇs´ım)3. Je naprosto jasn´e, ˇze vy´ˇse uveden´e abstrakce (jako je napˇr. gravitace) jsou nesm´ırnˇe uˇziteˇcn´e, nebot’ dovoluj´ı popsat urˇcity´ jevnar´azanikolivvjehojednotlivostech.Nadruh´estranˇe,uzn´an´ıˇcipˇrijmut´ıobjektivn´ıexistence takov´e entity (jako napˇr. gravitace) vyˇzaduje pˇrinejmenˇs´ım velice rozs´ahlou diskuzi o tom, co to je objektivn´ı existence, ale sp´ıˇse to prostˇe vyˇzaduje urˇcity´ krok v´ıry. 2Ten samozˇrejmˇe renesance jeˇstˇe nepˇredpokl´adala, proto ty z´avorky. 3Pros´ım vzpomenˇte si na Karla Rainmunda Poppera vˇzdy, kdykoliv V´as nˇekdo bude pˇresvˇedˇcovat, ˇze jedinˇe on m´a pravdu; trp´ı jen (snad jen) nedostatkem pˇredstavivosti. 6 V pracech Ilji Prigogina a Isabely Stengersov´e (viz napˇr. Prigogine a Stengers (1984)) pak zv´ıdavy´ ˇcten´aˇr m˚uˇze tak´e nal´ezt diskuzi k tomu, ˇze podobn´e, ˇcasto velmi nezˇreteln´e a tud´ıˇz ˇspatnˇe rozpoznateln´e kroky v´ıry si vyˇzaduj´ı i ty “nejprimitivnˇejˇs´ı” poˇc´atky zkoum´an´ı svˇeta, kter´e uˇcin´ıme uˇz ve sv´em rann´em dˇetstv´ı. Jejich pr´ace diskutuj´ı rovnˇeˇz “sklon” vˇedecky´ch teori´ı ke kauzalitˇe. Touha po dosaˇzen´ı teorie maj´ıc´ı charakter kauz´aln´ıch souvislost´ı m´a svoje koˇreny rovnˇeˇz v renesanci. Problematiˇcnost tohoto pojmu zaˇcala by´t zˇrejm´a v modern´ı fyzice a odv´ıj´ı se od prac´ı Nielse Bohra. Zd´anlivˇe tato problematika souvis´ı s neˇreˇsitelnou a vlastnˇe v podstaˇe zav´adˇej´ıc´ı ot´azkou o deterministick´em ˇci indeterministick´em charakteru svˇeta. Ve skuteˇcnosti vˇsak jedn´a o ot´azku adekv´atnosti (akceptovatelnosti, vy´hodnosti atd.) kauz´aln´ıhoˇci pravdˇepodobnostn´ıhopopisusvˇeta.Zd˚uraznˇeme,ˇzetozdazvol´ımepropopissvˇetakauz´aln´ıteorii ˇci teorii vyuˇz´ıvaj´ıc´ı pravdˇepodobnostn´ı formalizmus, ˇci jiny´ n´astroj na formalizaci neurˇcitosti a nejistoty, nikterak nevypov´ıd´a o tom, zda si mysl´ıme, ˇze svˇet je deterministicky´ ˇci nikoliv. Jak jsme totiˇz uk´azali vy´ˇse, n´azor, ˇze naˇse teorie vysvˇetluj´ı jaky´ svˇet “ve skuteˇcnosti” je, je jen tˇeˇzko udrˇzitelny´. Tato problematika je u´zce sv´az´ana s vy´sledky Kurta Gdela o neu´plnosti bezesporny´ch axiomaticky´ch syst´em˚u. Jeho vy´sledky patrnˇe napov´ıdaj´ı, ˇze pravdˇepodobnostn´ı popis svˇeta je inherentnˇe vloˇzen do naˇseho racion´aln´ıho uvaˇzov´an´ı zakotven´eho v matamatice tak, jak se historicky vyvinula. Vy´ˇse jsme ˇrekli, ˇze renesanˇcn´ım ide´alem “vysvˇetluj´ıc´ı” teorie byla matematicky formalizo- van´a teorie. To patrnˇe plat´ı i dnes. Pr´avˇe naznaˇcen´a diskuze naznaˇcila, ˇze c´ılem budov´an´ı (for- malizovany´ch)teori´ıdostdobˇrenem˚uˇzeby´tobjektivn´ı, jednoznaˇcn´evysvˇetlen´ısvˇeta.Spokoj´ıme- li se vˇsak se skromnˇejˇs´ım c´ılem, totiˇz s nalezen´ım n´astroje na funkˇcn´ı predikci, bude jedno, zda takovy´ch n´astroj˚u bude v´ıce ˇci jen jeden. Hlavnˇe, kdyˇz bude d´avat spolehliv´e pˇredpovˇedi ˇci n´avody, chcete-li, jak napˇr. urovnat v´aleˇcn´e konflikty, zvy´ˇsit u´rodu a zm´ırnit hlad mnoha n´arod˚u. Samozˇrejmˇe,ˇze pak formalizovanˇejˇs´ı teorie m´a vˇetˇs´ı cenu neˇz jak´esi v´agn´ı z´avˇery, nebot’ m´a vˇetˇs´ı nadˇeji d´at efektivnˇejˇs´ı pˇredpovˇedi. Je nutn´e si vˇsak uvˇedomit, ˇze kaˇzd´a takov´a teorie se op´ır´a o zkuˇsenost. Cˇ´ım je tato zkuˇsenost d˚uvˇeryhodnˇejˇs´ı, tj.ˇc´ım jsou data, kter´a jsme pouˇzili spolehlivˇejˇs´ı a pˇresnˇejˇs´ı, t´ım m˚uˇze by´t i vy´sledek formalizovanˇejˇs´ı. Kaˇzdy´, kdo vˇzivotˇe prov´adˇel nˇejak´e vy´poˇcty, si je vˇedom toho, ˇze nem´a obvykle cenu ud´avat vy´sledek na deset desetinny´ch m´ıst, byla-li data mˇeˇrena s pˇresnost´ı na jedno desetinn´e m´ısto. Jedn´ım z dalˇs´ıch my´t˚u, ktery´ dosud pˇreˇzil a ktery´ je “u´spˇeˇsnˇe pouˇz´ıv´an” je vy´ˇse zm´ınˇeny´ my´tus ovˇeˇrovac´ıho pokusu. Je aˇz zar´aˇzej´ıc´ı, ˇze ˇcasto i vˇedeˇct´ı pracovn´ıci, ktery´m se dostalo alesponˇelement´arn´ıhostatistick´ehovzdˇel´an´ı,sineuvˇedomuj´ı,ˇzeovˇeˇrovac´ıpokusnen´ınicv´ıceani nicm´enˇeneˇztestov´an´ıhypot´ezy.Tobud’hypot´ezuzam´ıtnenebonezam´ıtne,alenikdynepotvrd´ı - kromˇe uˇcebnicovy´ch akademicky´ch pˇr´ıpad˚u, kdy hypot´eza a alternativa jsou komplement´arn´ı. Koneˇcny´, neodvolateny´ verdikt o teorii m˚uˇze by´t jen zam´ıtavy´, totiˇz kdyˇz pˇredpovˇed’ selˇze. Jinak si lze vˇzdy pˇredstavit,ˇze jin´a data (jin´e okolnosti, chcete-li toˇr´ıci jinak) mohou naˇsi teorii (hypot´ezu) docela dobˇre vyvr´atit. Cˇ´ısla 3, 5, 7, 11, 13 jsou sice lich´aˇc´ısla a prvoˇc´ısla, ale to jeˇstˇe neznamen´a, ˇze jin´a ˇc´ısla teorii o tom, ˇze vˇsechna lich´a ˇc´ısla jsou prvoˇc´ısla, nemohou vyvr´atit. Z´avˇerem t´eto kr´atk´e exkurze do filozofie (matematick´eho) modelov´an´ı si dovolme jeˇstˇe jednu pozn´amku.Taostatnˇerovnˇeˇzsouvis´ıscharakteremvˇedecky´chteori´ı,takjakbylvy´ˇsediskutov´an. V souvislosti s t´ım,ˇze mnohdy se st´ale m´a za to,ˇze teorie je jaky´msiobjektivn´ım obrazem svˇeta, ˇcasto oproˇstˇen´eho od spousty nepodstatny´ch vˇec´ı a okolnost´ı, interpretuje se to, co “vyˇslo” po aplikaci nˇekter´e teorie jako jak´esi objektivn´ı zjiˇstˇen´ı. To co “vyˇslo”, je pokl´ad´ano za cosi, co 7 stoj´ı kdesi za daty, ˇci chcete-li, co je nˇejak v nich ukryto a k ˇcemu jsme se pr´avˇe pomoci naˇsich matematicky´ch n´astroj˚u dopracovali. Podobnˇe jako kdyˇz oloupemeˇslupky z cibule, najdeme jej´ı j´adro. Potom z´avˇery analy´zy dat prezentujeme tak, ˇze to tak objektivnˇe vyˇslo. Aˇckoliv to tak moˇzn´a na prvn´ı pohled vypad´a, ve skuteˇcnosti tomu tak nen´ı. Abychom to nahl´edli vrat’me se jeˇstˇe kr´atce k vy´ˇse uveden´e diskuzi. Uvˇedommesi,ˇzevy´ˇsezm´ınˇen´aabstrakceproveden´anaz´akladˇeopakov´an´ımnohapodobny´ch jev˚u je vˇec proveden´a nˇektery´m subjektem, tj. badatelem. Na tomto m´ıstˇe pros´ım ˇcten´aˇre, aby se oprostil od marxismem pˇestovan´eho pejorativn´ıho n´adechu slova subjektivn´ı, nebot’ dokud bude vˇeda prov´adˇena jednotlivy´mi muˇzi a ˇzenami, bude vˇzdy subjektivn´ı v tom smyslu, ˇze odpovˇednost za vy´ˇse naznaˇcenou abstrakci, pr´avˇe tak jako za vytvoˇren´ı teorie a jej´ı pˇr´ıpadnou aplikaci nese (postupnˇe) ten, kdo ji provedl, vymyslel a pˇr´ıpadnˇe rozhodl aplikovat. Nanejvy´ˇse m˚uˇze doj´ıt k “zobjektivozov´an´ı” tohoto postupu t´ım, ˇze se na nˇem shodne v´ıce odborn´ık˚u z dan´e oblasti. Ani to vˇsak nezmˇen´ı charakter vy´sledku na objektivn´ı ˇci spr´avn´y ˇci udrˇziteln´y (pˇr´ıpadnˇe si ˇcten´aˇr m˚uˇze doplnit jin´e vzneˇsen´e slovo). Staˇc´ı vzpomenout “zobjektivizovany´” n´azor mnoha stˇredovˇeky´ch odborn´ık˚u o geocentrick´e podstatˇe naˇseho planet´arn´ıho syst´emu. Podobnˇe pˇri analy´ze dat volba metody a interpretace vy´sledk˚u je zcela na zodpovˇednosti toho, kdo ji pouˇzil a vy´sledky interpretoval. Prohl´as´ıli nˇekdo,ˇze cosi objektivnˇe vyˇslo bud’ se boj´ı n´est odpovˇednost za vy´sledek nebo cosi nalh´av´a sobˇe a ostatn´ım. Na z´avˇer pˇredmluvy jeˇstˇe uved’me dvˇe technick´e pozn´amky. Pˇrednˇe dodejme, ˇze pˇredkl´adan´a skripta jiˇz sama o sobˇe pˇredstavuj´ı takovy´ objem textu, ktery´jenasam´ehranicimoˇznost´ıby´tivyloˇzenvjednomsemestru.Protonebylomoˇznodoskript zaˇraditdalˇs´ıpartie,kter´ejsousiceu´zcesv´az´anysregresn´ıanaly´zou(robustn´ıregrese,dynamicky´ modelspolusalesponˇ kr´atkouexkurz´ıdoˇcasovy´chˇrad,atd.),alekter´ejsoustejnˇepˇredn´aˇsenyaˇz v r´amci vy´bˇerov´e pˇredn´aˇsky, navazuj´ıc´ı na tu, pro kterou jsou urˇcena tato skripta. Proto autor pl´anuje napsat dalˇs´ı d´ıl skript (v pr˚ubˇehu jednoho aˇz dvou let), ktery´ (pˇrinejmenˇs´ım) pokryje pr´avˇe zm´ınˇen´e partie. Mezi pˇripom´ınkami tˇech, kteˇr´ı rukopis skript ˇcetli se nˇekdy objevila ta, ˇze text je pˇr´ıliˇs zat´ıˇzen vsuvkami um´ıstˇeny´mi v z´avork´ach. Ostatnˇe je zn´amo, ˇze nˇekter´e ˇcasopisy bud’ zcela nebot´emˇeˇrodm´ıtaj´ıtext,vekter´emjsouz´avorky.Tojepˇr´ıstupnepochybnˇeextr´emn´ıaponˇekud nerozumny´. Je sice pravda, ˇze to, co je um´ıstˇeno v z´avork´ach, lze vˇzdy vyj´adˇrit dalˇs´ı vˇetou um´ıstˇenou kdesi d´ale v textu, ˇci vedlejˇs´ı vˇetou, ale je to (prakticky) vˇzdy za cenu vˇetˇs´ıho m´ısta. Napˇr. z´avorky u slova prakticky v pˇredchoz´ı vˇetˇe d´avaj´ı tuˇsit, ˇze je to cel´e m´ınˇeno s jakousi pravdˇepodobnost´ı, tj. plat´ı to maliˇcko slabˇeji, neˇz by to platilo bez tˇech z´avorek. Podobny´ pˇr´ıklad z n´ıˇze uveden´eho textu, totiˇz : “Naprosto pˇr´ımoˇcary´m zobecnˇen´ım tohoto modelu je model uvaˇzuj´ıc´ı soubor M regresn´ıch rovnic typu (3), kter´e spolu (na prvn´ı pohled) nesouvisej´ı (odtud n´azev).” demonstruje, ˇze ˇceˇstina (tedy alesponˇ psany´ jazyk) pomoc´ı z´avorek rozvinula cosi, co moˇzn´a ˇrada jiny´ch jazyk˚u nem´a. Pokud by totiˇz ono na prvn´ı pohled nebylo v z´avorce, znamenalobytosdˇelen´ı,ˇzerovnicespoluopravdunesouvisej´ı,dokonceevidentnˇenesouvisej´ı,jak je vidˇet na prvn´ı pohled. Takto naopak vˇetaˇr´ık´a,ˇze se na prvn´ı pohled zd´a,ˇze spolu nesouvisej´ı, alenen´ıtopravda,rovnicespolunˇejaksouvisej´ı.Vˇsimli jste si kolik m´ısta nav´ıc jsme potˇrebovali. Samozˇrejmˇe, ˇze to nˇekdy ˇcin´ı ˇcten´ı textu m´enˇe plynul´e, coˇz vˇsak tak´e m˚uˇze znamenat, ˇze to ˇcten´aˇredonut´ıpˇreˇc´ıstsidanouvˇetudvakr´atat´ımvypadnoutz“polosp´anku”,dokter´ehoupad´a, je-li text pˇr´ıliˇs plynuly´. Na druh´e stranˇe, nˇekdy je tˇreba, aby ˇcten´aˇr plynule sledoval l´ınii u´vah, 8 nebot’ jinak nedojde ke stejn´emu z´avˇeru jako autor. (Nˇekteˇr´ı autoˇri, zejm´ena ve “spoleˇcensko- vˇedn´ı” oblasti tento princip vyuˇz´ıvaj´ı tak obratnˇe, ˇze ˇcten´aˇr pak jen tˇeˇzko hled´a bod, ve ktr´em autor uˇcinil “krok stranou” a t´ım doˇsel pr´avˇe k tomu, k ˇcemu chtˇel doj´ıt.) Pˇrirozenˇe jako vˇsechnyn´astrojeusnadnˇuj´ıc´ısdˇelov´an´ıinformac´ı,takitentomus´ım´ıtsvojim´ıru.Ostatnˇeˇz´adny´ extr´emismus nen´ı nikdy ku prospˇechu vˇeci. Proto byly nˇekter´e z´avorky (a trof´am siˇr´ıci, ˇze v´ıce neˇz polovina, tj. ty kter´e ˇsly bez vˇetˇs´ı spotˇreby m´ısta) odstranˇeny. Podˇekov´an´ı. Autor skript by r´ad podˇekoval vˇsem, kteˇr´ı mu ke skript˚um dodali nˇejak´e pˇripom´ınky, zejm´ena recenzentovi doc. ing. Igoru Vajdovi, DrSc., ktery´ skripta pˇreˇcetl velmi pozornˇe a navrhl ˇradu zlepˇsen´ı. Za vˇsechny pˇr´ıpadn´e nedostatky vˇsak nesu odpovˇednost toliko j´a, a pros´ım proto o ˇcten´aˇrovu shov´ıvavost. Velice ocen´ım vˇsechny dalˇs´ı pˇripom´ınky, zejm´ena ty´kaj´ıc´ı se obsahu a tˇech m´ıst, kde jsou vyjadˇrov´ana stanoviska k vhodnosti, pouˇzitelnosti atd. toho ˇci onoho postupu. V Praze, 25. ˇr´ıjna 1997 9 ´ ´ ´ 2 UVOD DO REGRESNI ANALYZY Je naprosto pˇrirozen´e, ˇze ti, kdo se rozhodli sezn´amit se statisticky´m zpracov´an´ım dat, se v z´akladn´ıch uˇcebnic´ıch nejprve setk´avaj´ı s u´lohami, ve ktery´ch se odhaduj´ı parametry rozdˇelen´ı n´ahodny´chveliˇcin,pˇr´ıpadnˇesetestuj´ınˇekter´ejednoduch´ehypot´ezyonich.Seskuteˇcnˇezaj´ımavy´mi statisticky´mi postupy se vˇsak setkaj´ı aˇz ve chv´ıli, kdy dojde na u´lohy, snaˇz´ıc´ı se postihnout vz´ajemn´e vztahy n´ahodny´ch veliˇcin. R˚uzny´ch metod, kter´e analyzuj´ı strukturu vztah˚u mezi n´ahodny´mi veliˇcinami je pˇrirozenˇe velk´e mnoˇzstv´ı a kaˇzd´a z nich m´a za sebou historii, kter´a napov´ıd´a, proˇc byla takov´a metoda budov´ana, tj. jak´e byly p˚uvodn´ı d˚uvody pro jej´ı navrˇzen´ı, jak´a byla motivace, ˇci chcete-li inspirace, autor˚u. Nam´atkou jmenujme napˇr. analy´zu vari- ance, zpracov´an´ı kontingenˇcn´ıch tabulek ˇci diskriminaˇcn´ı a shlukovou analy´zu. Nˇekter´e postupy vzniklypˇrirozenˇezcela“mimo”statistiku,napˇr.faktorov´aanaly´za,abylystatistikyteprverozv- inuty, pˇr´ıpadnˇe “dovybaveny” vhodny´m teoreticky´m apar´atem. Historick´e z´aznamy dokl´adaj´ı mimojakoukolivpochybnost,ˇzepokusyonalezen´ıvz´ajemn´ehovztahun´ahodny´chveliˇcinexisto- valyodsamy´chpoˇc´atk˚ubudov´an´ıteoriepravdˇepodobnosti(Galilei(1632),Boscovitch(aMaire) (1757), Laplace (1793), Legendre (1805), Gauss (1809)). Skripta, kter´e pr´avˇe zaˇc´ın´ate studovat, jsou vˇenov´ana jedn´e z nejefektivnˇejˇs´ıch metod analy´zy mnoharozmˇerny´ch (ˇci v´ıcerozmˇerny´ch, jak chcete4) dat. Regresn´ı analy´za, aˇc se to m˚uˇze zd´at pˇrekvapiv´e, odvozuje sv˚uj n´azev od an- glick´eho slova regression. V roce 1885 totiˇz Sir Francis Galton publikoval vy´sledek svy´ch studi´ı o vztahu vy´ˇsky otc˚u a syn˚u v ˇcl´anku “Regression towards mediocrity in hereditary stature”. Jak napov´ıd´an´azevˇcl´anku,zjistil,ˇzejepravdˇepodobnˇejˇs´ıjev,ˇzevy´ˇskasynabudebl´ıˇzepopulaˇcn´ımu pr˚umˇeruneˇzvy´ˇskaotce,neˇzjevopaˇcny´,totiˇzˇzevy´ˇskasynasebudeodpr˚umˇern´evy´ˇskymuˇz˚uliˇsit v´ıce neˇz se liˇs´ı vy´ˇska jeho otce. Ostatnˇe, kdyˇz uˇz toto zjiˇstˇen´ı v´ıme, pˇripad´a n´am zcela pˇrirozen´e, nebot’ pokud by takov´a tendence neplatila, doch´azelo by k neomezen´e fluktuaci vy´ˇsek muˇz˚u, tj. dnes uˇz by mezi n´ami museli ˇz´ıt jak obˇri tak trpasl´ıci. Odhad koeficient˚u modelu byla poˇr´ızen, podobnˇe jako je tomu i v pˇrev´aˇzn´e vˇetˇsinˇe pˇr´ıpad˚u dnes, metodou nejmenˇs´ıchˇctverc˚u (the least squares), kter´a v t´e dobˇe byla jiˇz t´emˇeˇr sto let zn´ama, viz Adrien Marie Legendre (1805) a Carl FriedrichGauss(1809).Aˇckolivvdobˇe,kdySirFrancisGaltonpsalsv˚ujˇcl´anekbylazn´amaijin´a metoda odhadu parametr˚u, totiˇz metoda minimalizuj´ıc´ı souˇcet absolutn´ıch odchylek, je celkem pˇrirozen´e, ˇze byla pouˇzita metoda nejmenˇs´ıch ˇctverc˚u, nebot’ je jednoduch´a a d´av´a explicitn´ı vztahprovyˇc´ıslen´ıodhad˚unaz´akladˇeanalyzovany´chdat.Naopakmetodaminimalizuj´ıc´ısouˇcet absolutn´ıch odchylek (Galileo Galilei (1632), Roger Joseph (ˇci Rodjer Josef) Boscovich (1757), PierreSimonLaplace(1793)),kter´ajednespouˇz´ıv´anaalternativnˇekmetodˇenejmenˇs´ıchˇctverc˚u, vyˇzaduje, pˇri vˇetˇs´ım poˇctu dat, nasazen´ı vy´konn´e vy´poˇcetn´ı techniky. Na rozd´ıl od nejmenˇs´ıch ˇctverc˚u vˇsak jej´ı vy´sledky l´epe “vzdoruj´ı” kontaminac´ı dat, nebot’ v r´amci dnes pouˇz´ıvany´ch pojm˚u je tato metoda robustn´ı alesponˇ proti odlehly´m pozorov´an´ım ve vysvˇetlovan´e promˇenn´e a “navzdory” obecnˇe panuj´ıc´ı domnˇence ˇci pˇredsudku o jej´ı mal´e eficienci lze uk´azat, ˇze pokud data generovan´a byt’ pˇresnˇe norm´aln´ım modelem obsahuj´ı na kaˇzdy´ch 1000 pozorov´an´ı dvˇe poˇskozen´a (kontaminovan´a) pozorov´an´ı, je tato metoda vy´konnˇejˇs´ı (eficientnˇejˇs´ı - pro ty, kdo 4Nˇekdyjsouvedenyzd´anlivˇeuˇcen´ediskuzeotom,zdauˇz´ıvattoˇcionoslovo.Jecelkempˇrirozen´e,ˇzesetakov´e diskuze objevuj´ı, nebot’ nˇekter´e vˇedn´ı obory by patrnˇe jinak nemˇely co dˇelat. Je vˇsak pˇrinejmenˇs´ım pˇrekvapiv´e, ˇze se takov´e diskuze objevuj´ı dokonce i v matematice, kde definice pˇresnˇe vymezuj´ı, oˇcem jeˇreˇc a tedy, aˇz snad na pˇr´ıpady extr´emˇe necitliv´eho pouˇzit´ı nˇektery´ch slov, je celkem jedno, jak´e slovn´ı oznaˇcen´ı je zvoleno. 10 nejsou jazykovy´mi puristy) neˇz metoda nejmenˇs´ıchˇctverc˚u. Tato metoda by´va z pochopitelny´ch d˚uvod˚u oznaˇcov´ana jako L a podobnˇe jako nˇekolik nezn´amy´ch pojm˚u pouˇzity´ch v pˇredchoz´ı 1 vˇetˇe bude diskutov´ana n´ıˇze. Obrat’me nyn´ı naˇsi pozornost na to, jak´e c´ıle si klade regresn´ı analy´za. Nˇeco bylo vlastnˇe jiˇz ˇreˇceno vy´ˇse, totiˇz ˇze regresn´ı analy´za patˇr´ı mezi metody studuj´ıc´ı strukturu vz´ajemny´ch z´avislost´ımezijednotlivy´miveliˇcinami.Mnohdyjsouvˇsakambicet´etometodycharakterizov´any snahou o nalezen´ı n´astroje na predikci hodnoty jedn´e n´ahodn´e veliˇciny za pˇredpokladu, ˇze jiˇz zn´ame hodnoty nˇekolika jiny´ch n´ahodny´ch veliˇcinˇci nen´ahodny´ch vysvˇetluj´ıc´ıch faktor˚u. Nˇekdy se oznaˇcuje tento druhy´ c´ıl za v´ıce ambicizn´ı a implicitnˇe se t´ım m´ın´ı,ˇze ten prvy´ je jakoby lehˇc´ı “podˇc´ast´ı” toho druh´eho. Obecnˇe vˇsak kaˇzdy´ z tˇechto c´ıl˚u vyˇzaduje jin´eˇreˇsen´ı, jak ostatnˇe d´ale uvid´ıme. Teorie, kter´a je v uˇcebnic´ıch a monografi´ıch obvykle vykl´ad´ana, vede k ˇreˇsen´ı prv´eho c´ıle, ale nemus´ı by´t vˇzdy ˇreˇsen´ım toho druh´eho. Dˇr´ıve neˇz budeme pokraˇcovat ve vy´kladu zaved’me alesponˇ nejz´akladnˇejˇs´ı, zcela standardn´ı oznaˇcen´ı.OznaˇcmetedysymbolemN mnoˇzinuvˇsechpˇrirozeny´chˇc´ısel,Rre´alnoupˇr´ımku,R+ jej´ı kladnou ˇc´ast, Rp p-rozmˇerny´ Euklidovsky´ prostor, Rn,k (nˇektery´) k-rozmˇerny´ podprostor pros- toru Rn a koneˇcnˇe pak (Ω,A,P) z´akladn´ı pravdˇepodobnostn´ı prostor. Regresn´ı model budeme uvaˇzovat ve tvaru: Y = g(X ,β0)+E , i = 1,2,...,n (1) i i i provˇsechnan ∈ N,kdeg(x,β)budenˇekter´ahladk´afunkce,g : Rq×Rp → R (q,p ∈ N).Posloup- nost {X }∞ bude bud’ deterministick´a posloupnost q-rozmˇerny´ch vektor˚u (v tom pˇr´ıpadˇe i i=1 budeme ps´at {x }∞ ) ˇci posloupnost (nez´avisly´ch a stejnˇe rozdˇeleny´ch) n´ahodny´ch veliˇcin, tj. i i=1 X (ω) : Ω → Rq, kter´e jsou nav´ıc nez´avisl´e od posloupnosti {E }∞ , E (ω) : Ω → R, coˇz je i i i=1 i jin´a posloupnost, obvykle stejnˇe rozdˇeleny´ch, nikoliv vˇsak nutnˇe nez´avisly´ch, n´ahodny´ch veliˇcin. Posledn´ı pˇredpoklad neby´v´a v nˇektery´ch textech jasnˇe zd˚uraznˇen, ale jak uvid´ıme pozdˇeji, jeho naruˇsen´ı m´a v´aˇzn´e d˚usledky. Veliˇcina Y stoj´ıc´ı na lev´e stranˇe rovnosti (1) by´v´a oznaˇcov´ana i jako z´avisle promˇenn´a, veliˇciny X jako nez´avisle promˇenn´e a E jako fluktuace. N´ıˇze uveden´a i i diskuze ty´kaj´ıc´ı se interpretace vy´sledk˚u regresn´ı analy´zy ale naznaˇc´ı,ˇze je patrnˇe lepˇs´ı pouˇz´ıvat pojmy jako vysvˇetlovan´a veliˇcina (pro Y ) a vysvˇetluj´ıc´ı veliˇciny pro X . Toto “n´azvoslov´ı” totiˇz i i nesv´ad´ı k domnˇence, ˇze odhadnuty model m˚uˇzeme pouˇz´ıt k predikci pro jak´ekoliv hodnoty nez´avisle promˇenny´ch. V dalˇs´ım textu se jeˇstˇe k tomuto probl´emu vr´at´ıme. Pro veliˇciny Y , X i i a E by´v´a uv´adˇena i cel´aˇrada jiny´ch term´ın˚u, kter´e se snaˇz´ı napovˇedˇet charakter tˇechto veliˇcin i vzhledem k nˇektery´mˇcasty´m pouˇzit´ımˇci interpretac´ım regresn´ıho modelu. Napˇr.X jsou nˇekdy i oznaˇcov´any jako nosiˇce, regresory ˇci jako faktory a pˇr´ısluˇsny´ Rq jako faktorovy´ prostor. Tak´e v tomto textu budeme obˇcas tato r˚uzn´a “pojmenov´an´ı” pouˇz´ıvat, abychom si na nˇe pˇrivykli a neˇcinily n´am pot´ıˇze pˇri ˇcten´ı r˚uzny´ch pramen˚u. Pro ty, kteˇr´ı se nˇekdy v budoucnu budou vˇenovat ekonomicky´m aplikac´ım, poznamenejme,ˇze se jeˇstˇe setkaj´ı s rozliˇsen´ım,ˇcasto sporny´m, charakteru veliˇcin vstupuj´ıc´ıch do modelu a naraz´ı na pojmy endogen´ı (ˇcesky snad koncov´a ˇci vy´stupn´ı), oznaˇcuj´ıc´ıveliˇcinyzpravidlana“lev´e”stranˇemodelu,tj.vroliY apredeterminovan´a i (ˇcesky snad pˇredurˇcen´a, ale sp´ıˇse vstupn´ı) veliˇcina, stoj´ıc´ıch v roli X . Druhy´ typ veliˇcin pak i by´v´a jeˇstˇe dˇelen na posunut´e endogen´ı (lagged endogenous) a exogen´ı (ˇcesky asi vnˇejˇs´ı ˇci mimo model urˇcen´e; nechme vˇsak nad´ale pˇreklady jazykozpytc˚um, v matematick´em textu, ostatnˇe jsme to jiˇz vy´ˇse zm´ınili, jde o jednoznaˇcnost, kter´a je zajiˇstˇena formalizmem a nen´ı naˇstˇest´ı 11 z´avisl´a na n´azvech). Povˇsimnˇeme si, ˇze rozliˇsen´ı na exogen´ı a endogen´ı souvis´ı opˇet s pojmem kauzality. Jak jsme uvedli vy´ˇse, byl tento protagonistou renesanˇcn´ıho paradigmatu vˇedeck´eho pozn´an´ı aˇzel Bohu st´ale jeˇstˇe v mnoha vˇedn´ıch discipl´ın´ach pˇreˇz´ıv´a. Nen´ı bez zaj´ımavosti,ˇze do ekonomie, ˇci sp´ıˇse do ekonometrie byl “ve statistick´e modifikaci” zaveden C. W. J. Grangerem na konciˇsedes´aty´ch let, tj. v dobˇe, kdy filosofie vˇedy naopak zaˇcala uvaˇzovat a v´aˇznˇe diskutovat o jeho problematiˇcnosti. Samozˇrejmˇe, ˇze nen´ı tˇeˇzk´e uk´azat pˇr´ıklady - a to i z kaˇzdodenn´ıho ˇzivota, kter´e demostruj´ı jeho problematiˇcnost. Grangerova definice a test, Granger (1969), se op´ıraj´ı o pojem statistick´e nez´avislosti a v tomtoduchujetˇrebajeinterpretovat.Uˇzivatel´etovˇsakzpravidla(bohorovnˇe)pˇrehl´ıˇzej´ıajednaj´ı s t´ımto pojmem jako by ˇslo o bˇeˇzny´ pojem pˇr´ıˇcinn´e souvislosti. Jak´e to m˚uˇze m´ıt n´asledky si snadno pˇredstav´ıme, uv´aˇz´ıme-li napˇr., ˇze se mnoh´a (politick´a) rozhodnut´ı odv´ıjej´ı sp´ıˇse od vˇedecky´ch hypot´ez vysloveny´ch na z´akladˇe pr´avˇe popsan´eho zp˚usobu interpretace vy´sledk˚u neˇz od historicky ovˇeˇreny´ch postup˚u. Vrat’me se vˇsak ke vztahu (1) a dokonˇceme vysvˇetlen´ı jednotlivy´ch veliˇcin v nˇem vys- tupuj´ıc´ıch. Vektor β0 = (β0,β0,...,β0)T bude oznaˇcov´an jako vektor regresn´ıch parametr˚u, 1 2 p pokud budeme mluvit o neline´arn´ı regresi, a jako regresn´ıch koeficient˚u, v line´arn´ı regresi. Koneˇcnˇe pak horn´ı index “T” oznaˇcuje transpozici vektoru ˇci matice. V pˇrev´aˇzn´e ˇc´asti dalˇs´ıho textubudemeuvaˇzovatmodelspevny´mi(deterministicky´mi)vysvˇetluj´ıc´ımipromˇenny´mi.Exkurze domodelusn´ahodny´mivysvˇetluj´ıc´ımipromˇenny´mibudoujenobˇcasn´e.Zan´ahodny´budetedyv modelupovaˇzov´anpouzeˇsum(ˇcichcete-lifluktuacenebon´ahodn´efluktuace),ktery´ jerepresen- tovany´ (jsou representov´any) posloupnost´ı n´ahodny´ch veliˇcin {E }∞ . N´ahodnost disturbanc´ı i i=1 samozˇrejmˇe m´a za n´asledek to, ˇze i vysvˇetlovan´a veliˇcina Y je n´ahodn´a. Prvn´ım c´ılem regresn´ı analy´zy, jak uˇz bylo ostatnˇe konstatov´ano vy´ˇse, je popis struktury dat (ˇci chcete-li, vysvˇetlen´ı dat). Po t´e, co jsme zavedli oznaˇcen´ı pro regresn´ı model, m˚uˇzeme tento c´ıl specifikovat jako odhad modelu ve statistick´em smyslu. Jiny´mi slovy to znamen´a,ˇze na z´akladˇe dat, kter´a z hlediska druh´eho c´ıle regresn´ı analy´zy, totiˇz predikce, m˚uˇzeme povaˇzovat za tr´enovac´ı soubor, chceme nejprve odhadnout charakter (tvar) funkce g(x,β) a n´aslednˇe odhad- noutβ0.Analy´zadattedym˚uˇzezaˇc´ıtvpodstatˇetestem,zdag(x,β)jeline´arn´ıˇcinikoliv,nebose prostˇe na z´akladˇe zkuˇsenost´ı (fyzik´aln´ıch, soci´aln´ıch, demograficky´ch, ekonomicky´ch ˇci jiny´ch) ˇci okolnost´ı rozhodneme pro nˇekterou funkci g(x,β) (ˇci typ funkce). Obvykle je tvar funkce (alesponˇ) “tuˇseny´” a proto se ˇcasto omezujeme na odhad vektoru β0. Tak jako v drtiv´e vˇetˇsinˇe statistick´e literatury budeme odhad poˇr´ızeny´ nˇekterou odhadovac´ı metodou oznaˇcovat βˆ. Nav´ıc indexy, dole ˇci nahoˇre, budou napov´ıdat, jakou metodou byl odhad vyˇc´ıslen, ˇci na z´akladˇe kolika pozorov´an´ı byl zkonstruov´an, atd.. Tak napˇr. βˆ(LS,n) bude naznaˇcovat,ˇze se jedn´a o odhad poˇr´ızeny´ metodou nejmenˇs´ıchˇctverc˚u na z´akladˇe dat o rozsahu n.Rovnˇeˇzzcelastandardnˇejakjsmenatozvykl´ı,βˆ(LS,n)budeoznaˇcovati-tousloˇzku(souˇradnici, i koordin´atu) vektoru βˆ(LS,n). Podrobnˇejˇs´ı vysvˇetlen´ı ˇci rozˇs´ıˇren´ı oznaˇcen´ı a symbol˚u bude vˇzdy uvedenovm´ıstech,kdetobudemepotˇrebovattak,abynebylonutn´ejedrˇzetdlouhoabezuˇzitku v pamˇeti. Vy´ˇseuveden´ebezprostˇrednˇenapov´ıd´a,ˇzepokuduvaˇzujememodelsn´ahodny´minosiˇcipˇredpokl´ad´ame, ˇze pro naˇse data D existuje ω ∈ Ω tak,ˇze hodnoty n´ahodny´ch veliˇcin {Y (ω)}n a {X (ω)}n n 0 i i=1 i i=1 12
Description: