ebook img

1 Predmluva 4 2 ´UVOD DO REGRESNÍ ANAL´YZY 9 3 LINERNÍ REGRESNÍ MODEL 19 3.1 ... PDF

187 Pages·2006·0.91 MB·English
by  
Save to my drive
Quick download
Download
Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.

Preview 1 Predmluva 4 2 ´UVOD DO REGRESNÍ ANAL´YZY 9 3 LINERNÍ REGRESNÍ MODEL 19 3.1 ...

Obsah 1 Pˇredmluva 4 2 U´VOD DO REGRESN´I ANALY´ZY 9 3 LINERN´I REGRESN´I MODEL 19 3.1 Odhad regresn´ıch koeficient˚u . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 3.2 Odhad rozptylu n´ahodny´ch fluktuac´ı . . . . . . . . . . . . . . . . . . . . . . . . . 35 4 DIAGNOSTIKA ODHADU REGRESN´IHO MODELU 43 4.1 Rozdˇelen´ı kvadraticky´ch forem . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 4.2 Rozdˇelen´ı odhadu rozptylu n´ahodny´ch fluktuac´ı a studentizovany´ch odhad˚u re- gresn´ıch koeficient˚u . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 4.3 Koeficient determinace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 4.4 Intervaly a p´asy spolehlivosti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 4.5 Testov´an´ı submodel˚u . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 4.6 Vy´bˇer modelu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 5 VY´STUPY Z POCˇTACˇOVY´CH KNIHOVEN 60 5.1 Tabulky vy´sledk˚u . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 5.2 Grafy rezidu´ı . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 6 OVEˇRˇOVA´N´I ZA´KLADN´ICH PRˇEDPOKLADU˚ 72 6.1 Homoskedasticita a heteroskedasticita . . . . . . . . . . . . . . . . . . . . . . . . 72 6.1.1 Pˇr´ıklady situac´ı s heteroskedasticky´mi fluktuacemi . . . . . . . . . . . . . 72 6.1.2 Modely heteroskedasticity . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 6.1.3 Testy homoskedasticity . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 6.1.4 Z´avˇer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 6.2 Normalita n´ahodny´ch fluktuac´ı . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 6.3 Nez´avislost n´ahodny´ch fluktuac´ı . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 6.4 Nez´avislost vysvˇetluj´ıc´ıch promˇenny´ch a n´ahodny´ch fluktuac´ı . . . . . . . . . . . 92 6.4.1 vod a pˇr´ıklady situac´ı poruˇsen´ı nez´avislosti . . . . . . . . . . . . . . . . . 92 6.4.2 Instrument´aln´ı promˇenn´e . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 6.4.3 Hausman˚uv test nez´avislosti regresor˚u a n´ahodny´ch fluktuac´ı . . . . . . . 97 6.4.4 Z´avˇer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 7 U´VAHY O SENSITIVITEˇ MODELU 100 7.1 Efekt podurˇcen´ı . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 7.2 Efekt pˇreurˇcen´ı . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102 7.3 Vliv jednoho pozorov´an´ı . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 7.4 Kolinearita . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 7.4.1 Zdroje a rozpozn´an´ı kolinearity . . . . . . . . . . . . . . . . . . . . . . . . 107 7.4.2 Hˇrebenov´a regrese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 7.4.3 Odhady s line´arn´ımi ohraniˇcuj´ıc´ımi podm´ınkami . . . . . . . . . . . . . . 113 7.4.4 Alternativn´ı indik´atory kolinearity a jejich z´aludnosti . . . . . . . . . . . 120 7.4.5 Alternativn´ı ˇreˇsen´ı probl´emu kolinearity . . . . . . . . . . . . . . . . . . . 123 7.4.6 Z´avˇer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 8 NEˇKTERE´ SPECIA´LN´I TYPY REGRESN´IHO MODELU 128 8.1 Zobecnˇeny´ regresn´ı model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 8.2 Model s diskr´etn´ı vysvˇetlovanou promˇennou . . . . . . . . . . . . . . . . . . . . . 129 8.2.1 Probl´emyspouˇzit´ımklasick´ehoregresn´ıhomodeluprobin´arn´ıvysvˇetlovanou veliˇcinu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130 8.2.2 Model s bin´arn´ı moˇznost´ı vy´bˇeru . . . . . . . . . . . . . . . . . . . . . . . 131 8.2.3 Odhady parametr˚u v line´arn´ım pravdˇepodobnostn´ım modelu . . . . . . . 132 8.2.4 Odhady parametr˚u v probitov´em a logitov´em modelu . . . . . . . . . . . 134 8.2.5 Diskuze k pouˇzit´ı probitov´eho a logitov´eho modelu . . . . . . . . . . . . . 138 8.3 Model s kategori´aln´ımi vysvˇetluj´ıc´ımi promˇenny´mi . . . . . . . . . . . . . . . . . 139 8.4 Vysvˇetluj´ıc´ı promˇenn´e mˇeˇren´e s n´ahodny´mi chybami . . . . . . . . . . . . . . . . 141 8.5 Aproximace nepˇr´ıstupny´ch vysvˇetluj´ıc´ıch veliˇcin. . . . . . . . . . . . . . . . . . . 143 9 MODEL S V´ICEROZMEˇRNOU VYSVEˇTLOVANOU PROMEˇNNOU 144 9.1 Zd´anlivˇe nesouvisej´ıc´ı rovnice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144 9.2 Simult´an´ı rovnice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147 9.2.1 Probl´em identifikace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151 9.2.2 Identifikace pomoc´ı omezen´ı na kovarianˇcn´ı matici n´ahodny´ch fluktuac´ı . 154 9.2.3 Dvoustupnˇovy´ odhad metodou nejmenˇs´ıch ˇctverc˚u . . . . . . . . . . . . . 155 9.2.4 Trojstupnˇovy´ odhad metodou nejmenˇs´ıch ˇctverc˚u . . . . . . . . . . . . . . 157 10 ANALY´ZA VARIANCE 159 10.1 Jednoduch´e tˇr´ıdˇen´ı . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159 10.2 Dvojn´e tˇr´ıdˇen´ı . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163 11 NEˇKTERE´ NETRADICˇN´I METODY REGRESN´I ANALY´ZY 171 12 Literatura 174 13 Autorsky´ rejstˇr´ık 181 14 Vˇecny´ rejstˇr´ık 184 4 1 Pˇredmluva Zpracov´an´ıdat,at’uˇzjsounumerick´ehoˇcikategori´aln´ıcharakteru,sestalovmodern´ıvˇedˇejednou ze standarn´ıch metod vyhodnocov´an´ı informace. Zpracov´an´ı samo je pak obvykle zaloˇzeno na nˇejak´e naˇs´ı pˇredstavˇe o charakteru dat, ˇci chcete-li o mechanizmu, ktery´ generoval dan´a data. Zm´ınˇen´a pˇredstava je zpravidla formalizov´ana do nˇejak´e vˇedeck´e, ˇci se tak alesponˇ tv´aˇr´ıc´ı, teorie. Koneˇcnˇe pak vy´sledky zpracov´an´ı jsou pokl´ad´any za objektivn´ı zjiˇstˇen´ı o svˇetˇe, ktery´ n´as obklopuje a ktery´ se takto pokouˇs´ıme pochopit a (naivnˇe) ovl´adnout. Cely´ tento postup je obklopen, ˇci sp´ıˇse “proniknut” celou ˇradou my´t˚u a zav´adˇej´ıc´ıch pˇredstav, kter´e maj´ı sv´e historick´e koˇreny v renesanci a osv´ıcenectv´ı, a sv´e ideov´e a moˇzn´a, ˇze by bylo pˇresnˇejˇs´ı ˇr´ıci ideologick´e, koˇreny v py´ˇse ˇclovˇeka, coby p´ana pˇr´ırody. Nˇekdy jdou pˇredstavy tˇech, kteˇr´ı toto zpracov´an´ı aplikuj´ı aˇz tak daleko, ˇze kaˇzd´e jin´e zpracov´an´ı informace pokl´adaj´ı pˇrinejmenˇs´ım za druhoˇrad´e, ne-li rovnou za bezcenn´e. Dodejme rovnou, ˇze obvykle jsou to ti, kteˇr´ı nekriticky obdivuj´ı vˇedeck´e pozn´an´ı a neuvˇedomuj´ı si ani re´aln´e moˇznosti modern´ı vˇedy, na stranˇe jedn´e, ani jej´ı nepˇrekroˇciteln´e hranice, na stranˇe druh´e. Skripta, kter´a m´ate pˇred sebou, jsou vy´kladem jedn´e z metod zpracov´an´ı dat, a dodejme, ˇze jedn´e z nejefektivnˇejˇs´ıch, totiˇz regresn´ı analy´zy. Jako takov´a nab´ıdnou propracovanou teorii, ˇci pˇresnˇeji ˇreˇceno, jej´ı ˇc´ast, kterou bychom dnes mohli nazvat snad klasickou ˇc´ast´ı regresn´ı analy´zy. Tato je t´emˇeˇr vy´hradnˇe zaloˇzena na metodˇe nejmenˇs´ıch ˇctverc˚u a zhruba po tˇrech desetilet´ıch budov´an´ı robustn´ı statistiky, je jiˇz souˇcasn´e dobˇe menˇs´ıˇc´ast´ı teorie regrese. D˚uvody, proˇc se t´eto klasick´e teorii budeme vˇenovat, jsou n´asleduj´ıc´ı. Mezi uˇzivateli je mimo jakoukoliv pochybnost st´ale nejv´ıce zn´ama a nejv´ıce uˇz´ıv´ana, aˇc se snadno prok´aˇze, ˇze metoda nejmenˇs´ıch ˇctverc˚u je jednou z nejn´achylnˇejˇs´ıch k “vyprodukova´n´ı” zav´adˇej´ıc´ıch vy´sledk˚u. T´ım sp´ıˇse je tˇreba si ji osvojit tak, abychom vˇcas rozpoznali, kdy k nˇeˇcemu takov´emu m˚uˇze doj´ıt. Dalˇs´ım d˚uvodem je pak to, ˇze jsou jej´ı vy´sledky velmi ˇcasto chybnˇe interpretov´any a to i v pˇr´ıpadˇe, ˇze jej´ı vy´sledky jsou korektn´ı. T´ım sp´ıˇse je tˇreba si ji osvojit tak, abychom vˇcas rozpoznali, kdy k nˇeˇcemutakov´emudoˇsloaumˇelitouv´estnapravoum´ıru.Dalˇs´ımd˚uvodemjenepochybnˇetak´eto, ˇzenab´ız´ısnadnoakceptovatelnougeometrickouinterpretaci(ted’mluv´ımeointerpretacimetody nikoliv o interpretaci vy´sledk˚u, aby bylo jasno). Pochopen´ı t´eto interpretace metody nejmenˇs´ıch ˇctverc˚u n´as snad nejl´epe vyzbroj´ı k rozpozn´an´ı v´yhod i nev´yhod jin´ych metod odhadu regresn´ıch koeficient˚u.Koneˇcnˇepakkomplexnostt´etoklasick´eteorie,zejm´enapakjej´ırozs´ahl´ediagnostick´e partie napov´ıdaj´ı a zkuˇsenosti to potvrzuj´ı,ˇze bez zevrubn´e a eficientn´ı aposteriorn´ı diagnostiky nen´ı nadˇeje na spolehlivost odhadnut´eho modelu solidnˇe podepˇrena. To n´am umoˇzn´ı postavit se kriticky k tˇem metod´am, obvykle ad hoc vyvinut´ych na z´akladˇe zd´anlivˇe rozumn´e heuristiky, 1 kter´e takov´yto “doprovodn´y” apar´at nenab´ızej´ı ˇci jej alesponˇ neumoˇznˇuj´ı pˇrevz´ıt z klasick´e regrese. Dˇr´ıve neˇz se vˇsak pust´ıme do vlastn´ıho vy´kladu, vrat’me se alesponˇ velmi struˇcnˇe k tomu, 1Vpr˚ubˇehudalˇs´ıhovy´kladubudenˇekolikra´tpouˇzitoslovo heuristika,kter´enepatˇr´ımezinejbˇeˇznˇejipouˇz´ıvana´ slova kaˇzdodenn´ı ˇceˇstiny. Upˇresnˇeme proto, co budeme t´ımto slovem rozumˇet. T´ımto slovem budeme oznaˇcovat jaky´si soubor idej´ı a pˇredstav, ˇci “rozumovy´ch” argument˚u, kter´e cosi vysvˇetluj´ı, obvykle d˚uvody, proˇc urˇcitou teorii ˇci jej´ı ˇca´st vytv´aˇr´ıme pr´avˇe tak, jak pak d´ale n´asleduje. Nejde tedy jen o filozofick´e pˇredstavy, ale o cosi ˇsirˇs´ıho, zaloˇzen´eho na “racion´aln´ım” pˇr´ıstupu ke svˇetu, coˇz vˇsak, pr´avˇe d´ıky t´e “zˇrejm´e racionalitˇe” se m˚uˇze uk´azatvr´amciformalizovan´eteorieinkonsistentn´ı,lich´eˇcizava´dˇej´ıc´ı.Vzpomenˇmejentoho,ˇzevzhledemktomu, ˇze mezi kaˇzdy´mi dvˇema racion´aln´ımi ˇc´ısly je iracion´aln´ı a kaˇzdy´mi dvˇema iracion´aln´ımi je racion´aln´ı, “zdravy´” rozum (nˇekdy t´eˇz oznaˇcovany´ jako “selsky´”) usoud´ı,ˇze je jich stejn´e mnoˇzstv´ı. 5 co bylo ˇreˇceno na zaˇc´atku, totiˇz k nˇektery´m my´t˚um, ˇci chcete-li k filozofii, kter´a stoj´ı v pozad´ı zpracov´an´ı dat, zejm´ena v pozad´ı interpretace vy´sledk˚u. Renesance pˇrinesla lidstvu osvobozen´ı od mnoha dogmat, kter´a jej do t´e doby svazovala, ale z dneˇsn´ıho pohledu jsme jiˇz schopni zˇretelnˇe nahl´ednout, ˇze nastolila mnoh´a jin´a dogmata, kter´aˇzelBohust´alejeˇstˇepˇreˇz´ıvaj´ı.Jedn´ımznichjenekriticky´ obdivkvˇedˇe,ktery´ jevˇsakproni obvykle medvˇed´ı sluˇzbou. Mˇejme vˇzdy na pamˇeti, byt’ budeme st´at v tv´aˇri v tv´aˇr neju´ˇzasnˇejˇs´ım metod´am, kter´e modern´ı vˇeda nab´ız´ı, ˇze je tato jen a jen vy´tvorem lidsk´eho ducha a zasluhuje si n´aˇs obdiv, nikoliv vˇsak nekriticky´. Nav´ıc omezenost jej´ıch moˇznosti je v´ıc neˇz patrn´a. Staˇc´ı si uvˇedomit, ˇze na ˇradu velmi z´avaˇzny´ch, ne-li nejpodstatnˇejˇs´ıch probl´em˚u lidsk´eho ˇzivota, vˇeda nem´a a ani nem˚uˇze m´ıt uspokojivou odpovˇed’. Jsou to napˇr. ot´azky po smyslu lidsk´eho ˇzivota, po tom, odkud se bere l´aska, touha ˇci nadˇeje. Odpovˇedi na tyto ot´azky mus´ıme hledat jinde, napˇr. v teologii, kter´a vˇsak zase pˇrirozenˇe neum´ı tak dobˇre pˇredpov´ıdat, jaky´ ˇze bude napˇr. hruby´ n´arodn´ı d˚uchod v pˇr´ıˇst´ım ˇctvrtlet´ı. Renesance vˇsak pˇrinesla jeˇstˇe dalˇs´ı pˇredstavy, kter´e se dnes jev´ı jiˇz jen tˇeˇzko udrˇziteln´e (z hlediska modern´ı filozofie vˇedy), ale kter´e jeˇstˇe st´ale ovlivnˇuj´ı pohled modern´ıho ˇclovˇeka na to, co to vlastnˇe vˇeda je. Jednou z nich je pˇredstava, ˇze za abstrakc´ı, kterou uˇcin´ıme na z´akladˇe pozorov´an´ı (mnoha) opakov´an´ı t´ehoˇz jevu, ˇcasto navozen´eho pevnˇe dany´mi okol- nostmi, napˇr. upuˇstˇeny´ k´amen vˇzdy pad´a k zemi, stoj´ı jak´asi entita (gravitace), kterou sice nem˚uˇzeme “na vlastn´ı oˇci” vidˇet (tak jak nem˚uˇzeme napˇr. vidˇet vzduch), ale kter´a, podobnˇe jako vzduch objektivnˇe existuje a projevuje se nˇejakou kauz´aln´ı z´akonitost´ı (viz vy´ˇse zm´ınˇen´a pˇredstava o mechanizmu, ktery´ generoval data). Tato z´akonitost je pak pops´ana teori´ı, pˇriˇcemˇz za ide´aln´ı se povaˇzuje matematicky zformalizovan´a teorie. K jej´ı verifikaci se pak pouˇzije pokus, ve kter´em se zkouman´e objekty zachovaj´ı tak, jak to “pˇredpov´ı” tato teorie. Renesaˇcn´ı vˇeda pak pˇredpokl´adala, ˇze svˇet se vlastnˇe skl´ad´a z (koneˇcn´eho) poˇctu takovy´ch z´akonitost´ı, ˇci chcete-li princip˚u, kter´e byly jednoznaˇcnˇe do svˇeta veps´any jeho p˚uvodn´ım hybatelem ˇci se (po velk´em tˇresku2) samy od sebe nˇejak objektivnˇe ustavily. Pokusme se ponˇekud hloubˇeji proniknout do toho, co bylo pr´avˇe ˇreˇceno. Jiˇz v 18. stolet´ı napsal Immanuel Kant, ˇze Galileo Galilei podrobil pˇr´ırodu v´yslechu a idealizoval ji, to jest zmrzaˇcil ji tak, aˇz byla ochotna hovoˇrit jazykem, kter´y od n´ı chtˇel slyˇset, tj. jazykem matematiky. Aˇz pˇriznala, ˇze se odjakˇziva ˇr´ıd´ı onˇemi jednoduch´ymi principy, tj. z´akonitostmi. Galileo Galilei nenaslouchal pˇr´ırodˇe jako ˇz´ak uˇciteli, naslouchal ji jako soudce u´trpn´eho pr´ava. (Viz Prigogine a Stengers (1977).) Zamysl´ıme-li se nad celou vˇec´ı, snadno nahl´edneme onu “troufalost”, kter´a si mysl´ı, ˇze vysvˇetlen´ı, zejm´ena kauz´aln´ı vysvˇetlen´ı, kter´e jsme tou ˇci onou teori´ı podali, je jedin´e moˇzn´e. Ostatnˇe jiˇz Karl R. Popper v B´ıdˇe historicismu (Popper (1957)) naznaˇcil, ˇze vˇsichni ti, kteˇr´ı si mysl´ı, ˇze naˇsli jedin´e moˇzn´e z´akonit´e, pokud moˇzno deterministicky kauz´aln´ı vysvˇetlen´ı trp´ı jen nedostatkem fantazie (ne-li i nˇeˇc´ım horˇs´ım)3. Je naprosto jasn´e, ˇze vy´ˇse uveden´e abstrakce (jako je napˇr. gravitace) jsou nesm´ırnˇe uˇziteˇcn´e, nebot’ dovoluj´ı popsat urˇcity´ jevnar´azanikolivvjehojednotlivostech.Nadruh´estranˇe,uzn´an´ıˇcipˇrijmut´ıobjektivn´ıexistence takov´e entity (jako napˇr. gravitace) vyˇzaduje pˇrinejmenˇs´ım velice rozs´ahlou diskuzi o tom, co to je objektivn´ı existence, ale sp´ıˇse to prostˇe vyˇzaduje urˇcity´ krok v´ıry. 2Ten samozˇrejmˇe renesance jeˇstˇe nepˇredpokl´adala, proto ty z´avorky. 3Pros´ım vzpomenˇte si na Karla Rainmunda Poppera vˇzdy, kdykoliv V´as nˇekdo bude pˇresvˇedˇcovat, ˇze jedinˇe on m´a pravdu; trp´ı jen (snad jen) nedostatkem pˇredstavivosti. 6 V pracech Ilji Prigogina a Isabely Stengersov´e (viz napˇr. Prigogine a Stengers (1984)) pak zv´ıdavy´ ˇcten´aˇr m˚uˇze tak´e nal´ezt diskuzi k tomu, ˇze podobn´e, ˇcasto velmi nezˇreteln´e a tud´ıˇz ˇspatnˇe rozpoznateln´e kroky v´ıry si vyˇzaduj´ı i ty “nejprimitivnˇejˇs´ı” poˇc´atky zkoum´an´ı svˇeta, kter´e uˇcin´ıme uˇz ve sv´em rann´em dˇetstv´ı. Jejich pr´ace diskutuj´ı rovnˇeˇz “sklon” vˇedecky´ch teori´ı ke kauzalitˇe. Touha po dosaˇzen´ı teorie maj´ıc´ı charakter kauz´aln´ıch souvislost´ı m´a svoje koˇreny rovnˇeˇz v renesanci. Problematiˇcnost tohoto pojmu zaˇcala by´t zˇrejm´a v modern´ı fyzice a odv´ıj´ı se od prac´ı Nielse Bohra. Zd´anlivˇe tato problematika souvis´ı s neˇreˇsitelnou a vlastnˇe v podstaˇe zav´adˇej´ıc´ı ot´azkou o deterministick´em ˇci indeterministick´em charakteru svˇeta. Ve skuteˇcnosti vˇsak jedn´a o ot´azku adekv´atnosti (akceptovatelnosti, vy´hodnosti atd.) kauz´aln´ıhoˇci pravdˇepodobnostn´ıhopopisusvˇeta.Zd˚uraznˇeme,ˇzetozdazvol´ımepropopissvˇetakauz´aln´ıteorii ˇci teorii vyuˇz´ıvaj´ıc´ı pravdˇepodobnostn´ı formalizmus, ˇci jiny´ n´astroj na formalizaci neurˇcitosti a nejistoty, nikterak nevypov´ıd´a o tom, zda si mysl´ıme, ˇze svˇet je deterministicky´ ˇci nikoliv. Jak jsme totiˇz uk´azali vy´ˇse, n´azor, ˇze naˇse teorie vysvˇetluj´ı jaky´ svˇet “ve skuteˇcnosti” je, je jen tˇeˇzko udrˇzitelny´. Tato problematika je u´zce sv´az´ana s vy´sledky Kurta Gdela o neu´plnosti bezesporny´ch axiomaticky´ch syst´em˚u. Jeho vy´sledky patrnˇe napov´ıdaj´ı, ˇze pravdˇepodobnostn´ı popis svˇeta je inherentnˇe vloˇzen do naˇseho racion´aln´ıho uvaˇzov´an´ı zakotven´eho v matamatice tak, jak se historicky vyvinula. Vy´ˇse jsme ˇrekli, ˇze renesanˇcn´ım ide´alem “vysvˇetluj´ıc´ı” teorie byla matematicky formalizo- van´a teorie. To patrnˇe plat´ı i dnes. Pr´avˇe naznaˇcen´a diskuze naznaˇcila, ˇze c´ılem budov´an´ı (for- malizovany´ch)teori´ıdostdobˇrenem˚uˇzeby´tobjektivn´ı, jednoznaˇcn´evysvˇetlen´ısvˇeta.Spokoj´ıme- li se vˇsak se skromnˇejˇs´ım c´ılem, totiˇz s nalezen´ım n´astroje na funkˇcn´ı predikci, bude jedno, zda takovy´ch n´astroj˚u bude v´ıce ˇci jen jeden. Hlavnˇe, kdyˇz bude d´avat spolehliv´e pˇredpovˇedi ˇci n´avody, chcete-li, jak napˇr. urovnat v´aleˇcn´e konflikty, zvy´ˇsit u´rodu a zm´ırnit hlad mnoha n´arod˚u. Samozˇrejmˇe,ˇze pak formalizovanˇejˇs´ı teorie m´a vˇetˇs´ı cenu neˇz jak´esi v´agn´ı z´avˇery, nebot’ m´a vˇetˇs´ı nadˇeji d´at efektivnˇejˇs´ı pˇredpovˇedi. Je nutn´e si vˇsak uvˇedomit, ˇze kaˇzd´a takov´a teorie se op´ır´a o zkuˇsenost. Cˇ´ım je tato zkuˇsenost d˚uvˇeryhodnˇejˇs´ı, tj.ˇc´ım jsou data, kter´a jsme pouˇzili spolehlivˇejˇs´ı a pˇresnˇejˇs´ı, t´ım m˚uˇze by´t i vy´sledek formalizovanˇejˇs´ı. Kaˇzdy´, kdo vˇzivotˇe prov´adˇel nˇejak´e vy´poˇcty, si je vˇedom toho, ˇze nem´a obvykle cenu ud´avat vy´sledek na deset desetinny´ch m´ıst, byla-li data mˇeˇrena s pˇresnost´ı na jedno desetinn´e m´ısto. Jedn´ım z dalˇs´ıch my´t˚u, ktery´ dosud pˇreˇzil a ktery´ je “u´spˇeˇsnˇe pouˇz´ıv´an” je vy´ˇse zm´ınˇeny´ my´tus ovˇeˇrovac´ıho pokusu. Je aˇz zar´aˇzej´ıc´ı, ˇze ˇcasto i vˇedeˇct´ı pracovn´ıci, ktery´m se dostalo alesponˇelement´arn´ıhostatistick´ehovzdˇel´an´ı,sineuvˇedomuj´ı,ˇzeovˇeˇrovac´ıpokusnen´ınicv´ıceani nicm´enˇeneˇztestov´an´ıhypot´ezy.Tobud’hypot´ezuzam´ıtnenebonezam´ıtne,alenikdynepotvrd´ı - kromˇe uˇcebnicovy´ch akademicky´ch pˇr´ıpad˚u, kdy hypot´eza a alternativa jsou komplement´arn´ı. Koneˇcny´, neodvolateny´ verdikt o teorii m˚uˇze by´t jen zam´ıtavy´, totiˇz kdyˇz pˇredpovˇed’ selˇze. Jinak si lze vˇzdy pˇredstavit,ˇze jin´a data (jin´e okolnosti, chcete-li toˇr´ıci jinak) mohou naˇsi teorii (hypot´ezu) docela dobˇre vyvr´atit. Cˇ´ısla 3, 5, 7, 11, 13 jsou sice lich´aˇc´ısla a prvoˇc´ısla, ale to jeˇstˇe neznamen´a, ˇze jin´a ˇc´ısla teorii o tom, ˇze vˇsechna lich´a ˇc´ısla jsou prvoˇc´ısla, nemohou vyvr´atit. Z´avˇerem t´eto kr´atk´e exkurze do filozofie (matematick´eho) modelov´an´ı si dovolme jeˇstˇe jednu pozn´amku.Taostatnˇerovnˇeˇzsouvis´ıscharakteremvˇedecky´chteori´ı,takjakbylvy´ˇsediskutov´an. V souvislosti s t´ım,ˇze mnohdy se st´ale m´a za to,ˇze teorie je jaky´msiobjektivn´ım obrazem svˇeta, ˇcasto oproˇstˇen´eho od spousty nepodstatny´ch vˇec´ı a okolnost´ı, interpretuje se to, co “vyˇslo” po aplikaci nˇekter´e teorie jako jak´esi objektivn´ı zjiˇstˇen´ı. To co “vyˇslo”, je pokl´ad´ano za cosi, co 7 stoj´ı kdesi za daty, ˇci chcete-li, co je nˇejak v nich ukryto a k ˇcemu jsme se pr´avˇe pomoci naˇsich matematicky´ch n´astroj˚u dopracovali. Podobnˇe jako kdyˇz oloupemeˇslupky z cibule, najdeme jej´ı j´adro. Potom z´avˇery analy´zy dat prezentujeme tak, ˇze to tak objektivnˇe vyˇslo. Aˇckoliv to tak moˇzn´a na prvn´ı pohled vypad´a, ve skuteˇcnosti tomu tak nen´ı. Abychom to nahl´edli vrat’me se jeˇstˇe kr´atce k vy´ˇse uveden´e diskuzi. Uvˇedommesi,ˇzevy´ˇsezm´ınˇen´aabstrakceproveden´anaz´akladˇeopakov´an´ımnohapodobny´ch jev˚u je vˇec proveden´a nˇektery´m subjektem, tj. badatelem. Na tomto m´ıstˇe pros´ım ˇcten´aˇre, aby se oprostil od marxismem pˇestovan´eho pejorativn´ıho n´adechu slova subjektivn´ı, nebot’ dokud bude vˇeda prov´adˇena jednotlivy´mi muˇzi a ˇzenami, bude vˇzdy subjektivn´ı v tom smyslu, ˇze odpovˇednost za vy´ˇse naznaˇcenou abstrakci, pr´avˇe tak jako za vytvoˇren´ı teorie a jej´ı pˇr´ıpadnou aplikaci nese (postupnˇe) ten, kdo ji provedl, vymyslel a pˇr´ıpadnˇe rozhodl aplikovat. Nanejvy´ˇse m˚uˇze doj´ıt k “zobjektivozov´an´ı” tohoto postupu t´ım, ˇze se na nˇem shodne v´ıce odborn´ık˚u z dan´e oblasti. Ani to vˇsak nezmˇen´ı charakter vy´sledku na objektivn´ı ˇci spr´avn´y ˇci udrˇziteln´y (pˇr´ıpadnˇe si ˇcten´aˇr m˚uˇze doplnit jin´e vzneˇsen´e slovo). Staˇc´ı vzpomenout “zobjektivizovany´” n´azor mnoha stˇredovˇeky´ch odborn´ık˚u o geocentrick´e podstatˇe naˇseho planet´arn´ıho syst´emu. Podobnˇe pˇri analy´ze dat volba metody a interpretace vy´sledk˚u je zcela na zodpovˇednosti toho, kdo ji pouˇzil a vy´sledky interpretoval. Prohl´as´ıli nˇekdo,ˇze cosi objektivnˇe vyˇslo bud’ se boj´ı n´est odpovˇednost za vy´sledek nebo cosi nalh´av´a sobˇe a ostatn´ım. Na z´avˇer pˇredmluvy jeˇstˇe uved’me dvˇe technick´e pozn´amky. Pˇrednˇe dodejme, ˇze pˇredkl´adan´a skripta jiˇz sama o sobˇe pˇredstavuj´ı takovy´ objem textu, ktery´jenasam´ehranicimoˇznost´ıby´tivyloˇzenvjednomsemestru.Protonebylomoˇznodoskript zaˇraditdalˇs´ıpartie,kter´ejsousiceu´zcesv´az´anysregresn´ıanaly´zou(robustn´ıregrese,dynamicky´ modelspolusalesponˇ kr´atkouexkurz´ıdoˇcasovy´chˇrad,atd.),alekter´ejsoustejnˇepˇredn´aˇsenyaˇz v r´amci vy´bˇerov´e pˇredn´aˇsky, navazuj´ıc´ı na tu, pro kterou jsou urˇcena tato skripta. Proto autor pl´anuje napsat dalˇs´ı d´ıl skript (v pr˚ubˇehu jednoho aˇz dvou let), ktery´ (pˇrinejmenˇs´ım) pokryje pr´avˇe zm´ınˇen´e partie. Mezi pˇripom´ınkami tˇech, kteˇr´ı rukopis skript ˇcetli se nˇekdy objevila ta, ˇze text je pˇr´ıliˇs zat´ıˇzen vsuvkami um´ıstˇeny´mi v z´avork´ach. Ostatnˇe je zn´amo, ˇze nˇekter´e ˇcasopisy bud’ zcela nebot´emˇeˇrodm´ıtaj´ıtext,vekter´emjsouz´avorky.Tojepˇr´ıstupnepochybnˇeextr´emn´ıaponˇekud nerozumny´. Je sice pravda, ˇze to, co je um´ıstˇeno v z´avork´ach, lze vˇzdy vyj´adˇrit dalˇs´ı vˇetou um´ıstˇenou kdesi d´ale v textu, ˇci vedlejˇs´ı vˇetou, ale je to (prakticky) vˇzdy za cenu vˇetˇs´ıho m´ısta. Napˇr. z´avorky u slova prakticky v pˇredchoz´ı vˇetˇe d´avaj´ı tuˇsit, ˇze je to cel´e m´ınˇeno s jakousi pravdˇepodobnost´ı, tj. plat´ı to maliˇcko slabˇeji, neˇz by to platilo bez tˇech z´avorek. Podobny´ pˇr´ıklad z n´ıˇze uveden´eho textu, totiˇz : “Naprosto pˇr´ımoˇcary´m zobecnˇen´ım tohoto modelu je model uvaˇzuj´ıc´ı soubor M regresn´ıch rovnic typu (3), kter´e spolu (na prvn´ı pohled) nesouvisej´ı (odtud n´azev).” demonstruje, ˇze ˇceˇstina (tedy alesponˇ psany´ jazyk) pomoc´ı z´avorek rozvinula cosi, co moˇzn´a ˇrada jiny´ch jazyk˚u nem´a. Pokud by totiˇz ono na prvn´ı pohled nebylo v z´avorce, znamenalobytosdˇelen´ı,ˇzerovnicespoluopravdunesouvisej´ı,dokonceevidentnˇenesouvisej´ı,jak je vidˇet na prvn´ı pohled. Takto naopak vˇetaˇr´ık´a,ˇze se na prvn´ı pohled zd´a,ˇze spolu nesouvisej´ı, alenen´ıtopravda,rovnicespolunˇejaksouvisej´ı.Vˇsimli jste si kolik m´ısta nav´ıc jsme potˇrebovali. Samozˇrejmˇe, ˇze to nˇekdy ˇcin´ı ˇcten´ı textu m´enˇe plynul´e, coˇz vˇsak tak´e m˚uˇze znamenat, ˇze to ˇcten´aˇredonut´ıpˇreˇc´ıstsidanouvˇetudvakr´atat´ımvypadnoutz“polosp´anku”,dokter´ehoupad´a, je-li text pˇr´ıliˇs plynuly´. Na druh´e stranˇe, nˇekdy je tˇreba, aby ˇcten´aˇr plynule sledoval l´ınii u´vah, 8 nebot’ jinak nedojde ke stejn´emu z´avˇeru jako autor. (Nˇekteˇr´ı autoˇri, zejm´ena ve “spoleˇcensko- vˇedn´ı” oblasti tento princip vyuˇz´ıvaj´ı tak obratnˇe, ˇze ˇcten´aˇr pak jen tˇeˇzko hled´a bod, ve ktr´em autor uˇcinil “krok stranou” a t´ım doˇsel pr´avˇe k tomu, k ˇcemu chtˇel doj´ıt.) Pˇrirozenˇe jako vˇsechnyn´astrojeusnadnˇuj´ıc´ısdˇelov´an´ıinformac´ı,takitentomus´ım´ıtsvojim´ıru.Ostatnˇeˇz´adny´ extr´emismus nen´ı nikdy ku prospˇechu vˇeci. Proto byly nˇekter´e z´avorky (a trof´am siˇr´ıci, ˇze v´ıce neˇz polovina, tj. ty kter´e ˇsly bez vˇetˇs´ı spotˇreby m´ısta) odstranˇeny. Podˇekov´an´ı. Autor skript by r´ad podˇekoval vˇsem, kteˇr´ı mu ke skript˚um dodali nˇejak´e pˇripom´ınky, zejm´ena recenzentovi doc. ing. Igoru Vajdovi, DrSc., ktery´ skripta pˇreˇcetl velmi pozornˇe a navrhl ˇradu zlepˇsen´ı. Za vˇsechny pˇr´ıpadn´e nedostatky vˇsak nesu odpovˇednost toliko j´a, a pros´ım proto o ˇcten´aˇrovu shov´ıvavost. Velice ocen´ım vˇsechny dalˇs´ı pˇripom´ınky, zejm´ena ty´kaj´ıc´ı se obsahu a tˇech m´ıst, kde jsou vyjadˇrov´ana stanoviska k vhodnosti, pouˇzitelnosti atd. toho ˇci onoho postupu. V Praze, 25. ˇr´ıjna 1997 9 ´ ´ ´ 2 UVOD DO REGRESNI ANALYZY Je naprosto pˇrirozen´e, ˇze ti, kdo se rozhodli sezn´amit se statisticky´m zpracov´an´ım dat, se v z´akladn´ıch uˇcebnic´ıch nejprve setk´avaj´ı s u´lohami, ve ktery´ch se odhaduj´ı parametry rozdˇelen´ı n´ahodny´chveliˇcin,pˇr´ıpadnˇesetestuj´ınˇekter´ejednoduch´ehypot´ezyonich.Seskuteˇcnˇezaj´ımavy´mi statisticky´mi postupy se vˇsak setkaj´ı aˇz ve chv´ıli, kdy dojde na u´lohy, snaˇz´ıc´ı se postihnout vz´ajemn´e vztahy n´ahodny´ch veliˇcin. R˚uzny´ch metod, kter´e analyzuj´ı strukturu vztah˚u mezi n´ahodny´mi veliˇcinami je pˇrirozenˇe velk´e mnoˇzstv´ı a kaˇzd´a z nich m´a za sebou historii, kter´a napov´ıd´a, proˇc byla takov´a metoda budov´ana, tj. jak´e byly p˚uvodn´ı d˚uvody pro jej´ı navrˇzen´ı, jak´a byla motivace, ˇci chcete-li inspirace, autor˚u. Nam´atkou jmenujme napˇr. analy´zu vari- ance, zpracov´an´ı kontingenˇcn´ıch tabulek ˇci diskriminaˇcn´ı a shlukovou analy´zu. Nˇekter´e postupy vzniklypˇrirozenˇezcela“mimo”statistiku,napˇr.faktorov´aanaly´za,abylystatistikyteprverozv- inuty, pˇr´ıpadnˇe “dovybaveny” vhodny´m teoreticky´m apar´atem. Historick´e z´aznamy dokl´adaj´ı mimojakoukolivpochybnost,ˇzepokusyonalezen´ıvz´ajemn´ehovztahun´ahodny´chveliˇcinexisto- valyodsamy´chpoˇc´atk˚ubudov´an´ıteoriepravdˇepodobnosti(Galilei(1632),Boscovitch(aMaire) (1757), Laplace (1793), Legendre (1805), Gauss (1809)). Skripta, kter´e pr´avˇe zaˇc´ın´ate studovat, jsou vˇenov´ana jedn´e z nejefektivnˇejˇs´ıch metod analy´zy mnoharozmˇerny´ch (ˇci v´ıcerozmˇerny´ch, jak chcete4) dat. Regresn´ı analy´za, aˇc se to m˚uˇze zd´at pˇrekvapiv´e, odvozuje sv˚uj n´azev od an- glick´eho slova regression. V roce 1885 totiˇz Sir Francis Galton publikoval vy´sledek svy´ch studi´ı o vztahu vy´ˇsky otc˚u a syn˚u v ˇcl´anku “Regression towards mediocrity in hereditary stature”. Jak napov´ıd´an´azevˇcl´anku,zjistil,ˇzejepravdˇepodobnˇejˇs´ıjev,ˇzevy´ˇskasynabudebl´ıˇzepopulaˇcn´ımu pr˚umˇeruneˇzvy´ˇskaotce,neˇzjevopaˇcny´,totiˇzˇzevy´ˇskasynasebudeodpr˚umˇern´evy´ˇskymuˇz˚uliˇsit v´ıce neˇz se liˇs´ı vy´ˇska jeho otce. Ostatnˇe, kdyˇz uˇz toto zjiˇstˇen´ı v´ıme, pˇripad´a n´am zcela pˇrirozen´e, nebot’ pokud by takov´a tendence neplatila, doch´azelo by k neomezen´e fluktuaci vy´ˇsek muˇz˚u, tj. dnes uˇz by mezi n´ami museli ˇz´ıt jak obˇri tak trpasl´ıci. Odhad koeficient˚u modelu byla poˇr´ızen, podobnˇe jako je tomu i v pˇrev´aˇzn´e vˇetˇsinˇe pˇr´ıpad˚u dnes, metodou nejmenˇs´ıchˇctverc˚u (the least squares), kter´a v t´e dobˇe byla jiˇz t´emˇeˇr sto let zn´ama, viz Adrien Marie Legendre (1805) a Carl FriedrichGauss(1809).Aˇckolivvdobˇe,kdySirFrancisGaltonpsalsv˚ujˇcl´anekbylazn´amaijin´a metoda odhadu parametr˚u, totiˇz metoda minimalizuj´ıc´ı souˇcet absolutn´ıch odchylek, je celkem pˇrirozen´e, ˇze byla pouˇzita metoda nejmenˇs´ıch ˇctverc˚u, nebot’ je jednoduch´a a d´av´a explicitn´ı vztahprovyˇc´ıslen´ıodhad˚unaz´akladˇeanalyzovany´chdat.Naopakmetodaminimalizuj´ıc´ısouˇcet absolutn´ıch odchylek (Galileo Galilei (1632), Roger Joseph (ˇci Rodjer Josef) Boscovich (1757), PierreSimonLaplace(1793)),kter´ajednespouˇz´ıv´anaalternativnˇekmetodˇenejmenˇs´ıchˇctverc˚u, vyˇzaduje, pˇri vˇetˇs´ım poˇctu dat, nasazen´ı vy´konn´e vy´poˇcetn´ı techniky. Na rozd´ıl od nejmenˇs´ıch ˇctverc˚u vˇsak jej´ı vy´sledky l´epe “vzdoruj´ı” kontaminac´ı dat, nebot’ v r´amci dnes pouˇz´ıvany´ch pojm˚u je tato metoda robustn´ı alesponˇ proti odlehly´m pozorov´an´ım ve vysvˇetlovan´e promˇenn´e a “navzdory” obecnˇe panuj´ıc´ı domnˇence ˇci pˇredsudku o jej´ı mal´e eficienci lze uk´azat, ˇze pokud data generovan´a byt’ pˇresnˇe norm´aln´ım modelem obsahuj´ı na kaˇzdy´ch 1000 pozorov´an´ı dvˇe poˇskozen´a (kontaminovan´a) pozorov´an´ı, je tato metoda vy´konnˇejˇs´ı (eficientnˇejˇs´ı - pro ty, kdo 4Nˇekdyjsouvedenyzd´anlivˇeuˇcen´ediskuzeotom,zdauˇz´ıvattoˇcionoslovo.Jecelkempˇrirozen´e,ˇzesetakov´e diskuze objevuj´ı, nebot’ nˇekter´e vˇedn´ı obory by patrnˇe jinak nemˇely co dˇelat. Je vˇsak pˇrinejmenˇs´ım pˇrekvapiv´e, ˇze se takov´e diskuze objevuj´ı dokonce i v matematice, kde definice pˇresnˇe vymezuj´ı, oˇcem jeˇreˇc a tedy, aˇz snad na pˇr´ıpady extr´emˇe necitliv´eho pouˇzit´ı nˇektery´ch slov, je celkem jedno, jak´e slovn´ı oznaˇcen´ı je zvoleno. 10 nejsou jazykovy´mi puristy) neˇz metoda nejmenˇs´ıchˇctverc˚u. Tato metoda by´va z pochopitelny´ch d˚uvod˚u oznaˇcov´ana jako L a podobnˇe jako nˇekolik nezn´amy´ch pojm˚u pouˇzity´ch v pˇredchoz´ı 1 vˇetˇe bude diskutov´ana n´ıˇze. Obrat’me nyn´ı naˇsi pozornost na to, jak´e c´ıle si klade regresn´ı analy´za. Nˇeco bylo vlastnˇe jiˇz ˇreˇceno vy´ˇse, totiˇz ˇze regresn´ı analy´za patˇr´ı mezi metody studuj´ıc´ı strukturu vz´ajemny´ch z´avislost´ımezijednotlivy´miveliˇcinami.Mnohdyjsouvˇsakambicet´etometodycharakterizov´any snahou o nalezen´ı n´astroje na predikci hodnoty jedn´e n´ahodn´e veliˇciny za pˇredpokladu, ˇze jiˇz zn´ame hodnoty nˇekolika jiny´ch n´ahodny´ch veliˇcinˇci nen´ahodny´ch vysvˇetluj´ıc´ıch faktor˚u. Nˇekdy se oznaˇcuje tento druhy´ c´ıl za v´ıce ambicizn´ı a implicitnˇe se t´ım m´ın´ı,ˇze ten prvy´ je jakoby lehˇc´ı “podˇc´ast´ı” toho druh´eho. Obecnˇe vˇsak kaˇzdy´ z tˇechto c´ıl˚u vyˇzaduje jin´eˇreˇsen´ı, jak ostatnˇe d´ale uvid´ıme. Teorie, kter´a je v uˇcebnic´ıch a monografi´ıch obvykle vykl´ad´ana, vede k ˇreˇsen´ı prv´eho c´ıle, ale nemus´ı by´t vˇzdy ˇreˇsen´ım toho druh´eho. Dˇr´ıve neˇz budeme pokraˇcovat ve vy´kladu zaved’me alesponˇ nejz´akladnˇejˇs´ı, zcela standardn´ı oznaˇcen´ı.OznaˇcmetedysymbolemN mnoˇzinuvˇsechpˇrirozeny´chˇc´ısel,Rre´alnoupˇr´ımku,R+ jej´ı kladnou ˇc´ast, Rp p-rozmˇerny´ Euklidovsky´ prostor, Rn,k (nˇektery´) k-rozmˇerny´ podprostor pros- toru Rn a koneˇcnˇe pak (Ω,A,P) z´akladn´ı pravdˇepodobnostn´ı prostor. Regresn´ı model budeme uvaˇzovat ve tvaru: Y = g(X ,β0)+E , i = 1,2,...,n (1) i i i provˇsechnan ∈ N,kdeg(x,β)budenˇekter´ahladk´afunkce,g : Rq×Rp → R (q,p ∈ N).Posloup- nost {X }∞ bude bud’ deterministick´a posloupnost q-rozmˇerny´ch vektor˚u (v tom pˇr´ıpadˇe i i=1 budeme ps´at {x }∞ ) ˇci posloupnost (nez´avisly´ch a stejnˇe rozdˇeleny´ch) n´ahodny´ch veliˇcin, tj. i i=1 X (ω) : Ω → Rq, kter´e jsou nav´ıc nez´avisl´e od posloupnosti {E }∞ , E (ω) : Ω → R, coˇz je i i i=1 i jin´a posloupnost, obvykle stejnˇe rozdˇeleny´ch, nikoliv vˇsak nutnˇe nez´avisly´ch, n´ahodny´ch veliˇcin. Posledn´ı pˇredpoklad neby´v´a v nˇektery´ch textech jasnˇe zd˚uraznˇen, ale jak uvid´ıme pozdˇeji, jeho naruˇsen´ı m´a v´aˇzn´e d˚usledky. Veliˇcina Y stoj´ıc´ı na lev´e stranˇe rovnosti (1) by´v´a oznaˇcov´ana i jako z´avisle promˇenn´a, veliˇciny X jako nez´avisle promˇenn´e a E jako fluktuace. N´ıˇze uveden´a i i diskuze ty´kaj´ıc´ı se interpretace vy´sledk˚u regresn´ı analy´zy ale naznaˇc´ı,ˇze je patrnˇe lepˇs´ı pouˇz´ıvat pojmy jako vysvˇetlovan´a veliˇcina (pro Y ) a vysvˇetluj´ıc´ı veliˇciny pro X . Toto “n´azvoslov´ı” totiˇz i i nesv´ad´ı k domnˇence, ˇze odhadnuty model m˚uˇzeme pouˇz´ıt k predikci pro jak´ekoliv hodnoty nez´avisle promˇenny´ch. V dalˇs´ım textu se jeˇstˇe k tomuto probl´emu vr´at´ıme. Pro veliˇciny Y , X i i a E by´v´a uv´adˇena i cel´aˇrada jiny´ch term´ın˚u, kter´e se snaˇz´ı napovˇedˇet charakter tˇechto veliˇcin i vzhledem k nˇektery´mˇcasty´m pouˇzit´ımˇci interpretac´ım regresn´ıho modelu. Napˇr.X jsou nˇekdy i oznaˇcov´any jako nosiˇce, regresory ˇci jako faktory a pˇr´ısluˇsny´ Rq jako faktorovy´ prostor. Tak´e v tomto textu budeme obˇcas tato r˚uzn´a “pojmenov´an´ı” pouˇz´ıvat, abychom si na nˇe pˇrivykli a neˇcinily n´am pot´ıˇze pˇri ˇcten´ı r˚uzny´ch pramen˚u. Pro ty, kteˇr´ı se nˇekdy v budoucnu budou vˇenovat ekonomicky´m aplikac´ım, poznamenejme,ˇze se jeˇstˇe setkaj´ı s rozliˇsen´ım,ˇcasto sporny´m, charakteru veliˇcin vstupuj´ıc´ıch do modelu a naraz´ı na pojmy endogen´ı (ˇcesky snad koncov´a ˇci vy´stupn´ı), oznaˇcuj´ıc´ıveliˇcinyzpravidlana“lev´e”stranˇemodelu,tj.vroliY apredeterminovan´a i (ˇcesky snad pˇredurˇcen´a, ale sp´ıˇse vstupn´ı) veliˇcina, stoj´ıc´ıch v roli X . Druhy´ typ veliˇcin pak i by´v´a jeˇstˇe dˇelen na posunut´e endogen´ı (lagged endogenous) a exogen´ı (ˇcesky asi vnˇejˇs´ı ˇci mimo model urˇcen´e; nechme vˇsak nad´ale pˇreklady jazykozpytc˚um, v matematick´em textu, ostatnˇe jsme to jiˇz vy´ˇse zm´ınili, jde o jednoznaˇcnost, kter´a je zajiˇstˇena formalizmem a nen´ı naˇstˇest´ı 11 z´avisl´a na n´azvech). Povˇsimnˇeme si, ˇze rozliˇsen´ı na exogen´ı a endogen´ı souvis´ı opˇet s pojmem kauzality. Jak jsme uvedli vy´ˇse, byl tento protagonistou renesanˇcn´ıho paradigmatu vˇedeck´eho pozn´an´ı aˇzel Bohu st´ale jeˇstˇe v mnoha vˇedn´ıch discipl´ın´ach pˇreˇz´ıv´a. Nen´ı bez zaj´ımavosti,ˇze do ekonomie, ˇci sp´ıˇse do ekonometrie byl “ve statistick´e modifikaci” zaveden C. W. J. Grangerem na konciˇsedes´aty´ch let, tj. v dobˇe, kdy filosofie vˇedy naopak zaˇcala uvaˇzovat a v´aˇznˇe diskutovat o jeho problematiˇcnosti. Samozˇrejmˇe, ˇze nen´ı tˇeˇzk´e uk´azat pˇr´ıklady - a to i z kaˇzdodenn´ıho ˇzivota, kter´e demostruj´ı jeho problematiˇcnost. Grangerova definice a test, Granger (1969), se op´ıraj´ı o pojem statistick´e nez´avislosti a v tomtoduchujetˇrebajeinterpretovat.Uˇzivatel´etovˇsakzpravidla(bohorovnˇe)pˇrehl´ıˇzej´ıajednaj´ı s t´ımto pojmem jako by ˇslo o bˇeˇzny´ pojem pˇr´ıˇcinn´e souvislosti. Jak´e to m˚uˇze m´ıt n´asledky si snadno pˇredstav´ıme, uv´aˇz´ıme-li napˇr., ˇze se mnoh´a (politick´a) rozhodnut´ı odv´ıjej´ı sp´ıˇse od vˇedecky´ch hypot´ez vysloveny´ch na z´akladˇe pr´avˇe popsan´eho zp˚usobu interpretace vy´sledk˚u neˇz od historicky ovˇeˇreny´ch postup˚u. Vrat’me se vˇsak ke vztahu (1) a dokonˇceme vysvˇetlen´ı jednotlivy´ch veliˇcin v nˇem vys- tupuj´ıc´ıch. Vektor β0 = (β0,β0,...,β0)T bude oznaˇcov´an jako vektor regresn´ıch parametr˚u, 1 2 p pokud budeme mluvit o neline´arn´ı regresi, a jako regresn´ıch koeficient˚u, v line´arn´ı regresi. Koneˇcnˇe pak horn´ı index “T” oznaˇcuje transpozici vektoru ˇci matice. V pˇrev´aˇzn´e ˇc´asti dalˇs´ıho textubudemeuvaˇzovatmodelspevny´mi(deterministicky´mi)vysvˇetluj´ıc´ımipromˇenny´mi.Exkurze domodelusn´ahodny´mivysvˇetluj´ıc´ımipromˇenny´mibudoujenobˇcasn´e.Zan´ahodny´budetedyv modelupovaˇzov´anpouzeˇsum(ˇcichcete-lifluktuacenebon´ahodn´efluktuace),ktery´ jerepresen- tovany´ (jsou representov´any) posloupnost´ı n´ahodny´ch veliˇcin {E }∞ . N´ahodnost disturbanc´ı i i=1 samozˇrejmˇe m´a za n´asledek to, ˇze i vysvˇetlovan´a veliˇcina Y je n´ahodn´a. Prvn´ım c´ılem regresn´ı analy´zy, jak uˇz bylo ostatnˇe konstatov´ano vy´ˇse, je popis struktury dat (ˇci chcete-li, vysvˇetlen´ı dat). Po t´e, co jsme zavedli oznaˇcen´ı pro regresn´ı model, m˚uˇzeme tento c´ıl specifikovat jako odhad modelu ve statistick´em smyslu. Jiny´mi slovy to znamen´a,ˇze na z´akladˇe dat, kter´a z hlediska druh´eho c´ıle regresn´ı analy´zy, totiˇz predikce, m˚uˇzeme povaˇzovat za tr´enovac´ı soubor, chceme nejprve odhadnout charakter (tvar) funkce g(x,β) a n´aslednˇe odhad- noutβ0.Analy´zadattedym˚uˇzezaˇc´ıtvpodstatˇetestem,zdag(x,β)jeline´arn´ıˇcinikoliv,nebose prostˇe na z´akladˇe zkuˇsenost´ı (fyzik´aln´ıch, soci´aln´ıch, demograficky´ch, ekonomicky´ch ˇci jiny´ch) ˇci okolnost´ı rozhodneme pro nˇekterou funkci g(x,β) (ˇci typ funkce). Obvykle je tvar funkce (alesponˇ) “tuˇseny´” a proto se ˇcasto omezujeme na odhad vektoru β0. Tak jako v drtiv´e vˇetˇsinˇe statistick´e literatury budeme odhad poˇr´ızeny´ nˇekterou odhadovac´ı metodou oznaˇcovat βˆ. Nav´ıc indexy, dole ˇci nahoˇre, budou napov´ıdat, jakou metodou byl odhad vyˇc´ıslen, ˇci na z´akladˇe kolika pozorov´an´ı byl zkonstruov´an, atd.. Tak napˇr. βˆ(LS,n) bude naznaˇcovat,ˇze se jedn´a o odhad poˇr´ızeny´ metodou nejmenˇs´ıchˇctverc˚u na z´akladˇe dat o rozsahu n.Rovnˇeˇzzcelastandardnˇejakjsmenatozvykl´ı,βˆ(LS,n)budeoznaˇcovati-tousloˇzku(souˇradnici, i koordin´atu) vektoru βˆ(LS,n). Podrobnˇejˇs´ı vysvˇetlen´ı ˇci rozˇs´ıˇren´ı oznaˇcen´ı a symbol˚u bude vˇzdy uvedenovm´ıstech,kdetobudemepotˇrebovattak,abynebylonutn´ejedrˇzetdlouhoabezuˇzitku v pamˇeti. Vy´ˇseuveden´ebezprostˇrednˇenapov´ıd´a,ˇzepokuduvaˇzujememodelsn´ahodny´minosiˇcipˇredpokl´ad´ame, ˇze pro naˇse data D existuje ω ∈ Ω tak,ˇze hodnoty n´ahodny´ch veliˇcin {Y (ω)}n a {X (ω)}n n 0 i i=1 i i=1 12

Description:
revisited. Review of Economics and Statistics 49, 92-107. [35] Fisher, R. A. (1922): On the mathematical foundations of theoretical statistics. Philos. Trans. Roy. Soc. London Ser. A 222, pp. 309–368. [36] Friedman, M. (1957): A Theory of the Consumption Function. Princeton: Princeton Uni- versit
See more

The list of books you might like

Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.