ebook img

Model Kurma ve Analiz PDF

18 Pages·2012·0.73 MB·Turkish
by  
Save to my drive
Quick download
Download
Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.

Preview Model Kurma ve Analiz

11. Ders Model Kurma ve Analiz Örnek: Çerçeve: 2011/2012 Öğretim Yılında Đst 307 Regresyon Analizi dersini alan öğrencilerin kümesi (kitle). Amaç: Boy uzunluğu, kol uzunluğu, omuz çevresi, kalça çevresi, bacak uzunluğu, cinsiyet değişkenlerine dayalı olarak ağırlığı açıklayan bir lineer model kurmak. Bağımlı (açıklanan, tepki) değişken: Y (kg) – ağırlık Açıklayıcı (bağımsız) değişkenler: X - boy uzunluğu (cm) 1 X - kol uzunluğu (cm) 2 X - omuz çevresi (cm) 3 X - bel çevresi (cm) 4 X - kalça çevresi (cm) 5 X - cinsiyet(K-0,E-1) 6 Örnekleme: Gözlemler: x x x x x x y 1i 2i 3i 4i 5i 6i i Model: Cinsiyet dışındaki değişkenlerin (bağımlı ve açıklayıcı) ortak dağılımının çok değişkenli normal dağılım olduğu düşünülebilir. Çok değişkenli normal dağılımlarda değişkenlerden bir tanesinin, diğerlerine göre koşullu dağılımının beklenen değeri diğer değişkenlerin verilen değerlerinin lineer bir fonksiyonudur, yani E(Y )=b +b xb+ xb + bx +b x + x /X1=x1,X2=x2,X3=x3,X4=x4,X5=x5 0 1 1 2 2 3 3 4 4 5 5 dır. Cinsiyet değikeni X ‘nın aldığı x =0 ve x =1 değerleri için 6 6 6 E(Y )=b +b xb+ xb + bx +b x +b x + x /X1=x1,X2=x2,X3=x3,X4=x4,X5=x5,X6=x6 0 1 1 2 2 3 3 4 4 5 5 6 6 yazılabilir. Buradaki b katsayısı, x =1 değerini aldığında koşullu beklenen 6 6 değerde ortaya çıkacak değişimi (x =0 değerine göre değişimi) göstermektedir. 6 Y =b +b x b+ xb + bx + b x +b x e+ x + , i =1,2,...,n i 0 1 1i 2 2i 3 3i 4 4i 5 5i 6 6i i e ∼ N(0s, 2) , i =1,2,...,n Varsayımlar: i e 'ler bağımsız i Analiz: Sonuçlar ve Yorumlar: Uyum Eksikliği (Lack of Fit) Testi Açıklayıcı değişkenlerin belli değerlerinde bağımlı değişken için birden çok gözlem olsun. Model: Yij =b1x1ij +b 2x2ij +...b+ pxkeij + ij , i =1,2,...,m , j =1,2,...,ni e ∼ N(0,s 2) , i =1,2,...,n , j =1,2,...,n Varsayımlar: ij e i e 'ler bağımsız ij olmak üzere, H :Lineer Modeluygundur (Lineer Model gözlemlerileuyumludur) 0 H :Lineer Modeluygun değildir (Uyum eksikliği (lack of fit) vardır) 1 hipotezleri a anlam düzeyinde test edilmek istendiğinde, bir test istatistiği, n i ∑ Y ij Y = j=1 i n i ∑n ∑ni (Y - Yˆ )2- ∑n ∑ni (Y- Y )2-/(n p)  ij ij ij i  F = i=1 j=1 i=1 j=1  ∑n ∑ni (Y - Y )2 ij i i=1 j=1 n ∑n - n i i=1 olup, F > F olduğunda H reddedilir. n 0 1- a ;-n p; ∑-n n i i=1 Örnek(Fizik): http://en.wikipedia.org/wiki/Pendulum_(mathematics) , http://en.wikipedia.org/wiki/Pendulum The seconds pendulum, a pendulum with a period of two seconds so each swing takes one second The seconds pendulum, a pendulum with a period of two seconds so each swing takes one second, was widely used to measure gravity, because most precision clocks had seconds pendulums. By the late 17th century, the length of the seconds pendulum became the standard measure of the strength of gravitational acceleration at a location. By 1700 its length had been measured with submillimeter accuracy at several cities in Europe. For a seconds pendulum, g is proportional to its length: Örnek: Bir deneyde, x(cid:2)C sıcaklıkta 100 gr su içinde çözülen bir maddenin kütlesi (y) aşağıdaki gibi gözlenmiştir. xoC 10 20 30 30 40 40 40 50 60 60 y(gr) 59 65 68 70 73 74 75 81 92 93 Bu gözlemlere dayanarak y ile x arasında bir bağıntı araştıralım. Gözlemlerin xOy koordinat sistemindeki görüntüsü (serpilme diyagramı, saçılım grafiği) aşağıdaki gibidir. Belli bir x sıcaklığında 100 gr su içinde çözülen madde miktarı için farklı farklı değerler gözlenebilmektedir. Bu sebeple çözülen madde miktarını bir Y rasgele değişkenin aldığı değer olarak görebiliriz. E(Y /x) = a+bx varsayımı altında, e Y = a+bx + , i =1,2,...,10 i i i e regresyon denklemini (modelini) gözönüne alalım. Burada ‘ler bağımsız ve i aynı dağılımlı varsayılan rasgele değişkenlerdir (hata terimleridir). a ve b 10 [ ] katsayılarını En Küçük Kareler Yöntemi ile, yani ∑ y - (a+bx ) 2 kareler i i i=1 toplamı minimum olacak şekilde tahmin ettiğimizde, 10 ∑(x - x)(y - y) i i bˆ = i=1 =0.661 10 ∑(x - x)2 i i=1 aˆ = y- bˆx = 49.881 bulunur. Bu katsayıları, gözlem noktalarının arasından gözlemlere yakın olacak şekilde çizilen doğrunun eğiminden ve ordinatı kestiği noktadan da yaklaşık olarak bulabiliriz. yˆ=aˆ+bˆx=49.881+0.661x regresyon tahmin denklemi yardımıyla belli x sıcaklığında 100 gr su içinde çözülen ortalama madde miktarını (µ =E(Y / x)) tahmin edebiliriz. Y/x Serpilme diyagramına bakıldığında, E(Y /x) = c+dx+ex2 gibi bir bağıntı daha uygun görünmektedir. Bu varsayım altında, e Y =c+dx +ex2 + , i =1,2,...,10 i i i i regresyon denkleminde c,d,e katsayıları En Küçük Kareler Yöntemi ile tahmin edildiğinde, yˆ=cˆ+dˆx+eˆx2 =58.584+0.0864x+0.0078x2 tahmin denklemi bulunur. Yukarıdaki serpilme diyagramında (x ,y ) noktaları, z = x2 olmak üzere; i i i i (x ,z ) noktaları olarak zOy koordinat sisteminde yeniden işaretlense aşağıdaki i i gibi bir serpilme diyagramı ortaya çıkmaktadır. Bu serpilme diyagramına bakıldığında, E(Y /x) = f + gz = f + gx2 i i gibi bir bağıntı uygun görünmektedir. e Y = f +gz + , i =1,2,...,10 i i i olmak üzere katsayıların tahmin edilmesiyle, yˆ= fˆ+gˆx2 =60+0.00893x2 elde edilir. Böylece üç tane tahmin denklemi elde etmiş olduk. yˆ=aˆ+bˆx=49.881+0.661x yˆ=cˆ+dˆx+eˆx2 =58.584+0.0864x+0.0078x2 yˆ= fˆ+gˆx2 =60+0.00893x2 Hangisini kullanacağız? Regresyon denkleminin gözlemlere uyumunun bir ölçütü olan, 10 ∑(yˆ - y)2 i R2 = i=1 10 ∑(y - y)2 i i=1 belirleyicilik katsayısı bu üç denklem için sırasıyla, %95.1, %98.8, %98.7 olarak hesaplanmıştır. Đkinci ve üçüncü denklemler birinciden daha iyi görünmektedir. e Her üç durumda da ‘lerin normal dağılıma sahip olduğunu varsayıp, i bireysel parametreler ile ilgili, sıfıra eşit olup olmama hipotezleri için t- değerleri, p-değerleri ve varyans analizi tabloları aşağıdaki gibi elde edilmiştir. e Birinci model Y = a+bx + , i =1,2,...,10 için, i i i parametre tahmin t-değeri p-değeri a 49.881 23.01 0.00 b 0.661 12.50 0.00 ve varyans analizi tablosu, değişimin serbestlik kareler ort. kar. F-değeri p-değeri kaynağı derecesi toplamı toplamı regresyon 1 1031.2 1031.2 156.2 0.0 hata 8 52.8 6.6 toplam 9 1084.0 dır. e Đkinci model Y =c+dx +ex2 + , i =1,2,...,10 için, i i i i parametre tahmin t-değeri p-değeri c 58.584 26.10 0.00 d 0.0864 0.67 0.53 e 0.0078 4.54 0.00 ve varyans analizi tablosu, değişimin serbestl kareler topl. ort. F- p- kaynağı ik kar. değeri değeri dereces topl. i regresyon 2 1070.62 535.31 280.02 0.00 hata 7 13.38 1.91 toplam 9 1084.0 dır. Üçüncü model, e Y = f + gx2 + , i =1,2,...,10 i i i için parametre tahmin t-değeri p-değeri f 60 80.75 0.00 g 0.00893 24.52 0.00 ve varyans analizi tablosu, değişimin serbestl kareler ort. F- p- kaynağı ik topl. kar. değeri değeri dereces topl. i regresyon 1 1069.8 1069.8 601.3 0.00 hata 8 14.2 1.8 toplam 9 1084.0 dır. Bu üç modelden belirleyicilik katsayısına göre daha iyi görünen ikinci modelde d katsayısı anlamsızdır. Bu katsayının bulunduğu terimin modelden çıkarılmasıyla üçüncü model elde edilmektedir. Üçüncü modelde karar kılmış olalım. Bunun en iyi model olduğunu iddia edemeyiz. Regresyon denklemi, E(Y / x)=β +β x+β x2+...+β xk (polinom, parametrelere göre lineer) 0 1 2 k E(Y / x)=α+βxγ (parametrelere göre lineer olmayan) E(Y / x)=α+βex (parametrelere göre lineer) α E(Y / x)= β+δeγx … biçiminde olabilir.

Description:
Gözlemlerin xOy koordinat sistemindeki görüntüsü (serpilme diyagramı, .. matrisinin sütun vektörleri arasında doğrusal bağımlılık veya yaklaşık
See more

The list of books you might like

Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.