ebook img

ÇUKUROVA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ YÜKSEK LİSANS TEZİ Nazif ÇALIŞ ... PDF

121 Pages·2005·1.1 MB·Turkish
by  
Save to my drive
Quick download
Download
Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.

Preview ÇUKUROVA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ YÜKSEK LİSANS TEZİ Nazif ÇALIŞ ...

ÇUKUROVA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ YÜKSEK LİSANS TEZİ Nazif ÇALIŞ KARMA DAĞILIM MODELLERİNDE BİLEŞEN SAYISINI TAHMİN ETMEK İÇİN YÖNTEMLER İSTATİSTİK ANABİLİM DALI ADANA, 2005 ÇUKUROVA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ KARMA DAĞILIM MODELLERİNDE BİLEŞEN SAYISINI TAHMİN ETMEK İÇİN YÖNTEMLER NAZİF ÇALIŞ YÜKSEK LİSANS TEZİ İSTATİSTİK ANABİLİM DALI Bu tez 15 / 08 / 2005 Tarihinde Aşağıdaki Jüri Üyeleri Tarafından Oybirliği / Oyçokluğu İle Kabul Edilmiştir. İmza:…………..……… İmza:…………..……… İmza:…………..……… Doç.Dr. Hamza EROL Prof.Dr. Fikri AKDENİZ Yard.Doç.Dr. Sami ARICA DANIŞMAN ÜYE ÜYE Bu tez Enstitümüz İstatistik Anabilim Dalında hazırlanmıştır. Kod No: Prof.Dr. Aziz ERTUNÇ Enstitü Müdürü İmza ve Mühür Bu çalışma Ç.Ü. Bilimsel Araştırma Projeleri Birimi Tarafından Desteklenmiştir. Proje No: FEF2004YL62 Not: Bu tezde kullanılan özgün ve başka kaynaktan yapılan bildirişlerin, çizelge, şekil ve fotoğrafların kaynak gösterilmeden kullanımı, 5846 sayılı Fikir ve Sanat Eserleri Kanunundaki hükümlere tabidir. ÖZ YÜKSEK LİSANS TEZİ KARMA DAĞILIM MODELLERİNDE BİLEŞEN SAYISINI TAHMİN ETMEK İÇİN YÖNTEMLER Nazif ÇALIŞ ÇUKUROVA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ İSTATİSTİK ANABİLİMDALI Danışman: Doç.Dr. Hamza EROL Yıl: 2005, Sayfa :107 Jüri: Doç.Dr. Hamza EROL Prof.Dr. Fikri AKDENİZ Yard.Doç.Dr. Sami ARICA Karma dağılım modelleri, incelenen karakteristiklere göre homojen olmayan ya da heterojen yapıdaki kitleleri modellemek için kullanılır. Bu çalışmada karma dağılım modellerinde bileşen sayısını tahmin etmek için yöntemler incelenmiştir. Bu amaçla çalışmanın giriş bölümünde karma dağılım modelleri hakkında önbilgi verilmiş ve ikinci bölümde karma dağılım modellerinin tarihsel gelişimi açıklanmıştır. Üçüncü bölümde karma dağılım modelleri için gösterimler verilmiştir. Dördüncü bölümde karma dağılım modellerinde bileşen sayısını belirlemek için kullanılan grafiksel yöntemler üzerinde durulmuştur. Beşinci bölümde likelihood oran test istatistiği kullanılarak karma dağılım modellerinde bileşen sayısının belirlenmesi ele alınmıştır. Altıncı bölümde karma dağılım modellerinde model seçiminde kullanılan bilgi kriterleri incelenmiştir. Yedinci bölümde bir veri grubu için bileşen sayısı belirlendikten sonra bileşenlere ait parametrelerin tahminleri verilmiştir. Sekizinci bölümde bir veri grubu üzerinde, anlatılan yöntemlerin uygulamaları ele alınmıştır. Son bölümde sonuç ve öneriler tartışılmıştır. Anahtar Kelimeler: Bileşen sayısının belirlenmesi, EM algoritması, Bilgi kriteri, Karma dağılım modeli, Parametre tahmini. I ABSTRACT MSc THESIS THE METHODS FOR ESTIMATING THE NUMBER OF COMPONENTS IN MIXTURE DISTRIBUTION MODELS Nazif ÇALIŞ DEPARTMENT OF STATISTICS INSTITUTE OF NATURAL AND APPLIED SCIENCES UNIVERSITY OF ÇUKUROVA Supervisor: Assoc.Prof.Dr. Hamza EROL Year: 2005, Pages :107 Jury: Assoc.Prof.Dr. Hamza EROL Prof.Dr. Fikri AKDENİZ Assist.Prof.Dr. Sami ARICA Mixture distribution models can be used for modelling of non-homogeneous or heteregeneous structure of a population with respect to the interested characteristics. In this study, the methods for estimating the number of components in mixture distribution models are examined. For this purpose in the first chapter, some informations of mixture distribution models are given and in the second chapter, a brief history of mixture distribution models are given. In the third chapter, general informations about formulations of mixture distribution models are given. In the fourth chapter, the graphical methods for estimating the number of components in mixture distribution models are analysed. In the fifth chapter, applying likelihood ratio test statistic to estimate the number of compnents in mixture distribution models are given. In the sixth chapter, information criterion in model selection for mixture distribution models are examined. In seventh chapter, estimating parametres in mixture distribution models are given. In eighth chapter, explained methods are applied on a sample data set. Finally, results and discussions are given Key Words: Determining the number of components, Expectation and maximization algorithm, Information criterion, Mixture distribution model, Paramater Estimation. II TEŞEKKÜR Bu tezin hazırlanmasında bana destek olan ve hiçbir zaman yardımlarını esirgemeyen danışmanım sayın Doç.Dr. Hamza EROL’ a, İstatistik bilimine çok büyük katkıları olan ve Çukurova Üniversitesi İstatistik Bölümünün kurulmasında büyük emeği geçen sayın Prof.Dr. Fikri AKDENİZ hocama ve İstatistik bölümü öğretim elemanlarına teşekkürlerimi sunarım. Ayrıca, maddi ve manevi desteklerini hiçbir zaman esirgemeyerek her zaman yanımda olan anneme, babama ve kardeşlerime teşekkürü bir borç bilirim. III İÇİNDEKİLER SAYFA ÖZ ................................................................................................................................I ABSTRACT................................................................................................................II TEŞEKKÜR...............................................................................................................III İÇİNDEKİLER..........................................................................................................IV TABLOLAR DİZİNİ................................................................................................VII ŞEKİLLER DİZİNİ....................................................................................................IX 1. GİRİŞ.......................................................................................................................1 1.1. Karma Dağılım Modellerine Dayalı Ayrıştırma Analizi................................1 2. YAPILAN ÇALIŞMALAR.....................................................................................3 2.1. Karma Dağılım Modeliyle İlgili İlk Çalışma..................................................3 2.2. Karma Dağılım Modellerinin Tarihsel Gelişimi.............................................4 3. KARMA DAĞILIM MODELLERİNDE GÖSTERİMLER...................................7 3.1. Temel Gösterimler..........................................................................................7 3.2. Tamamlanmış Veri İle İlgili Gösterimler......................................................10 3.3. Karşılaşılan İstatistiksel Problemler..............................................................12 3.4. Bilinmeyen Parametreler...............................................................................13 4. KARMA DAĞILIM MODELLERİNDEKİ BİLEŞEN SAYISININ BELİRLENMESİNDE KULLANILAN GRAFİKSEL YÖNTEMLER.............14 4.1. Karma Dağılım Modellerindeki Bileşen Sayısının Belirlenmesinde Kullanılan Grafiksel Yöntemler Hakkında Genel Bilgiler.............................14 4.1.1. Olasılık Yoğunluk Fonksiyonuna Dayalı Yöntemler...........................15 4.1.2. Dağılım Fonksiyonuna Dayalı Yöntemler...........................................22 4.2. Grafiklerin Karşılaştırılması..........................................................................30 4.2.1.Tek Bileşenli Normal Dağılım ( A Durumu ).......................................31 4.2.2. Bileşen Ortalamalarının Çok Yakın Olduğu Tek Tepeli Simetrik Karma Normal Dağılım ( B Durumu )..............................................................33 4.2.3. Bileşen Ortalamaları Arasındaki Uzaklığın Az Olduğu İki Tepeli Simetrik Karma Normal Dağılım ( C Durumu )...................................35 IV 4.2.4. Bileşen Ortalamaları Arasındaki Uzaklığın Fazla Olduğu İki Tepeli Simetrik Karma Normal Dağılım ( D Durumu )...................................37 4.2.5. Karma Oranlarının Farklı Ve Bileşen Ortalamaları Arasındaki Uzaklığın Fazla Olduğu İki Tepeli Karma Normal Dağılım ( E durumu ) ...............................................................................................................39 4.2.6. Karma Oranlarının Farklı ve Bileşen Ortalamaları Arasındaki Uzaklığın Az Olduğu İki Tepeli Karma Normal Dağılım ( F Durumu ) ...............................................................................................................41 4.2.7. Bileşen Ortalamalarının Çakışık Olduğu Tek Tepeli Karma Normal Dağılım ( G Durumu )...........................................................................45 5. LIKELIHOOD ORAN TEST İSTATİSTİĞİ........................................................47 5.1. Çok Değişkenli Normal Dağılımın Likelihood Fonksiyonu.........................48 5.2. µ ve Σ Parametrelerinin Maksimum Likelihood Tahminleri........................49 5.3. Likelihood Oran Testi...................................................................................50 5.4. Genelleştirilmiş Likelihood Oran Testi.........................................................53 5.5. Karma Dağılım Modellerinde Bileşen Sayısını Belirlemede Likelihood Oran Test İstatistiği.................................................................................................54 6. KARMA DAĞILIM MODELLERİNDE BİLGİ KRİTERLERİ..........................56 6.1. Model Seçiminde Log-Likelihood Yanlılık Düzeltmesi...............................56 6.2. Model Seçiminde Akaike’nin Bilgi Kriteri...................................................58 6.3. Model Seçiminde Bayes Temelli Bilgi Kriteri..............................................59 6.3.1. Model Seçiminde Laplace Yöntemi Yaklaşımı...................................60 6.3.2. Model Seçiminde Bayesci Bilgi Kriteri...............................................62 6.4. Model Seçiminde Sınıflandırma Tabanlı Bilgi Kriteri..................................63 6.5. Model Seçiminde Bilgi Kriterlerinin Karşılaştırılması.................................66 7. KARMA DAĞILIM MODELLERİNDE PARAMETRE TAHMİNİ...................68 7.1. Karma Dağılım Modellerindeki Parametreleri Tahmin Etmek İçin Maksimum Likelihood Yöntemi....................................................................68 7.2. Normal Dağılımların Karma Modeli Ve Maksimum Likelihood Fonksiyonu ........................................................................................................................71 7.3. Karma Dağılım Modelleri İçin EM Algoritması...........................................76 V 7.4. Karma Dağılım Modelindeki Parametreleri Maksimum Likelihood Yöntemiyle Birlikte EM Algoritmasının Uygulanmasıyla Tahmin Etmek için EM Algoritmasında Parametrelerin Başlangıç değerlerinin k-Means Algoritmasıyla Belirlenmesi..........................................................................82 8. KARMA DAĞILIM MODELİYLE İLGİLİ BİR UYGULAMA.........................86 9. SONUÇ VE ÖNERİLER.......................................................................................99 KAYNAKLAR........................................................................................................100 ÖZGEÇMİŞ.............................................................................................................107 VI TABLOLAR DİZİNİ SAYFA Tablo 4.1. Şekil 4.1’deki histogram yardımı ile tahmin edilen parametreler 15 Tablo 4.2. h = 0.25 alındığında Şekil 4.1 için tahminler 20 Tablo 7.1. k-means algoritması örneği için A, B, C ve D gözlem değerleri 83 Tablo 7.2. A, B, C ve D noktaları için birinci adımda elde edilen sınıflandırma sonucuna göre oluşan merkezler ya da ortalamalar 83 Tablo 7.3. A, B, C ve D noktaları için ikinci adımda elde edilen yeni sınıflandırma sonucuna göre oluşan merkezler ya da ortalamalar 84 Tablo 7.4. Her bir gözlemin en son oluşturulan (A) ve (BCD) sınıflarının merkezlerine ya da ortalamalarına olan Euclidean uzaklıkları 84 Tablo 8.1. Ruspini verisi 86 Tablo 8.2. Bileşen sayısı g’nin 2 alınması durumunda k-means algoritması uygulanarak sınıflandırılmış Ruspini verisi. 89 Tablo 8.3. Bileşen sayısı g’nin 3 alınması durumunda k-means algoritması uygulanarak sınıflandırılmış Ruspini verisi. 90 Tablo 8.4. Bileşen sayısı g’nin 4 alınması durumunda k-means algoritması uygulanarak sınıflandırılmış Ruspini verisi. 91 Tablo 8.5. Bileşen sayısı g’nin 5 alınması durumunda k-means algoritması uygulanarak sınıflandırılmış Ruspini verisi. 92 Tablo 8.6. Ruspini verisinde bileşen sayısı g 2 alındığında oluşturulan çok değişkenli normal karma dağılım modeli için elde edilen parametre tahminleri. 93 VII Tablo 8.7. Ruspini verisinde bileşen sayısı g 3 alındığında oluşturulan çok değişkenli normal karma dağılım modeli için elde edilen parametre tahminleri. 94 Tablo 8.8. Ruspini verisinde bileşen sayısı g 4 alındığında oluşturulan çok değişkenli normal karma dağılım modeli için elde edilen parametre tahminleri. 94 Tablo 8.9. Ruspini verisinde bileşen sayısı g 5 alındığında oluşturulan çok değişkenli normal karma dağılım modeli için elde edilen parametre tahminleri. 95 Tablo 8.10. Ruspini verisinde bileşen sayısı g 2, 3, 4 ve 5 alındığında her bir durum için parametre tahminleri kullanılarak hesaplanan log-likelihood fonksiyonların değerleri. 96 Tablo 8.11. Ruspini verisinde bileşen sayısı g 2, 3, 4 ve 5 alındığında hesaplanan Log-likelihood fonksiyonların değerleri, Likelihood oran test istatistiklerinin değerleri, Akaike’nin bilgi kriteri (AIC) değerleri, Bayesci bilgi kriteri (BIC) değerleri ve parametre sayıları. 97 VIII

Description:
tahmin etmektir. Doğru atamanın yapıldığı bir duruma, A tipi hemofili faktörü (AHF) Weldon (1893) verilerin histogramı asimetrik Bu asimptotlar;. 3. 2 Buna rağmen Akaike'nin enformasyon kriteri bir karma dağılım modelinin.
See more

The list of books you might like

Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.