T.C. ANKARA ÜNĠVERSĠTESĠ SOSYAL BĠLĠMLER ENSTĠTÜSÜ BĠLGĠ VE BELGE YÖNETĠMĠ ANABĠLĠM DALI ARAMA MOTORLARINDA GÖRSELLERE ERĠġĠMDE DĠL SORUNU Yüksek Lisans Tezi Neslihan ER Ankara-2012 T.C. ANKARA ÜNĠVERSĠTESĠ SOSYAL BĠLĠMLER ENSTĠTÜSÜ BĠLGĠ VE BELGE YÖNETĠMĠ ANABĠLĠM DALI ARAMA MOTORLARINDA GÖRSELLERE ERĠġĠMDE DĠL SORUNU Yüksek Lisans Tezi Neslihan ER Tez DanıĢmanı Prof. Dr. Tülay FENERCĠ Ankara-2012 T.C. ANKARA ÜNĠVERSĠTESĠ SOSYAL BĠLĠMLER ENSTĠTÜSÜ BĠLGĠ VE BELGE YÖNETĠMĠ ANABĠLĠM DALI ARAMA MOTORLARINDA GÖRSELLERE ERĠġĠMDE DĠL SORUNU Yüksek Lisans Tezi Tez DanıĢmanı: Prof. Dr. Tülay FENERCĠ Tez Jürisi Üyeleri Adı ve Soyadı Ġmzası Prof. Dr. Sacit ARSLANTEKĠN (Jüri BaĢkanı) Yrd. Doç. Dr. Ümit KONYA Prof. Dr. Tülay FENERCĠ (DanıĢman) TÜRKĠYE CUMHURĠYETĠ ANKARA ÜNĠVERSĠTESĠ SOSYAL BĠLĠMLER ENSTĠTÜSÜ MÜDÜRLÜĞÜNE Bu belge ile bu tezdeki bütün bilgilerin akademik kurallara ve etik davranıĢ ilkelerine uygun olarak toplanıp sunulduğunu beyan ederim. Bu kural ve ilkelerin gereği olarak, çalıĢmada bana ait olmayan tüm veri, düĢünce ve sonuçları andığımı ve kaynağını gösterdiğimi ayrıca beyan ederim. (18/06/2012) Neslihan ER … Kılıç, kalkan, gürz ve at Tâ çocukluğumdan beri Ne buldumsa okudum Sonunda anladım ki Bir kitapta resim Ģart Cemal Süreya-Mardin1 ÖNSÖZ Web‟de bilgi hızlı bir biçimde katlanarak artmaktadır. Web yalnızca metinsel içerikli belgelere eriĢilen bir sistem olmaktan çıkıp görsel ve iĢitsel materyalin de bulunduğu zengin içerikli bir sistem olmuĢtur. Görsel materyal, insanlığın baĢlangıcından bu yana önemini artırarak varlığını sürdürmektedir. DeğiĢen ve geliĢen ortamlarda varlığını devam ettiren görsel materyal, günümüzde de etkin kullanılan bilgi kaynaklarındandır. Ġnsanlar, sayfalarca metin yerine tek bir resim ile iletmek istedikleri mesajı etkin bir Ģekilde alıcıya gönderebilmektedirler. Birçok disiplinde görsel, iletilen mesajı kuvvetlendirmede destekleyici materyal olarak kullanılabilmektedir. Görsel materyal, öğretimde, araĢtırmalarda etkin bir Ģekilde kullanılan önemli bilgi kaynağıdır. Web‟de dünyanın her bölgesinden birçok dilde ve birçok sayıda görsele eriĢim, arama motorları ile sağlanmaktadır. Görsellere, arama motorlarında yaygınlıkla, bağlı oldukları ya da nitelendikleri dildeki anahtar sözcüklere göre eriĢilebilmektedir. Dolayısıyla yabancı bir dilde üretilmiĢ ya da nitelenmiĢ bir görsele eriĢim Web‟de bilgiye eriĢimde önemli bir sorun teĢkil etmektedir. Bu çalıĢma ile görsellere arama motorları aracılığıyla eriĢimde dil engeli ortaya konularak ona dair çözüm önerileri sunulmaya çalıĢılmıĢtır. Lisans tezimden bu yana beni daima cesaretlendiren çok değerli hocam Prof. Dr. Tülay Fenerci‟ye, anlayıĢ ve desteklerinden dolayı değerli tez jürisi hocalarım Prof. Dr. Sacit Arslantekin‟e ve Yrd. Doç. Dr. Ümit Konya‟ya, doktora teziyle konuyu pekiĢtirmemi sağlayan değerli hocam Prof. Dr. G. Nazlı Alkan‟a, 1 C. Süreya. (2011). Sevda sözleri: Bütün şiirleri. Ġstanbul: Yapı Kredi Kültür Sanat Yayıncılık. i çalıĢmalarından yararlandığım bütün bilim insanlarına, özellikle çalıĢmaları sayesinde araĢtırmamı Ģekillendirdiğim Sayın Prof. Dr. YaĢar Tonta‟ya ve Sayın Dr. Ġrem Soydal‟a, araĢtırma sürecinde iletiĢimi koparmayarak desteklerini esirgemeyen dostlarıma, aileme ve doğaya sonsuz teĢekkürlerimle… ii ĠÇĠNDEKĠLER ÖNSÖZ ......................................................................................................................... i ĠÇĠNDEKĠLER ........................................................................................................... iii TABLO, GRAFĠK, ġEKĠL VE FORMÜL LĠSTESĠ .................................................. vi KISALTMALAR ........................................................................................................ ix I. BÖLÜM-GĠRĠġ ........................................................................................................ 1 I.1. Konunun Önemi ................................................................................................. 1 I.2. AraĢtırmanın Amacı ........................................................................................... 4 I.3. Kapsam ve Düzen .............................................................................................. 5 I.4. Problem ve Hipotez ........................................................................................... 6 I.5. ÇalıĢmanın Yöntemi ve Veri Toplama Teknikleri ............................................ 7 I.6. Kaynaklar ......................................................................................................... 10 I.7. Terminoloji ...................................................................................................... 14 II. BÖLÜM-ARAMA MOTORLARI ........................................................................ 16 II.1. Tanım ve Türleri ............................................................................................. 18 II.1.a. Robot ....................................................................................................... 18 II.1.b. Veritabanı ................................................................................................ 18 II.1.c. Arama Motoru Yazılımı .......................................................................... 18 II.1.1. Robot/Sorgu Tabanlı Arama Motorları (Robot-Driven/Query Based Search Engines) .................................................................................................. 20 II.1.2. Rehber Tabanlı Arama Motorları (Directory-Based Search Engines) .... 21 II.1.3. Melez Arama Motorları (Hybrid Search Engines) .................................. 21 II.1.4. Meta Arama Motorları (Meta-Search Engines) ....................................... 21 II.1.5. Özel Arama Motorları (Specialty Search Engines) ................................. 22 II.2. Değerlendirme Ölçütleri ................................................................................. 22 II.2.1. Kesin Ġsabet (Duyarlık), EriĢim Ġsabeti (Anma) ve Posa Oranları .......... 24 iii II.2.2. Diğer Değerlendirme Ölçütleri ................................................................ 29 II.3. Çapraz Dilde (Dil) Bilgi EriĢim (Cross Language Information Retrieval, CLIR)-Çok Dilde (Dilli) Bilgi EriĢim (Multilingual Information Retrieval, MLIR) ................................................................................................................................ 31 III. BÖLÜM-GÖRSEL MATERYAL ....................................................................... 38 III.1. Tanım ve Türleri ........................................................................................... 38 III.2. Eğitim ve AraĢtırma Açısından ĠĢlevleri ....................................................... 43 III.3. Görsellere EriĢim ve Dil Engeli .................................................................... 44 IV. BÖLÜM-ARAMA MOTORLARININ DĠL AÇISINDAN GÖRSELLERE ERĠġĠM PERFORMANSLARININ DEĞERLENDĠRĠLMESĠ ................................ 48 IV.1. Anket ............................................................................................................. 48 IV.2. Arama Motorları Performans Ölçümü (Dil Unsuru) .................................... 55 IV.2.1. Sınama Ġçin Kullanılacak Anahtar Sözcükler ........................................ 55 IV.2.2. Seçilen Arama Motorları ve Özellikleri ................................................. 55 IV.2.2.1. Google ............................................................................................. 56 IV.2.2. 2. Yahoo! ............................................................................................ 59 IV.2.2.3. Bing ................................................................................................. 60 IV.2.3. Sınama Ġçin Kullanılacak Diller............................................................. 63 IV.2.4. Sorgulama Formülasyonu ...................................................................... 63 IV.2.5. Sonuçların Ġlgililiği ................................................................................ 65 IV.2.6. Performans Ölçümü ............................................................................... 66 IV.2.7. Sonuçların Değerlendirilmesi ................................................................ 68 V. BÖLÜM-BULGULAR VE YORUM ................................................................... 69 V.1. Nicel Değerlendirme ...................................................................................... 69 V.1.1.Kesin Ġsabet Oranı .................................................................................... 69 V.1.2. Göreli EriĢim Ġsabeti Oranı ..................................................................... 75 V.1.3. Dilden Bağımsızlık Ölçümü .................................................................... 81 iv V.1.4. Kapsam (Sonuç) ...................................................................................... 87 V.2. Nitel Değerlendirme ....................................................................................... 92 VI. BÖLÜM-SONUÇ VE ÖNERĠLER ..................................................................... 95 KAYNAKÇA ........................................................................................................... 102 EKLER ..................................................................................................................... 117 Ek 1. Anket Soruları ............................................................................................. 117 Ek. 2. GörüĢme Sorusu ........................................................................................ 121 Ek 3. Sorgu Sonuçları Örnek Çizelgesi ............................................................... 122 Ek 4. Wordtracker Ġlk 500 Sorgu Listesi ............................................................. 123 ÖZET........................................................................................................................ 134 SUMMARY ............................................................................................................. 135 v TABLO, GRAFĠK, ġEKĠL VE FORMÜL LĠSTESĠ Grafik 1. Dermenin Bölümlere Ayrılması ................................................................ 25 Tablo 1. Arama/Sorgu Sonuçlarının Gösterildiği 2x2 Tablosu ................................. 25 Formül 1. Kesin Ġsabet Oranı .................................................................................... 26 Formül 2. EriĢim Ġsabeti Oranı ................................................................................. 26 Formül 3. Göreli EriĢim Ġsabeti Oranı ...................................................................... 27 Formül 4. Ortalama Kesin Ġsabet Oranı .................................................................... 28 Grafik 2. Web‟de Kullanılan Dillerin Dağılımı ........................................................ 31 Grafik 3. Görsel Bilgi Kaynaklarının Önem Derecesi .............................................. 50 Grafik 4. Görsellere EriĢimde Elektronik/Dijital Ortamda Tercih Edilen Bilgi EriĢim Sistemleri ................................................................................................................... 50 Grafik 5. Görsellere EriĢimde Kullanılan Arama Motorları ..................................... 51 Grafik 6. Akademisyenlerin Arama Motorlarında Görsel Ararken Kullandıkları Diller .......................................................................................................................... 51 Grafik 7. Arama Motorlarında Görsel Ararken Birden Fazla Dilde Anahtar Sözcük Kullanılması Durumunda Boolean ĠĢleçlerinin (Operatörlerinin) Kullanılma Oranı 52 Grafik 8. Arama Motorlarında Herhangi Bir Dilde Anahtar Sözcük Ġle Görsel Sorgulaması Yapıldığında Arama Motorunun Bu Sorguyu Barındırdığı Bütün Kaynakların Dilinde Yaparak Sonucu Getirmesini Ġsteme Oranı .............................. 53 Grafik 9. Akademisyenlerin Bilmedikleri Dillerdeki Anahtar Sözcükler Ġle Arama Motorlarında Yaptıkları Sorgular Sonucu Bulunan Görsellerin Anlamlılığı Oranı... 53 Grafik 10. Akademisyenlerin Bilmedikleri Dilde Yaptıkları Sorgular Sonucu Bulunan Görselleri Metinden Bağımsız Olarak Yorumlayabilme Oranı ................... 54 ġekil 1. Google GeliĢmiĢ Görsel Arama Arayüzü ..................................................... 57 ġekil 2. Google‟da Yapılan Görsel Arama Sonucu ................................................... 58 ġekil 3. Yahoo! Görsel Aramada Örnek Sorgulama .................................................. 60 ġekil 4. Bing Görsel Aramada Örnek Sorgulama ...................................................... 61 Tablo 2. Arama Motorlarının Her Birimde Sundukları Özellikler ............................ 65 Tablo 3. Anahtar Sözcük Tablosu ............................................................................ 69 Tablo 4. Google‟da Yapılan Sorguların Dillere Göre Kesin Ġsabet Oranları (10 ve 20 Kesme Noktaları) ....................................................................................................... 70 vi
Description: