Table Of ContentT.C.
ANKARA ÜNĠVERSĠTESĠ
SOSYAL BĠLĠMLER ENSTĠTÜSÜ
BĠLGĠ VE BELGE YÖNETĠMĠ
ANABĠLĠM DALI
ARAMA MOTORLARINDA GÖRSELLERE ERĠġĠMDE
DĠL SORUNU
Yüksek Lisans Tezi
Neslihan ER
Ankara-2012
T.C.
ANKARA ÜNĠVERSĠTESĠ
SOSYAL BĠLĠMLER ENSTĠTÜSÜ
BĠLGĠ VE BELGE YÖNETĠMĠ
ANABĠLĠM DALI
ARAMA MOTORLARINDA GÖRSELLERE ERĠġĠMDE
DĠL SORUNU
Yüksek Lisans Tezi
Neslihan ER
Tez DanıĢmanı
Prof. Dr. Tülay FENERCĠ
Ankara-2012
T.C.
ANKARA ÜNĠVERSĠTESĠ
SOSYAL BĠLĠMLER ENSTĠTÜSÜ
BĠLGĠ VE BELGE YÖNETĠMĠ
ANABĠLĠM DALI
ARAMA MOTORLARINDA GÖRSELLERE ERĠġĠMDE
DĠL SORUNU
Yüksek Lisans Tezi
Tez DanıĢmanı: Prof. Dr. Tülay FENERCĠ
Tez Jürisi Üyeleri
Adı ve Soyadı Ġmzası
Prof. Dr. Sacit ARSLANTEKĠN (Jüri BaĢkanı)
Yrd. Doç. Dr. Ümit KONYA
Prof. Dr. Tülay FENERCĠ (DanıĢman)
TÜRKĠYE CUMHURĠYETĠ
ANKARA ÜNĠVERSĠTESĠ
SOSYAL BĠLĠMLER ENSTĠTÜSÜ MÜDÜRLÜĞÜNE
Bu belge ile bu tezdeki bütün bilgilerin akademik kurallara ve etik davranıĢ
ilkelerine uygun olarak toplanıp sunulduğunu beyan ederim.
Bu kural ve ilkelerin gereği olarak, çalıĢmada bana ait olmayan tüm veri,
düĢünce ve sonuçları andığımı ve kaynağını gösterdiğimi ayrıca beyan ederim.
(18/06/2012)
Neslihan ER
…
Kılıç, kalkan, gürz ve at
Tâ çocukluğumdan beri
Ne buldumsa okudum
Sonunda anladım ki
Bir kitapta resim Ģart
Cemal Süreya-Mardin1
ÖNSÖZ
Web‟de bilgi hızlı bir biçimde katlanarak artmaktadır. Web yalnızca metinsel
içerikli belgelere eriĢilen bir sistem olmaktan çıkıp görsel ve iĢitsel materyalin de
bulunduğu zengin içerikli bir sistem olmuĢtur.
Görsel materyal, insanlığın baĢlangıcından bu yana önemini artırarak
varlığını sürdürmektedir. DeğiĢen ve geliĢen ortamlarda varlığını devam ettiren
görsel materyal, günümüzde de etkin kullanılan bilgi kaynaklarındandır. Ġnsanlar,
sayfalarca metin yerine tek bir resim ile iletmek istedikleri mesajı etkin bir Ģekilde
alıcıya gönderebilmektedirler. Birçok disiplinde görsel, iletilen mesajı
kuvvetlendirmede destekleyici materyal olarak kullanılabilmektedir. Görsel
materyal, öğretimde, araĢtırmalarda etkin bir Ģekilde kullanılan önemli bilgi
kaynağıdır.
Web‟de dünyanın her bölgesinden birçok dilde ve birçok sayıda görsele
eriĢim, arama motorları ile sağlanmaktadır. Görsellere, arama motorlarında
yaygınlıkla, bağlı oldukları ya da nitelendikleri dildeki anahtar sözcüklere göre
eriĢilebilmektedir. Dolayısıyla yabancı bir dilde üretilmiĢ ya da nitelenmiĢ bir görsele
eriĢim Web‟de bilgiye eriĢimde önemli bir sorun teĢkil etmektedir. Bu çalıĢma ile
görsellere arama motorları aracılığıyla eriĢimde dil engeli ortaya konularak ona dair
çözüm önerileri sunulmaya çalıĢılmıĢtır.
Lisans tezimden bu yana beni daima cesaretlendiren çok değerli hocam Prof.
Dr. Tülay Fenerci‟ye, anlayıĢ ve desteklerinden dolayı değerli tez jürisi hocalarım
Prof. Dr. Sacit Arslantekin‟e ve Yrd. Doç. Dr. Ümit Konya‟ya, doktora teziyle
konuyu pekiĢtirmemi sağlayan değerli hocam Prof. Dr. G. Nazlı Alkan‟a,
1 C. Süreya. (2011). Sevda sözleri: Bütün şiirleri. Ġstanbul: Yapı Kredi Kültür Sanat Yayıncılık.
i
çalıĢmalarından yararlandığım bütün bilim insanlarına, özellikle çalıĢmaları
sayesinde araĢtırmamı Ģekillendirdiğim Sayın Prof. Dr. YaĢar Tonta‟ya ve Sayın Dr.
Ġrem Soydal‟a, araĢtırma sürecinde iletiĢimi koparmayarak desteklerini esirgemeyen
dostlarıma, aileme ve doğaya sonsuz teĢekkürlerimle…
ii
ĠÇĠNDEKĠLER
ÖNSÖZ ......................................................................................................................... i
ĠÇĠNDEKĠLER ........................................................................................................... iii
TABLO, GRAFĠK, ġEKĠL VE FORMÜL LĠSTESĠ .................................................. vi
KISALTMALAR ........................................................................................................ ix
I. BÖLÜM-GĠRĠġ ........................................................................................................ 1
I.1. Konunun Önemi ................................................................................................. 1
I.2. AraĢtırmanın Amacı ........................................................................................... 4
I.3. Kapsam ve Düzen .............................................................................................. 5
I.4. Problem ve Hipotez ........................................................................................... 6
I.5. ÇalıĢmanın Yöntemi ve Veri Toplama Teknikleri ............................................ 7
I.6. Kaynaklar ......................................................................................................... 10
I.7. Terminoloji ...................................................................................................... 14
II. BÖLÜM-ARAMA MOTORLARI ........................................................................ 16
II.1. Tanım ve Türleri ............................................................................................. 18
II.1.a. Robot ....................................................................................................... 18
II.1.b. Veritabanı ................................................................................................ 18
II.1.c. Arama Motoru Yazılımı .......................................................................... 18
II.1.1. Robot/Sorgu Tabanlı Arama Motorları (Robot-Driven/Query Based
Search Engines) .................................................................................................. 20
II.1.2. Rehber Tabanlı Arama Motorları (Directory-Based Search Engines) .... 21
II.1.3. Melez Arama Motorları (Hybrid Search Engines) .................................. 21
II.1.4. Meta Arama Motorları (Meta-Search Engines) ....................................... 21
II.1.5. Özel Arama Motorları (Specialty Search Engines) ................................. 22
II.2. Değerlendirme Ölçütleri ................................................................................. 22
II.2.1. Kesin Ġsabet (Duyarlık), EriĢim Ġsabeti (Anma) ve Posa Oranları .......... 24
iii
II.2.2. Diğer Değerlendirme Ölçütleri ................................................................ 29
II.3. Çapraz Dilde (Dil) Bilgi EriĢim (Cross Language Information Retrieval,
CLIR)-Çok Dilde (Dilli) Bilgi EriĢim (Multilingual Information Retrieval, MLIR)
................................................................................................................................ 31
III. BÖLÜM-GÖRSEL MATERYAL ....................................................................... 38
III.1. Tanım ve Türleri ........................................................................................... 38
III.2. Eğitim ve AraĢtırma Açısından ĠĢlevleri ....................................................... 43
III.3. Görsellere EriĢim ve Dil Engeli .................................................................... 44
IV. BÖLÜM-ARAMA MOTORLARININ DĠL AÇISINDAN GÖRSELLERE
ERĠġĠM PERFORMANSLARININ DEĞERLENDĠRĠLMESĠ ................................ 48
IV.1. Anket ............................................................................................................. 48
IV.2. Arama Motorları Performans Ölçümü (Dil Unsuru) .................................... 55
IV.2.1. Sınama Ġçin Kullanılacak Anahtar Sözcükler ........................................ 55
IV.2.2. Seçilen Arama Motorları ve Özellikleri ................................................. 55
IV.2.2.1. Google ............................................................................................. 56
IV.2.2. 2. Yahoo! ............................................................................................ 59
IV.2.2.3. Bing ................................................................................................. 60
IV.2.3. Sınama Ġçin Kullanılacak Diller............................................................. 63
IV.2.4. Sorgulama Formülasyonu ...................................................................... 63
IV.2.5. Sonuçların Ġlgililiği ................................................................................ 65
IV.2.6. Performans Ölçümü ............................................................................... 66
IV.2.7. Sonuçların Değerlendirilmesi ................................................................ 68
V. BÖLÜM-BULGULAR VE YORUM ................................................................... 69
V.1. Nicel Değerlendirme ...................................................................................... 69
V.1.1.Kesin Ġsabet Oranı .................................................................................... 69
V.1.2. Göreli EriĢim Ġsabeti Oranı ..................................................................... 75
V.1.3. Dilden Bağımsızlık Ölçümü .................................................................... 81
iv
V.1.4. Kapsam (Sonuç) ...................................................................................... 87
V.2. Nitel Değerlendirme ....................................................................................... 92
VI. BÖLÜM-SONUÇ VE ÖNERĠLER ..................................................................... 95
KAYNAKÇA ........................................................................................................... 102
EKLER ..................................................................................................................... 117
Ek 1. Anket Soruları ............................................................................................. 117
Ek. 2. GörüĢme Sorusu ........................................................................................ 121
Ek 3. Sorgu Sonuçları Örnek Çizelgesi ............................................................... 122
Ek 4. Wordtracker Ġlk 500 Sorgu Listesi ............................................................. 123
ÖZET........................................................................................................................ 134
SUMMARY ............................................................................................................. 135
v
TABLO, GRAFĠK, ġEKĠL VE FORMÜL LĠSTESĠ
Grafik 1. Dermenin Bölümlere Ayrılması ................................................................ 25
Tablo 1. Arama/Sorgu Sonuçlarının Gösterildiği 2x2 Tablosu ................................. 25
Formül 1. Kesin Ġsabet Oranı .................................................................................... 26
Formül 2. EriĢim Ġsabeti Oranı ................................................................................. 26
Formül 3. Göreli EriĢim Ġsabeti Oranı ...................................................................... 27
Formül 4. Ortalama Kesin Ġsabet Oranı .................................................................... 28
Grafik 2. Web‟de Kullanılan Dillerin Dağılımı ........................................................ 31
Grafik 3. Görsel Bilgi Kaynaklarının Önem Derecesi .............................................. 50
Grafik 4. Görsellere EriĢimde Elektronik/Dijital Ortamda Tercih Edilen Bilgi EriĢim
Sistemleri ................................................................................................................... 50
Grafik 5. Görsellere EriĢimde Kullanılan Arama Motorları ..................................... 51
Grafik 6. Akademisyenlerin Arama Motorlarında Görsel Ararken Kullandıkları
Diller .......................................................................................................................... 51
Grafik 7. Arama Motorlarında Görsel Ararken Birden Fazla Dilde Anahtar Sözcük
Kullanılması Durumunda Boolean ĠĢleçlerinin (Operatörlerinin) Kullanılma Oranı 52
Grafik 8. Arama Motorlarında Herhangi Bir Dilde Anahtar Sözcük Ġle Görsel
Sorgulaması Yapıldığında Arama Motorunun Bu Sorguyu Barındırdığı Bütün
Kaynakların Dilinde Yaparak Sonucu Getirmesini Ġsteme Oranı .............................. 53
Grafik 9. Akademisyenlerin Bilmedikleri Dillerdeki Anahtar Sözcükler Ġle Arama
Motorlarında Yaptıkları Sorgular Sonucu Bulunan Görsellerin Anlamlılığı Oranı... 53
Grafik 10. Akademisyenlerin Bilmedikleri Dilde Yaptıkları Sorgular Sonucu
Bulunan Görselleri Metinden Bağımsız Olarak Yorumlayabilme Oranı ................... 54
ġekil 1. Google GeliĢmiĢ Görsel Arama Arayüzü ..................................................... 57
ġekil 2. Google‟da Yapılan Görsel Arama Sonucu ................................................... 58
ġekil 3. Yahoo! Görsel Aramada Örnek Sorgulama .................................................. 60
ġekil 4. Bing Görsel Aramada Örnek Sorgulama ...................................................... 61
Tablo 2. Arama Motorlarının Her Birimde Sundukları Özellikler ............................ 65
Tablo 3. Anahtar Sözcük Tablosu ............................................................................ 69
Tablo 4. Google‟da Yapılan Sorguların Dillere Göre Kesin Ġsabet Oranları (10 ve 20
Kesme Noktaları) ....................................................................................................... 70
vi
Description:1 C. Süreya. (2011). Sevda sözleri: Bütün şiirleri. Ġstanbul: Yapı Kredi Kültür Sanat Yayıncılık. 166 staples. 26968. 167 ask. 26735. 168 twitter. 26700. 169 barbecue tips and techniques. 26471. 170 qvc. 26468. 171 bp oil spill. 26431. 172 music. 26422. 173 ovguide. 26415. 174 justin b