9.10.2008

ARAMA MOTORLARININ ÇALIŞMA MANTIĞI

Arama motorları'nın çalışma mantığına girmeden önce şunu belirtmek istiyorum ki bazı şirketlerin bir web sitesini google veya başka bir arama moturana kayıt yaptırmak için 100$ -150$ civarında ücret aldıklarını duydum ve çok şaşırdım. Bilindiği gibi arama motorları site barındırmak için herhangi bir ücret talep etmiyorlar.

Bilindiği gibi artık arama motorlarına kayıtlı olmayan veya iyi kaydedilemeyen bir web sitesinin pek bir önemi yoktur. Site sahibinden başka kimse siteyi ziyaret etmez. Onun için daha sitemizi yaparken arama motoruna nasıl ekleyeceğimiz düşünmeliyiz ve ona göre sitemizin yapısını oluşturmalıyız.

 Bazı durumlarda sitenin dizaynından çok o sitede kullanılan kelimelerin düzenliliği ve mantıklı yerlerde kullanılması daha etkilidir .O sitenin daha çok hit almasını sağlar.
Bundan dolayı site hazırlamadan önce arama motorlarının çalışma mantığınıda öğrenmek gerekmektedir ve bu iş bence çok önemlidir.

Arama motorları Netscape firmasının oluşturduğu Dmoz .org adlı veri tabanına erişim yaparak sonuç elde etmektedirler. http://dmoz.org/ adresine girdiğinizde aradığınız kelimeyi yazıp aramanızı daha geniş bir ortamda yapabilirsiniz.Toplam 4.660.955 site veritabanı 68,453 editor bulunmaktadır. Site kayıtları , editörler tarafından yapılmaktadır. Editör olmak ücretsiz ve herkese açıktır.

Tüm arama motorları google un algoritmasını kullanmaktadır. Bu arada google un arama algoritmasının yeryüzündeki en sağlam ve en iyi algoritma topluluğunun olduğu söyleniyor.Aksi halde bünyesinde 8.000.000 civarında web sitesi adresleyen google'un çok kısa sürede sonuç elde etmesi mümkün görünmüyor.

Veri tabanına eklenecek siteyi doğru kategoriye eklemek büyük önem taşımaktadır.Arama motorları sitelerdeki bilgileri dinamik olarak veri tabanında update etmelidir.(Bu olmazsa arama motorunun varlığından bahsedemeyiz)

Arama Motorları bu update işlemini yapmak için Dmoz.org veritabanında kayıtlı tüm domainleri SPIDER programı ile gezerek belli kriterlere göre (Spider programının kriterlerine göre ) sitedeki sayfaların(.html,.aspx)bir özetini çıkararak bu özet bilgilerini "cache" yerleştirerek kendini dinamik hale getiriyor.Arama isteği geldiğinde bu cache deki bilgiler üzerinde arama yapmaktadır. Cache alınan her sayfanın özeti 25K büyüklüğündedir. Buradan da Google 'un çok kısa bir sürede arama yapmasının nasıl gerçekleştiğini birazcık anlayabiliriz.

SPIDER , programı söylediğimiz gibi html sayfalarını belli kriterlere göre özetliyor ve siteyi gezerken sitedeki linkleri takip ederek ilerliyor.Sitenizin içerisindeki linklere göre iki türlü inceleme yapıyor. İleri ve Geri linkler.

İleri linkleri takip ederken ,kendi veritabanında(Dmoz.org) kayıtlı domain ise doğrulama yaparak ilerliyor.Geri linkleri takip ederken , kısır döngüye düşmemek için , iki site arasında karşılaştırma yapıyor ve sonucu bir olarak alıyor.Büyük site kazanır diyor ve çıkıyor.

0 – 0 = 0
1 – 0 = 0
1 – 1 = 1

Büyük siteler,küçük sitelerden beslenir. En çok link verilen site ,en büyük olur. Bu açıdan diğer domainlerin linklerini sitenize koyarken ,o sitelerin büyüklükleri sizinkinden küçük olmalı.
Sitenizdeki sayfa çokluğu arama motorları için daha çok indekslenecek sayfa demektir bu da sitenizin görüntülenmesi için pozitif bir özelliktir.

Eğer dinamik bir siteniz varsa ve siteniz somut olarak 5-6 sayfadan oluşuyorsa ama çalıştırdığınızda dinamik olarak sanal sayfalar oluşturuyorsa , SPIDER genellikle bu sayfaları yakalayamaz. SPIDER düz sayfaları alır. (.html .php .asp vs..)
Sorgulu sayfalar SPIDER için çoğu zaman kısır döngü olduğu için Arama motorları teknik olarak bu sayfaları CACHE 'e alamazlar.

Arama yapılıyor ve birden çok siteden sonuç alınıyor .Hangi sitenin ilk 10 da gösterileceğine nasıl karar veriliyor. Arama sonuçları arama kelimesini esas alarak cache ler üzerindeki incelemeler olarak değerlendiriliyor.Belli kriterlere göre sıralama yapılıyor.

SİTE EKLEMEDE BAZI ÖNEMLİ İPUÇLARI


Aranan kelime mutlaka sitede yer almalıdır.

Aranan kelimenin sitede kaç defa tekrar edildiği önemlidir.
Not : Sitedeki sayfada 20den fazla kelime tekrarı SPAM olarak kabul edilebilir ve siteniz sürekli olarak arama motorları kayıtlarından çıkartılabilir.

Eğer sitenizde link vermiş başka siteler çok ise öncelik sırası sizin sitenize geçer.

Ayrıca sitenin başlığıda önemlidir. Örneğin iki Pcsatış sitesi düşünelim .Bizde notebook kelimesi arattırmak isteyelim.Başlığında (title) Notebook yazan site öncelik kazanır

Sitenizin her sayfasına ayrı ayrı Title ve Description koymak indekslenme ve bulunma açısından büyük önem taşımaktadır.

Arama motorlarında yaptığınız bir arama genellikle binlerce ya da milyonlarca sonuç getirir. Çoğunlukla ilk sayfada sadece ilk 10 uygun sonuç görüntülenir.

Genellikle web sitesi olan herkes ilk 10'da görünmek ister. Arama sonucunda büyük ihtimalle aradığını ilk 10'da bulacak olan kişi 11 ya da daha sonra listelendiyseniz size hiç ulaşmadan aramasını sonlandırabilecektir.

Anahtar kelimelerinizi iyi seçmelisiniz. Mesela pc satış siteniz varsa anahtar kelimelerinize pc ,bilgisayar,notebook,satis,satış,online,taksit,..gibi stratejik anahtar kelimeler eklemelisiniz.Yani arama motoru üzerinde arama yapacak kişinin yerine kendinizi koyup iyice düşünmelisiniz.

Site dizaynında tablo kullanıyorsanız arama motorları sitenizi sizin gördüğünüz gibi görmeyebilir. Örneğin sağ tarafta bir menünüz varsa ve siz bunun yanına ilk paragrafı yazmışsanız ve bunları bir tablo içine almışsanız sizin normal olarak beklentiniz önce ilk paragrafınızı görmesidir. Ama arama motorları sitenizi en eski browserla ziyaret eden bir ziyaretçi gibidir. Bu yüzden de büyük bir ihtimalle sağda bulunan menüyü önce, ilk paragrafı ise sonra görüntüler ve bu da sizin ilk paragrafa yazdığınız hedef kelimelerinizin sayfanın daha altına düşmesine neden olur. Böyle bir dizaynla bunu çözmenin herhangi bir yolu yoktur. Ama bu sebepten tablo kullanmayı asla bırakmayın çünkü tablolar site dizaynının en önemli elementidirler. Aynı etkiyi javascriptler de yapar. Bu yüzden mümkün mertebe javascript kullanacaksanız bunları sayfanın altlarında kullanın.

Sayfanızın link verme yapısıda önemlidir.Sizden büyük olduğuna inandığınız sitelerin linklerini barındırmayın.

Anahtar kelimeyi belirledikten sonra bu kelimenin sitenizde ki yerine önem vermelisiniz.Size göre en önemli kelimeleri html sayfanızın başlığına koymalısınız. eğer mümkünse ilk birkaç paragrafta da kullanın.

Arama motorları flash dosyalarını 12 framset maksimum 100K olarak belirlemiştir ve sadece bu kritere uyan animasyonları CACHE ler.

Sitenizdeki imaj isimleri , Arama motorları tarafından aynı mantıkla imaj bankalarına kaydedilir.Bu açıdan imaj isimleri önemlidir.

Zemin rengi ile aynı renkte olan kelimeler CACHE lenir.(Sitenize bağlanan kişilerin IP adreslerini zemin renginizle aynı renkte alırsanız sitenize karşı saldırıları gözlemleyebilirsiniz.IP adresinin alındığını site kullanıcısı farkına varmaz.)

Resimlerdeki ALT Tekst 'ler text olarak CACHE lerir.Maksimum uzunluk 255 karakterdir.
Site Title'ları maksimum 255 karakter olarak CACHE lenir.
Genel olarak dinamik bir site yapıyorsanız , olması gereken yerler haricindeki bölümlerin HTML yapılması önemlidir.

FLASH yada GRAFİK ağırlıklı siteler arama motorları tekniklerine ters oldukları için arama motorları tarafından bir getirisi olmayan sitelerdir.
Yahoo ,Google 'ın arama motoru tekniğini kullanmaktan önümüzdeki dönemde vazgeçecek ve kendi sisteminini uygulamaya başlayacak.Büyük bir ihtimallede Yahoo source edilen sayfalarıda CACHE eden bir sistem geliştiriyor. (makale.php?makale=1 gibi.)

http://www.koubm.org/ 'dan alıntıdır. İstifadenize sunmak istedim..

Hiç yorum yok:

Yorum Gönder