Google calışanları tarafından site incelenmesi ve spam kontrolu
Google webmaster’dan herhangi bir site hakkinda bir sikayet geldiginde ya da herhangi bir arama teriminde Google’in kendi algoritmasi tarafindan alakali siteler yerine spam siteleri ciktigi gibi durumlar tepsit edildiginde bu tip incelemeler Google Spam blumune bagli bir sisteme siralanirlar. Kalite tespiti ile ilgili gorevde bulunan kisiler gelen sikayetleri incelerler ve bunu EWOQ ismi verilen bir sistemden yaparlar. Bu sistem calisanlarin gmail hesabi ile girebildigi ve kendilerine yonlendirilmis incelenmesi gereken siteleri siniflandirdiklari bir arayuzdur. Ayni sekilde Google Labs'in bir suredir yonettigi insan katkisi ile algo degisikliklerini test etmek icin kurulan evaluation projesi ([SEO Turk forumlarında bulunan linkleri görebilmek için üyelik gerekmektedir. ]) bu asagida anlatilan sekilde websitelerini test etmektedir. Eval projesinde part-time ya da evden calisan universite ogrencileri ya da basvuruda daha onceden blunmus kimseler kullanilmaktadir.
EWOQ uzerinde verilen URL’yi arama terimleri ile karsilastirip URL’nin arama terimi ile alakali olup olmadiklari hakkinda bir bolum, zararli icerik ya da por** site olup olmadigi hakkinda isaretleme opsiyonu ve de spam incelemesi bolumu vardir.
Arama terimi ile sitenin iliskisini siniflandirken vital, useful, relevant, not relevant, off-topic gibi siniflara ayirmak mumkundur. Arama terimi turleri, aramanin nereden yapildigi ve hangi dile hitap ettigi gibi faktorler goz onune alinarak bu siniflardan birinin secilmesi istenir. Vital sitenin tam anlamiyla aramaya uygun oldugu anlamina gelir. Mesela fenerbahce’nin kendi sitesi fenerbahce aramasi icin vital sinifina girer. Fakat, Fenerbahce icin acilmis ama klube ait olmayan siteler bu sinifa girmez. Buradan asagi dogru siniflandirma yapilir. Her terim icinde vital sinifi olmayacaktir. Mesela “kadin dogum” diye bir arama yapilirsa bu terim icin vital sinifina giricek bir site olamaz cunku bu terim kimseye ait diildir. Kimseye ait olmayan terimler genis terim, belirli markalara ya da site ile aranan terimin tam uyucagi sekilde olan sitelere dar arama adi verilir. Bu yuzden marka sahibi siteler bu sekilde siniflandirildiginda dar aramalarda o sitenin onune gecmek neredeyse imkansizdir.
Hub ve otorite siteler icerisinde acilmis sayfalarda genelde iceriginde bulunan terimler icin useful ve relevant kategorisine duserler. Unutulmamasi gereken bir sayfa iceriginde ki ya da kendi gelen linkler icerisinde yazan her kelime icin “relevant” yani alakalidir. Ama alakanin ne derece oldugunun siniflandirilmasi gerekir. Bu siniflarda bu alakanin derecesini olcebilmek icin yaratilmislardir.
Non-relevant yani alaksiz sayfalar arama terimini icersede herhangi bir bolgeye yonelik yapilmis, cok genis ya da cok dar bilgi sunan sayfalar olabilirler. Bu durumlarda arama sonuclarinda sayfa gerilere atilicaktir.
Off-topic sayfalar ise icerisinde aranan terimler gecmesi ragmen arama ile alakasiz sayfalardir. Mesela “Ankara ilkokullar” aratildiginda Istanbul ilkokullar ile ilgili bir sayfa cikarsa ve dokuman icerisinde Ankara kelimesi geciyorsa bu duruma ragmen bu sayfa aslinda arama sonucu ile iyi bir eslesme diildir.
Spam konusunda ise bir URL incelenirken spam, spam diil ya da belki spam seklinde 3 adet opsiyon sunulur. URL’ler genelde birden cok kisi tarafindan siniflandirilir ve verilen degerler birbirinden cok farkliysa incelenmeye devam edilir.
Webspam sadece gizli kelimeler ya da cloaking gibi arama motorlarini direk olarak aldatmaya yonelik seyler diil ama kopya icerik ile PPC geliri saglamaya calismak, affiliate linkler, zamani bitmis domainleri register edip bunlardan gelir saglamaya calismak gibi birbirinde farkli ve arama sonuclarini kullanarak ticari gelir saglamaya calisan siteleride hedefler. Kopya icerikde bir otoriteye bagli olan ya da olmayan bilgilergibi siniflandirilabilir. Mesela muzik notalari ya da atasozleri gibi seyler belirli bir yere bagli diildir ve kullanilabilir. Fakat bu tip kopya icerikler sayfada olmadigi zaman eger geriye sadece reklamlar kaliyorsa sayfa spam olarak isaretlenir. Icerigin karisik oldugu durumlarda durum farkli olarak adlandirilabilinir.
Framaler, kandirmaya yonelik yonlendirmeler, gizli yazilar gibi bilinen yontemlerde spam olarak isaretlenicektir.
Spam olarak isaretlenen sayfalar daha sonra bulunamasa bile bu sekilde isaretli kalir. Bir site ustunde ugrasiyorsaniz, sitenin tum icerigini korumak ve bu sekilde seylerde kacinmak gerekir. Mesela ozgun icerik eklenen bir siteye sahibi belli kopya icerikleri (mesela gazete haberlerinden kopyalar) eklemek sitenin buyuk bir kisminin spam olarak isaretlenmesine sebep olucaktir.
Bu sekilde testler sayesinde hem siralamalara karisan spam siteler bulunmakta hemde algoritma'nin ne sekilde daha iyi calistigi test edilmektedir.
__________________
SEO TURK *CO*ADMIN*
http://www.seoturk.com
Konu Hakan tarafından (3. Temmuz 2008 Saat 20:20:50 ) değiştirilmiştir..