TrustRank ako faktor dôveryhodnosti stránky a jeho význam pri hodnotení spojení na stránke z hľadiska SEO otimalizácie
Prof. PhDr. Soňa Makulová, PhD. 1. február 2010 v kategórii SEO optimalizácia
Úvod
V januárovom čísle elektronického spravodaja sme v článku Text spojenia ako jeden z najdôležitejších faktorov SEO optimalizácie webového sídla hovorili o tom, že podľa názorov expertov patrí text spojenia k veľmi dôležitým faktorom SEO optimalizácie. O tom, že hypertextové spojenie je stále dôležitejším faktorom SEO optimalizácie sme už hovorili v článkoch Prečo pripisujú vyhľadávače veľkú hodnotu spojeniam na stránke a Význam odkazov z hubov a autorít pri posudzovaní dôležitosti webovej stránky. Odborník na SEO optimalizáciu Rand Fishkin (2009) v článku 17 Ways Search Engines Judge the Value of a Link rozoberá 17 faktorov, ktoré berú vyhľadávače pri hodnotení spojenia.
Patria k nim:
1. Interné verzus externé spojenia
2. Text kotvy odkazu
3. PageRank
4. TrustRank
5. Autorita domény
6. Rôznorodosť zdrojov
7. Jedinečnosť zdrojov
8. Umiestnenie na stránke
9. Tématická relevancia
10. Posúdenie obsahu a kontextu
11. Geografická lokácia
12. Použitie Rel="Nofollow"
13. Typ spojenia
14. Ďalšie ciele spojenia na zdrojovej stránke
15. Pokuty týkajúce sa domény a spojení na stránke
16. Spôsob tvorby obsahu a spojení
17. Historické a dočasné dáta
V dnešnom čísle spravodaja sa budeme venovať významu faktoru dôvery, ktorý sa v odbornej literatúre označuje ako TrustRank.
TrustRank alebo dôveryhodnosť webu
Vzhľadom na to, že na internete sa stále viac rozmáha spam, je dôležité oddeliť kvalitné webové sídla od sídiel nekvalitných. V súčasnosti existuje viacero algoritmov na vyhľadávanie a hodnotenie kvality informácií. V prostredí internetu patrí k najznámejším PageRank, ktorý sme si podrobne predstavili v článku Význam PageRanku ako patentovanej techniky Google a jeho vplyv pri posudzovaní dôležitosti webovej stránky. Zjednodušene môžeme povedať, že PageRank je hodnota, ktorú dá Google stránke a ktorá vychádza z počtu a typu spojení vedúcich na stránku. PageRank je obchodná značka spoločnosti Google a zároveň aj patent Stanfordskej univerzity. Podrobne je popísaný v ich článku The Anatomy of a Large-Scale Hypertextual Web Search Engine.
Mnohí majitelia webových sídiel sa snažia umelo zvyšovať ich hodnotu vzájomným odkazovaním a ďalšími dômyselnými technikami spamu. Jednou z odpovedí na tento problém je tzv. TrustRank, čo môžeme voľne preložiť aj ako meradlo dôveryhodnosti webového sídla. Algoritmus TrustRanku bol predstavený v práci autorov Gyongyiho, Garcia-Molina a Pedersena v roku 2004. Ako autori uvádzajú, aj keď experti dokážu identifikovať spam, je príliš finančné nákladné manuálne hodnotiť veľký počet webových sídiel. Preto navrhujú techniku, ktorá umožní oddeliť kvalitné webové sídla od spamu.
Prvým krokom je vyselektovať malý súbor vysokokvalitných webových sídiel tzv. „seeds”. Vytvoria ho experti a preto pri TrustRanku sa vyžaduje ľudský zásah. Tieto weby sú kvalitné, nezávislé, autoritatívne a v prípade, že odkážu na niektoré stránky, ide o ozajstnú kvalitu. Trust Rank teda distribuuje autoritatívne seed stránky, ktoré dávajú TrustRank ďalším webom, tie zase ďalším a pod. Výsledky ukazujú, že týmto spôsobom sa dá veľmi efektívne oddeliť spam na základe seedu o veľkosti 200 webových sídiel.
Koncept TrustRanku je založený na predpoklade, že dobré stránky málokedy odkazujú na zlé stránky a zlé stránky často odkazujú na dobré stránky v snahe zvýšiť si svoje skóre v hube.
Ako sa TrustRank prenáša
TrustRank je podobne ako PageRank odkazová analýza, takže TrustRank sa taktiež prenáša odkazmi. Základným rozdielom je, že v tomto prípade sa na začiatku vytipujú seeds (favorizované sídla), teda weby, ktoré sa manuálne overia a označia ako maximálne autoritatívne a dôveryhodné. Koncept TrustRanku vysveľuje názorne na nasledujúcom obrázku Rand Fishkin (2009 b).
Obr. Koncept TrustRanku (prevzaté z Rand Fishkin 2009 a)
Ako sa uvádza v odbornej literatúre, skutočne dôveryhodných webov je veľmi málo (cca 200) a predstavujú skutočnú kvalitu. Príkladom takéhoto webu môže byť napríklad vládna stránka Usability.gov, kde sa nenachádza žiaden spam a všetky informácie sú relevnantné a k téme. Weby, ktoré sú odkazované z najdôveryhodnejších webov, sú potom algoritmom vyhodnotené ako o úroveň nižšej dôveryhodnosti. Ďalším odkazom z týchto webov sa zase znižuje úroveň dôveryhodnosti a tak to pokračuje ďalej. Podľa odhadov aj horeuvedeného obrázku by rozloženie spamu v odkazovom grafe mohlo byť asi takéto:
Seed sídla (0% spamu) –> stránky na jeden klik od seeds (0,15% spamu) –> stránky na dva kliky (4% spamu) –> na tri kliky (14%) -> … –> čistý SPAM. Z horeuvedeného vyplýva, že čím je naša vzdialenosť v odkazovom grafe menšia od tzv. seeds, tým je aj náš TrustRank vyšší.
Prečo je dôležité mať vysoký TrustRank?
Odborníci na SEO optimalizáciu sa zhodujú, že dôveryhodnosť a autorita domény sa stáva jedným z najdôležitejších faktorov pri SEO optimalizácii. Veľmi pekne to demonštruje Rand Fishkin v svojom článku How Google's Rankings Algorithm Has Changed Over Time (2009 b) ako sa môžeme presvedčiť na nasledujúcom obrázku.
Obr. Ako sa menili faktory dôležitosti pri SEO optimalizácii v čase (prevzaté z Rand Fishkin 2009 b)
Podľa autora a myslím si, že s ním môžeme súhlasiť, dôveryhodnosť a autorita domény sa postupom času stáva stále dôležitejším faktorom pri SEO optimalizácii. Prelomovým dátumom bol november 2003 a Google Dance (prehodnocovanie indexu Google) pod názvom Florida update. Florida update znamenala doslova pohromu pre niektoré webové sídla. Mnohé z nich, ktoré boli po dlhý čas na vrchu výsledkov vo vyhľadávaní, jednoducho zmizli z výsledkov, pretože Google ale aj ďalšie vyhľadávače kladú stále väčší dôraz na dôveryhodnosť domény.
V budúcom čísle elektronického spravodaja si ukážeme, aký význam má pri posudzovaní dôležitosti spojenia autorita domény.
Záver
V dnešnom čísle elektronického spravodaja sme hovorili o význame dôveryhodnosti webového sídla, ktoré sa v odbornej literatúre označuje ako TrustRank. Podľa odborníkov patrí z dlhodobého hľadiska tento faktor k jedným z najdôležitejších faktorov SEO optimalizácie. Ďalšie informácie o TrustRanku webového sídla uvedieme v marcovom čísle elektronického spravodaja.
O tom, že pri posudzovaní relevancie stránky stále viac zohráva TrustRank faktor sme sa mohli presvedčiť aj pri poslednom prieskume Search Engine Ranking Factors 2009, kde sa jednotliví experti vyjadrovali, ktoré faktory pokladajú za najdôležitejšie pri radení záznamov na výstupe. Poradie jednotlivých faktorov bolo nasledovné:
1. Kľúčové slová v externých spojeniach na webové sídlo.
2. Externá popularita spojení (kvantita/kvalita externých spojení).
3. Rôznorodosť zdrojov, z ktorých vedú spojenia (spojenia z mnohých jedinečných domén).
4. Kľúčové slovo v Titule webového sídla.
5. Dôveryhodnosť domény založená na vzdialenosti spojenia od dôveryhodných domén (seeds), ako napríklad TrustRank, Domain mozTrust, etď.
Ako vidíme, na piatom mieste sa podľa názoru 72 expertov z celého sveta umiestnila dôveryhodnosť domény založená na vzdialenosti spojenia od dôveryhodných domén (seeds).
Literatúra
a) BRIN, Sergey - PAGE, Lawrence. 1998. The Anatomy of a Large-Scale Hypertextual Search Web Engine [online]. Standford : Standford University, 1998 [cit. 2010-01-08]. Dostupné na internete: http://infolab.stanford.edu/~backrub/google.html
b) Fishkin, Rand, (2009 a). 17 Ways Search Engines Judge the Value of a Link. In: SEOMOZ.org. The Web´s best SEO resources. 10th September 2009. [cit. 2010-01-03]. Dostupné na internete: http://www.seomoz.org/blog/17-ways-search-engines-judge-the-value-of-a-link
c) Fishkin, Rand, (2009 b). How Google's Rankings Algorithm Has Changed Over Time How Google's Rankings Algorithm Has Changed Over Time. In: SEOMOZ.org. The Web´s best SEO resources. 19th April 2009. [cit. 2010-01-10]. Dostupné na internete: http://www.seomoz.org/blog/how-googles-rankings-algorithm-has-changed-over-time
d) GYONGI, Z., MOLINA, H., G., PEDERSEN, J.: Combating Web Spam with TrusRank. Proceedings of the Thirtieth international conference on Very large data bases, Vol. 30 (2004) 576 - 587. [cit. 2010-01-10]. Dostupné na internete: http://www.vldb.org/conf/2004/RS15P3.PDF
e) Google Ranking Factors - SEO Checklist. [cit. 2010-01-03]. Dostupné na internete: http://www.vaughns-1-pagers.com/internet/google-ranking-factors.htm#positive-on
f) KENT, Peter. 2004. Search engine optimization for dummies. Indianapolis : Wiley Publishing, 2004. 384 s. ISBN 0-7645-6758-6.
g) MAKULOVÁ, Soňa. 2006. Analýza faktorov vplývajúcich na nájditeľnosť webových sídiel. In: Information Use in Information Society. International Conference. Bratislava, Slovakia, October 10-11, 2006. Bratislava : Centrum VTI SR, 2006, s. 109 – 118.
h) Search Engine Ranking Factors 2009 [online]. Seattle : SEOmoz. [cit. 2010-01-03]. Dostupné na internete: http://www.seomoz.org/article/search-ranking-factors
i) Stibůrek, Miroslav (2009). Optimalizujeme pro Google, díl III. – TrustRank a PageRank. In: Blog SEO-Profesionál.cz, 16. Únor, 2009 [online]. [cit. 2010-01-10]. Dostupné na internete: http://blog.seo-profesional.cz/optimalizujeme-pro-google-dil-iii-trustrank-a-pagerank/
Príspevok bol spracovaný v rámci grantovej úlohy KEGA 3/7275/09 Informačné štúdiá v podmienkach web 2.0 a nových technológií (INWENT)
Ďalšie články z kategórie SEO optimalizácia
Dôležitosť kontextu pri vyhľadávaní (Ako Google interpretuje vyhľadávacie dotazy a čo to znamená pre SEO optimalizáciu)
Úvod V súčasnosti patrí Google určite k najviac využívaným vyhľadávacím nástrojom internetu. Toho sú si vedomí aj vlastníci webových stránok a preto je ich snahou sa objaviť vo...
Asociácia a relevancia pri vyhľadávaní (Ako Google interpretuje vyhľadávacie dotazy a čo to znamená pre SEO optimalizáciu)
Úvod V súčasnosti patrí Google určite k najviac využívaným vyhľadávacím nástrojom internetu. Toho sú si vedomí aj vlastníci webových stránok a preto je ich snahou sa objaviť vo...