Kako web pretraživači funkcionišu – Pretraga
Zadatak pretrage je da što efikasnije vrati što kvalitetniji rezultat. Efikasnost se meri brzinom koja protekne od klika na dugme do pojave rezultata, a kvalitet se meri sa brojem rezultata (stranica) koje pretraživač vrati i njihovom relevantnošću. Za brzinu zadužen je proces indeksiranja i algoritmi koji sortiraju podatke prilikom parsiranja. Broj rezultata zavisi od broja indeksiranih stranica, odnosno broja stranica koje Web spajder pretraživača poseti i preuzme u bazu. Relevantnost predstavlja povezanosti sadržaja sajta sa traženim pojmom i zavisi od kvaliteta algoritama koje pretraživač koristi.
Proces pretrage počinje dolaskom korisnika na stranicu web pretraživača i unošenjem faze. Klikom na dugme pretraga (Eng. Search) fraza se prosleđuje do parsera koji parsira frazu. Izbacuju se one reči koje se nalaze na stop listi a sve ostale proveravaju da li postoje u Lexicon-u. Ukoliko fraza nije pronađena u Lexicon tabeli korisnik dobija poruku da ne postoji ni jedan dokument koji sadrži traženu frazu. U suprotnom za svaku reč iz fraze dobija se Id pod kojom je ta reč snimljena u Lexicon tabeli.
Nakon dobijanja identifikatora za reči koje se nalaze u frazi izvršava se upit nad inverted index tabelom koji vraća sve dokumente koji ih sadrže. Ovde se proces pretrage završava za one pretraživače koji se ne bave relevantnošću rezultata. Za sve ostale sledeći korak je upravo ono što razlikuje dobre od loših – rangiranje rezultata.
Rangiranje rezultata predstavlja proces sortiranja na osnovu relevantnosti. Najpre se za svaki od dokumenata koji sadrži tražene reči broji broj pojavljivanja fraze na istom. Zatim za svako pojavljivanje reči gleda se pozicija u dokumentu (naslov, anchor, URL, H1,H2,H3 tag…) i da li je ta reč posebno naglašena (podebljana, zakrivljena, podvučena). Svaka od pozicija i naglašavanje reči nosi određeni težinski faktor. Sabiranjem težinskih faktora svih pojavljivanja dobija se samo delić vrednosti po kojoj se posle dokumenti sortiraju. Ostali faktori relevantnosti zavise od samog web pretraživača.
Nakon završenog sortiranja dokumenata (svih onih koji sadrže unetu frazu) po relevantnosti web pretraživač korisnika prebacuje na novu stranicu na kojoj se nalaze izlistani sortirani linkovi ka dokumentima.
U nekom od nastavak moćiće te da pročitate o specifičnim faktorima za svaki od 3 trenutno najpopularnije web pretraživača: Google, Yahoo, Live.
Podijeli ovaj članak s prijateljima!






Mi smo grupa entuzijasta, znalaca i intelektualaca koji vam žele pružiti samo kvalitetne i zanimljive informacije iz svijeta internet marketinga.