Kaj je iskalnik, kako deluje?

18. 5. 2019

V zadnjih letih so storitve Googla in Yandexa trdno vstopile v naša življenja. V zvezi s tem, mnogi verjetno sprašujem, kaj iskalnik? Preprosto povedano, to je programski sistem, ki je namenjen iskanju informacij na svetovnem spletu. Njeni rezultati so ponavadi predstavljeni v obliki seznama, ki se pogosto imenuje strani z rezultati iskanja (SERP). Informacije so lahko kombinacija spletnih strani, slik in drugih vrst datotek. Nekateri iskalniki vsebujejo tudi informacije, ki so na voljo v podatkovnih bazah ali odprtih imenikih.

kaj je iskalnik

Za razliko od spletnih imenikov, ki jih podpirajo samo njihovi lastni urejevalniki, iskalniki vsebujejo tudi informacije v realnem času, pri katerih algoritem deluje na spletnem iskalniku.

Zgodovina

Iskalniki so se pojavili pred svetovnim spletom - decembra 1990. Prva taka storitev se je imenovala Archie in iskal je ukaze o vsebini FTP datotek.

Kaj je iskalnik na internetu? Do septembra 1993 je bil svetovni splet popolnoma ročno indeksiran. Obstaja seznam spletnih strežnikov, ki jih je uredil Tim Berners-Lee, ki je gostoval na spletnem strežniku CERN. Ker je vedno več strežnikov začelo delovati prek spleta, zgornja storitev ni mogla obdelati takih informacije.

google iskalnik

Eden prvih iskalnikov, ki temelji na spletnem iskanju, je bil WebCrawler, ki je bil izdan leta 1994. Za razliko od svojih predhodnikov je uporabnikom omogočal iskanje katere koli besede na kateri koli spletni strani. Ta algoritem je od takrat postal standard za vse večje iskalnike. To je bila tudi prva odločitev, ki je bila široko znana javnosti. Leta 1994 je bila uvedena tudi storitev Lycos, ki je kasneje postala pomemben komercialni projekt.

Kmalu zatem so se pojavili številni iskalniki in njihova priljubljenost se je znatno povečala. Med njimi so Magellan, Excite, Infoseek, Inktomi, Northern Light in AltaVista. Yahoo! je bil eden izmed najbolj priljubljenih načinov iskanja spletnih strani, ki so zanimive, vendar je njegov iskalni algoritem deloval v lastnem spletnem imeniku, ne v polnih besedilnih straneh. Iskalci informacij lahko brskajo po katalogu in ne po ključnih besedah.

Iskalnik Yandex

Nova faza razvoja

Google je sprejel zamisel o prodaji iskalnih poizvedb v letu 1998, začenši z majhnim podjetjem, goto.com. Ta korak je pomembno vplival na poslovanje s SEO, kar je sčasoma postalo ena najbolj donosnih dejavnosti na internetu.

Okoli leta 2000 je Google iskalnik postal splošno znan. Podjetje je doseglo boljše rezultate pri številnih iskanjih z inovacijami, imenovanimi PageRank. Ta iterativni algoritem ocenjuje spletne strani na podlagi njihovih povezav z drugimi spletnimi mesti in stranmi, ki temeljijo na predpostavki, da drugi ali pogosto uporabljajo dobre ali želene vire. Google je podprl tudi minimalni vmesnik za svoj iskalnik. Ravno nasprotno, mnogi konkurenti so v spletni portal zgradili iskalnik. Pravzaprav je Google postal tako priljubljen, da so se pojavili goljufivi motorji, kot je Mystery Seeker. Danes obstaja veliko regionalnih različic te storitve, zlasti iskalnik Google.ru, namenjen rusko govorečim uporabnikom.

google ru iskalnik

Kako delujejo te storitve?

Kako je razvrščanje in dostava rezultatov? Kaj so iskalniki v smislu algoritma delovanja? Pridobivajo informacije prek spletnega preiskovanja od mesta do mesta. Robot ali »pajek« preveri standardno ime datoteke robots.txt, naslovljeno nanj, preden pošlje določene informacije za indeksiranje. Poudarek je na številnih dejavnikih, kot so naslovi, vsebina strani, JavaScript, kaskadni listi slogov (CSS), kot tudi standardna oznaka HTML za vsebino ali metapodatke v metaoznakih HTML.

Indeksiranje pomeni povezovanje besed in drugih definiranih žetonov na spletnih straneh z njihovimi domenskimi imeni in polji, ki temeljijo na HTML. Združenja se ustvarijo v javno dostopni bazi podatkov, ki je na voljo za iskalne poizvedbe v spletu. Zahteva uporabnika je lahko ena beseda. Indeks pomaga najti informacije, povezane s poizvedbo, čim prej.

Nekateri metod indeksiranja in caching so poslovne skrivnosti, medtem ko je spletno pajkanje preprost postopek obiska vseh spletnih mest na sistematični osnovi.

Med obiskom robota se shranjena različica strani (del ali celotna vsebina, ki jo potrebuje za prikaz), shranjena v delovnem spominu iskalnika, hitro pošlje uporabniku, ki zahteva. Če je obisk zamujen, lahko iskalnik preprosto deluje kot spletni posrednik. V tem primeru se lahko stran razlikuje od indeksov iskanja. Predpomnjen vir prikaže različico, katere besede so bile indeksirane, zato je lahko uporabna, če je bila dejanska stran izgubljena.

iskalniki russia

Visoka raven arhitekture

Ponavadi uporabnik vnese iskalno poizvedbo v obliki več ključnih besed. Indeks že vsebuje imena spletnih mest, ki vsebujejo te ključne besede, in se takoj prikažejo. Resnična obremenitev je ustvarjanje spletnih strani, ki so seznam rezultatov iskanja. Vsako stran na celotnem seznamu je treba oceniti glede na informacije v indeksih.

V tem primeru zgornji element rezultata zahteva iskanje, rekonstruiranje in označevanje fragmentov, ki prikazujejo kontekst ustreznih ključnih besed. To je le del obdelave vsake spletne strani v rezultatih iskanja, nadaljnje strani (poleg nje) pa zahtevajo večino nadaljnje obdelave.

Poleg preprostega iskanja ključnih besed iskalniki ponujajo lastne upravljalne vmesnike ali upravljane s pomočjo ukazov in parametre iskanja, da bi izboljšali rezultate.

Zagotavljajo potrebne kontrole za uporabnika prek povratne zanke, s filtriranjem in uteženjem pri izpopolnjevanju želenih podatkov, pri čemer upoštevajo začetne strani prvih rezultatov iskanja. Od leta 2007 je na primer Google.com dovolil, da se dobljeni seznam filtrira po datumu, tako da kliknete »Pokaži iskalna orodja« v skrajnem levem stolpcu na prvotni strani z rezultati in nato izberete želeno časovno obdobje.

Ruski iskalniki

Različica poizvedbe

Večina iskalnikov podpira uporabo logičnih operatorjev AND, OR in NOT za pomoč končnim uporabnikom pri izboljšanju poizvedbe. Nekateri operaterji so namenjeni za literale, ki uporabniku omogočajo, da izboljša in razširi pogoje iskanja. Robot poišče besede ali besedne zveze na enak način kot vnosi ukazov. Nekateri iskalniki ponujajo funkcijo naprednega iskanja, ki uporabnikom omogoča določanje razdalje med ključnimi besedami.

Obstaja tudi pojmovno iskanje, pri katerem raziskave vključujejo uporabo statistične analize na straneh, ki vsebujejo besede ali fraze, ki jih iščete. Poleg tega zahtevki v naravnem jeziku omogočajo uporabniku, da vnese vprašanje v enaki obliki, kot bi ga vprašal oseba (najbolj tipičen primer je ask.com).

Koristnost iskalnika je odvisna od pomembnosti niza rezultatov, ki ga ustvari. Obstajajo lahko na milijone spletnih strani, ki vsebujejo določeno besedo ali frazo, vendar so nekatere od njih lahko bolj relevantne, priljubljene ali verodostojne kot druge. Večina iskalnikov uporablja metode razvrščanja, da zagotovi najboljše rezultate.

Kako se iskalnik odloči, katere strani so najbolj primerne za poizvedbo, in v kakšnem vrstnem redu so prikazani najdeni viri se močno razlikujejo od enega do drugega robota. Te metode se sčasoma spreminjajo, saj se spreminja uporaba interneta in razvoj novih tehnologij.

Kaj je iskalnik: vrsta

Obstajata dve glavni vrsti iskalnika. Prvi je sistem vnaprej določenih in hierarhično urejenih ključnih besed, s katerimi so ga ljudje množično programirali. Drugi je sistem, ki generira »invertni indeks« z analizo najdenih besedil.

promocija v iskalnikih

Večina iskalnikov je komercialna storitev, ki jo podpirajo prihodki od oglaševanja, zato nekateri od njih oglaševalcem omogočajo, da imajo oceno za prikazane rezultate za določeno plačilo. Storitve, ki ne sprejemajo uvrstitvenega denarja, zaslužijo denar z objavljanjem kontekstnih oglasov poleg prikazanih spletnih mest. Danes je promocija v iskalnikih ena izmed najbolj donosnih dohodkov v omrežju.

Katere storitve so najpogostejše?

Google je najbolj priljubljen iskalnik na svetu s tržnim deležem 80,52% marca 2017.

Celotna ocena najpogostejših storitev (z več kot 1-odstotnim tržnim deležem) izgleda tako:

  • Google - 80,52%
  • Bing - 6,92%
  • Baidu - 5,94%
  • Yahoo! - 5,35%

Iskalniki Rusije in držav vzhodne Azije

V Rusiji in nekaterih državah vzhodne Azije Google ni najbolj priljubljena storitev. Med ruskimi uporabniki je Yandexov iskalnik vodilni v priljubljenosti (61,9%) v primerjavi z Googlom (28,3%). Na Kitajskem je Baidu najbolj priljubljena storitev. Južna Koreja Search Portal - Naver se uporablja za 70% odstotkov spletnih iskanj v državi. Tudi Yahoo! na Japonskem in v Tajvanu je najbolj priljubljeno orodje za iskanje pravih podatkov.

Drugi znani ruski iskalniki so Mail in Rambler. Z začetkom razvoja Runeta so bili zelo priljubljeni, zdaj pa so izgubili veliko svojih položajev.

Omejitve in iskalni kriteriji

Čeprav so iskalniki programirani za uvrščanje spletnih strani na podlagi njihove priljubljenosti in pomembnosti, empirične študije kažejo na različna politična, gospodarska in socialna merila za izbiro informacij, ki jih zagotavljajo. Te pristranskosti so lahko neposredna posledica gospodarskih (na primer podjetij, ki oglašujejo iskalnik, lahko postanejo tudi bolj priljubljena pri rednih rezultatih iskanja) in političnih procesov (na primer brisanje rezultatov iskanja v skladu z lokalnimi zakoni). Google torej ne bo prikazoval nekaterih neonacističnih lokacij v Franciji in Nemčiji, kjer je zanikanje holokavsta nezakonito.

Krščanski, islamski in judovski iskalniki

Globalna rast interneta in elektronskih medijev v muslimanskem svetu v zadnjem desetletju je spodbudila islamske privržence na Bližnjem vzhodu in azijskem podkontinentu, da poskušajo ustvariti lastne iskalnike in filtrirane portale, ki bodo uporabnikom omogočili varno iskanje.

Takšne storitve vsebujejo filtre, ki nadalje razvrščajo spletne strani kot »halal« ali »haram«, ki temeljijo na trenutni strokovni razlagi »zakona islama«.

Portal ImHalal se je pojavil septembra 2011, Halalgoogling pa julija 2013. Uporabljajo haraamske filtre, ki temeljijo na algoritmih iz Googla in Binga.

Drugi iskalniki, usmerjeni v religijo, so Jewgle (judovska različica Googla) in Christian SeekFind.org. Ti filtrirajo spletna mesta, ki jim zanikajo ali ponižujejo njihovo vero.