|
АБРАКАДАБРА (Тоже самое но в читаемом виде)
Znanie osnov raboti poiskovoy sistemi pozvolaet izbavit'sa ot mnogix
illuziy. Vajno znat':
Ranjirovanie saytov poiskovoy sistemoy
osu6estvlaetsa na osnove algoritma, kotoriy
razrabativaut ludi. V lubom algoritme mogut bit'
o6ibki i prisutstvuet sub&ektivnost'.Dla podgotovki i
obnovlenia rezul'tatov ranjirovania saytov nujno
opredelennoe vrema.
Posle dobavlenia sayta v bazu dannix poiskovoy
sistemi on poavlaetsa v rezul'tatax zaprosov ne
srazu, a 4erez nekotoroe vrema.Posle
vnesenia izmeneniy na sayte informacia o nix,
vidavaemaa poiskovoy sistemoy, poavlaetsa ne srazu,
a 4erez nekotoroe vrema.S odnoy storoni,
rezul'tati ranjirovania saytov poiskovimi sistemami tem polnee i to4nee, 4em
bol'6e v etom processe prisutstvuet ru4nogo truda.S drugoy storoni, 4em
men'6e sub&ektivnix kriteriev ispol'zuetsa poiskovoy sistemoy pri
ranjirovanii saytov, tem to4nee i ob&ektivnee rezul'tati.Eto protivore4ie - odna iz
problem sozdania effektivno rabotau6ey poiskovoy sistemi.
Popularnie poiskovie
sistemi vidaut rezul'tati zaprosov menee 4em za sekundu. V rezul'tatax
soderjatsa ssilki na millioni veb-stranic ili saytov.Ob&em informacii,
proindeksirovannoy popularnimi poiskovimi sistemami i xrana6eysa v ix
bazax dannix, sostavlaet ot neskol'ko terabayt.
Kak bi bistro ni rabotala poiskovaa sistema, nel'za bistro vidat'
rezul'tati na zapros, esli eti rezul'tati zaranee ne podgotovleni.Pri podgotovke rezul'tatov na
popularnie zaprosi informacia v poiskovoy sisteme
razbivaetsa na porcii (klasteri).V kajduu porciu informacii
vklu4autsa zaranee proranjirovannie rezul'tati po odnomu
ili neskol'kim klu4evim slovam i proizvodnim ot nix. Na
zametku:Poisk
informacii na personal'nom komp'utere mojet zanat' ot
neskol'kix minut do neskol'kix desatkov minut.
Pol'zovateli poiskovix sistem tak dolgo jdat' ne budut. Razrabotka sistem poiska
po saytu sxoja s razrabotkoy poiskovoy sistemi Interneta. Osnovnoe
otli4ie - ob&emi informacii.Popitki razrabotki sistemi
poiska informacii na sayte "na skoruu ruku" vsegda privodat k snijeniu
effektivnosti sayta, t.e. k snijeniu doxoda i pribili ot sayta.Nizkoe ka4estvo
rezul'tatov, vidavaemix poiskovimi modulami, sozdannimi "po-de6evke",
o6elomlaut i, poroy, privodat v ujas posetitela sayta.
Dla spravki: Klasterizacia veb-dokumentov - razbienie veb-dokumentov na
neskol'ko temati4eskix klassov s annotaciey dla kajdogo klassa.Su6estvuu
razli4nie metodi klasterizacii.
Ob6aa sxema klasterizacii veb-dokumentov(formirovania temati4eskix
grupp veb-dokumentov):O4istkaVeb-dokumenti, sobrannie poiskovim robotom, podvergautsa predvaritel'no obrabotke:udalenie programmnogo koda;udalenie
stop-slov (6umovix slov);udalenie punktuacii;udalenie slov, ne
imeu6ix smislovogo zna4enia (4astici, mejdometia i t. d.).Morfologi4eskiy i sintaksi4eskiy
razborprivedenie slov v na4al'nuu formu
(perevod slov v edinstvennoe 4islo, udalenie suffiksov i t.d.);videlenie svazannix komponent
(su6estvitel'noe + prilagatel'noe; su6estvitel'noe + glagol i t.d.). Videlenie
smislovogo adra kajdoy veb-stranici i sayta Opredelenie bazovix klasterov Postroenie ierarxi4eskogo "dereva":
videlenie osnovnogo klu4evogo slova ili frazi i proizvodnix ot nix. Gruppirovka bazovix klasterov Postroenie vzaimosvazi mejdu bazovimi
klasterami. Sut': Ne menee 4em dla 99% vsex
zaprosov pol'zovateley rezul'tati zaprosov (otveti na zaprosi)
podgotavlivautsa zaranee. Vida4a rezul'tatov osu6estvlaetsa iz
viborki bazi dannix, razdelennoy na o4en' bol'6oe 4islo
uporado4ennix dannix. Primer:1 000 000 zaranee
podgotovlennix rezul'tatov zaprosov poiskovoy sistemi mojet
udovletvorit' ne menee 99% zaprosov posetiteley.Dla kajdoy
poiskovoy sistemi 4islo zaranee podgotovlennix zaprosov razli4no i
zavisit, v pervuu o4ered', ot finansovix vozmojnostey i tipa
poiskovoy sistemi: global'naa ili nacional'naa. Po oblasti
deystvia poiskovie sistemi mojno razdelit' na global'nie,
kotorie osu6estvlaut poisk na mnogix azikax bez u4ёta imeni domena,
i lokal'nie, kotorie osu6estvlaut poisk v predelax
opredelёnnogo domena, naprimer, nacional'nogo, na opredelennom
azike.Vajno:Pri poda4e zaprosa
posetitelem poiskovaa sistema ne vistraivaet reyting saytov, a
vidaet zaranee podgotovlenniy rezul'tat.U kajdoy poiskovoy
sistemi unikal'niy algoritm. Mojno pridumat' raznie algoritmi
ranjirovania saytov i s4itat' kajdiy iz nix samim to4nim i
ob&ektivnim.Razli4ie v
algoritmax raboti poiskovix sistem - osnovnaa pri4ina, po4emu odin i
tot je sayt zanimaet razli4niy reyting po klu4evomu slovu v
rezul'tatax zaprosov poiskovix sistem.
Rezume Razrabotka effektivnoy
poiskovoy sistemi - slojnaa i dorogostoa6aa zada4a. Ne stoit verit'
predlojeniam o razrabotke za malie den'gi effektivnogo modula poiska
po saytu. Rezul'tati
ranjirovania klu4evix zaprosov modulem poiska po saytu tem polnee i
to4nee, 4em bol'6e na otladku etix moduley zatra4eno ru4nogo truda. Pri poiske
informacii v poiskovix sistemax sleduet u4itivat' osnovnie
osobennosti ranjirovania saytov poiskovimi sistemami.
Detal'no razbirat'sa v voprosax ranjirovania saytov poiskovimi
sistemami ili klu4evix zaprosov modulem poiska po saytu zakaz4iku
neobazatel'no. Eto -
obazannost' veb-studii i veb-dizaynera.Dobrosovestnie
veb-studii ili veb-dizayneri obazani preduprejdat' svoix zakaz4ikov
ob otricatel'nix posledstviax vklu4enia v sayt malobudjetnix
"gotovix" moduley poiska po saytu. Libo informirovat' zakaz4ikov o real'nix srokax i
stoimosti razrabotki polnocennix moduley poiska po saytu. antula.ru/algoritm-results.htm
|
|