www.romver.ru
/ Полный список статей / Поиск глазами пользователей

Как заказать сайт


АБРАКАДАБРА (Тоже самое но в читаемом виде)

Mi i6em s to4nost'u do 8 nanobitov,
kajduu sekundu mi indeksiruem 1024 s polovinoy saytov,
mi indeksiruem vse, 4to pinguetsa,
rejim overdrive - naxodatsa daje te stranici,
kotorix nikogda ne su6estvovalo.
(reklamno-poiskovoe)

Poiskovie texnologii s4itautsa odnoy iz dostato4no dinami4nix i intensivno razvivau6ixsa texnologiy, i napominaut os'minoga, strema6egosa zaxvatit' svoimi 6upal'cami vsu informaciu, do kotoroy mojet dotanut'sa. I, esli ran'6e mi, pol'zovateli, podstraivalis' pod poiskovuu sistemu, to teper' poiskovie sistemi pitautsa podstraivat'sa pod pol'zovatela.

No u razrabot4ikov svoi predstavlenia o tom, v kakom napravlenii doljni razvivat'sa poiskovie texnologii, a u pol'zovateley, kak ni stranno, neskol'ko inie. Poetomu davayte posmotrim na poiskovie texnologii glazami pol'zovatela.

Birul'ki

S to4ki zrenia pol'zovatela, poslednee vrema razvivaetsa ne innovacionnost' poiska, a izvra6ennost'. Tol'ko nebol'6oy procent pol'zovateley sistemati4eski ispol'zuet "prodvinutie" poiskoviki, pozvolau6ie razlojit' v vizual'niy rad i po polo4kam klasteri, pirojki i svazi. Ostal'nie otnosatsa k takim poiskovikam kak k igru6kam. Da, krasivo, interesno i pozvolaet provesti nespe6noe issledovanie oblasti poiska (4to, kak i s 4em svazano, i na 4to vliaet), no esli trebuetsa 4to-to bistro nayti - tut uj izvinite: nam ne 6a6e4ki, a exat'. Tem bolee, 4to sobstvennaa indeksnaa baza u takix prodvinutix poiskovikov ili otsutstvuet, ili nebol'6aa.

4ego je xo4et pol'zovatel'? A pol'zovatelu xo4etsa strannogo - vnesti poiskovuu stroku i polu4it' nebol'6oy, no dostato4niy spisok rezul'tatov (linkov na sayti i stranici), na kotorix pol'zovatel' naydet imenno to, 4to xotel. Otkuda poiskovik ix voz'met i kak dogadaetsa, 4to imenno pol'zovatel' xotel nayti - eto pol'zovatelu fioletovo, a "problemi negrov 6erifa ne interesuut" (to est', kak etogo dob'utsa poiskoviki pol'zovatela volnuet malo).

Raspoznavanie obrazov

Odna iz problem, s kotoroy postoanno stalkivaetsa pol'zovatel' - to, 4to poiskoviki i6ut ne po smislu, a po tekstu. Legko nayti tekst po citate ili unikal'noy klu4evoy fraze - esli vi ee pomnite. A esli net? Esli a ne znau, kakimi slovami on (tekst) pisalsa? E6e xuje situacia, kogda vi ne znaete, po kakim slovam iskat' nujnie sayti; skajem, esli vi i6ete informaciu po neznakomoy vam predmetnoy oblasti. Naprimer, na4inau6emu uzeru xo4etsa nayti softinu, kotoraa pozvolit vesti elektronniy bloknot (zapisnuu knijku) s podderjkoy drevovidnoy strukturi. O tom, 4to etot tip programmi nazivaetsa outlayner (outliner), on mojet dogadat'sa tol'ko slu4ayno.

U "social'nogo poiska" (zvonok drugu v icq, pomo6' zala, foruma ili soob6estva), kotoriy v takoy situacii spravlaetsa lu46e, est' svoi nuansi. Krome togo, "social'niy poisk" ne obladaet xolodnoy bespristrastnost'u, svobodoy vibora, i sposoben navazivat' ne lu46ie re6enia.

Poiskovie sistemi pitautsa pomo4' pol'zovatelu, potro6a tezaurus i podbiraa sinonimi k slovam i virajeniam. No 4a6e eto privodit k uveli4eniu musora v rezul'tatax, 4em k real'noy pomo6i. Samostoatel'no upravlat' stepen'u vovle4ennosti tezaurusa v poisk pol'zovatelu ne daut. A zra.

Pri poiske v neizvestnoy predmetnoy oblasti obi4no sovetuut nayti (neizvestno kakimi putami) kakoy-to sayt po etoy predmetnoy oblasti i po nemu sostavit' "poiskoviy slovarik", ispol'zua kotoriy iskat' vse ostal'nie resursi i materiali.

Poskol'ku takoy metod neudobniy i trebuet ru4noy raboti, to pol'zovatelu xo4etsa etu rabotu spixnut' na poiskovik. Pro6e govora, pol'zovatelu trebuetsa ne4etkiy poisk ("ne znau to4no, 4to xo4u nayti"). Realizuetsa on metodom poiskovoy vilki: sna4ala idet rejim "predvaritel'nogo pricelivania", pozvolau6iy 6ag za 6agom suzit' oblast' poiska i sformirovat' pravil'niy poiskoviy slovarik, posle 4ego po etomu slovariku i osu6estvlaetsa poisk.

Xoro6ie rezul'tati polu4autsa, esli predvaritel'niy poisk idet po semantike, a uje potom proisxodit perexod na "lineyniy poisk".

Aktualizacia

E6e odnim neudobstvom dla pol'zovatela avlaetsa nedostato4noe vnimanie poiskovika k aktualizacii. To est' poiskovaa sistema doljna v pervuu o4ered' indeksirovat' noviy kontent, a ostal'noe - po grafiku (ili kak pridetsa). Eto i nazivaetsa "taktika bistrogo i medlennogo indeksirovania". Esli novaa stat'a opublikovana - to ona doljna bit' proindeksirovana v tot je den'. Mnogie poiskoviki k etomu otnosatsa xalatno, a dla personal'nix poiskovikov eto bol'noy vopros - u nix sli6kom prostie planirov6iki.

Xota opredelennie uspexi v dele aktualizacii i optimizacii indeksirovania est' - Gugl', naprimer, ispol'zuet dla optimizacii sitemap.

Priru4enie poiskovika

Vremena, kogda poiskovaa sistema vidavala neytral'nie rezul'tati, orientirovannie na bezlikuu seruu massu, proxodat. Teper' pol'zovatel' xo4et, 4tobi poiskovaa sistema vidavala rezul'tati s u4etom ego interesov, to est' - personalizaciu. Kakim obrazom poiskovaa sistema eto obespe4it - pol'zovatela ne osobenno volnuet. Mnogie ne budut vozrajat', esli poiskovaa sistema budet ne tol'ko otslejivat' ix poiskovie zaprosi, kliki na rezul'tatax, dvijenie mi6i v okne brauzera... vplot' do sostavlenia "individual'nogo poiskovogo profila" (anonimnogo, razumeetsa, bez privazki k familii, mestu raboti i pasportnim dannim) - glavnoe, 4tobi rezul'tati poiska bili dla konkretnogo 4eloveka (eto, kstati, ozna4aet, 4to dva raznix 4eloveka na odnom i tom je poiskovom zaprose polu4at raznie rezul'tati).

Pol'zovatel' daje gotov obu4at' poiskovik (i nastraivat' "li4nuu relevantnost'") v interaktivnom rejime.

No vse eto s usloviem, 4to pri neobxodimosti mojno zapretit' ispol'zovat' profil', 4tobi polu4it' "neytral'nie" (4istie, ne personalizirovannie) rezul'tati poiska.

Smartass AI

Ne tak davno Sergey Brin rasskazal o blijay6ix planax po osvoeniu "iskusstvennogo intellekta". A poskol'ku osnovoy Gugla avlaetsa poisk, to neslojno dogadat'sa, kuda etot intellekt budet prikru4en. Teoreti4eski eta 6tuka doljna otgadivat', 4to je xotel nayti pol'zovatel', vveda kakie-to slova v poiskovuu stroku.

Prakti4eski je - nikto ne dast garantii, 4to eta 6tuka otgadaet pravil'no. Potomu kak "vse, 4to mojno ponat' nepravil'no - ponimaetsa nepravil'no", soglasno zakonu Merfi. I, kak sledstvie, "xuje neprednamerennoy o6ibki mojet bit' tol'ko soznatel'noe vvedenie v zablujdenie".

No, s drugoy storoni, noviy guglovskiy intellekt mojet stat' neploxim i udobnim interfeysom mejdu pol'zovatelem i poiskovim dvijkom v dele nastroyki, obu4enia i personalizacii.

Deep Web

Nekotorie sayti, kak ni stranno, ne sostoat iz stranic, a stroat ix dinami4eski po zaprosu pol'zovatela. To est', rabotaut kak tipi4naa baza dannix (database): pol'zovatel' v formo4ke oformlaet zapros, a sistema podbiraet dannie i vivodit ix na stranice (a neskol'ko utriruu). Proindeksirovat' takie sayti poiskoviy pauk ne mojet iz-za otsutstvia avnoy strani4noy organizacii.

Poetomu, po nekotorim ocenkam, indeksiruetsa li6' okolo 20% ot ob6ey "informacionnoy massi". No skritie 80% (kotorie i est' "glubokiy veb") - eto dostato4niy stimul, 4tobi izobresti i otladit' mexanizm, pozvolau6iy pauku tuda dobrat'sa. 4em, sobstvenno, vedu6ie poiskovie sistemi i zanimautsa.

Tol'ko vot ne fakt, 4to pol'zovatelu stanet ot etogo lu46e. Malo togo, 4to vozrastet vida4a v rezul'tatax zaprosa, tak e6e v lu46ix tradiciax web 2.0 na4netsa mnogokratnoe dublirovanie informacii "iz pervoisto4nikov".

A 4to semantika?

Govora o semantike, vajno ponimat', 4to udivitel'niy mir Semantic Web, kotoriy nam narisoval Tim Berners-Li, otli4aetsa ot poiskovika, ispol'zuu6ego semantiku dla poiska. Potomu kak semantika - eto, v osnovnom, ne poiskovie texnologii, a agregativnie. No ispol'zovanie semantiki pri poiske mojet neploxo pomo4' poisku. Vopros, odnako, v tom, gde etu semantiku vzat'.

S odnoy storoni, poiskoviki mogli bi indeksirovat' ne tol'ko html, no i semantiku, no ee (semantiku) ne daut proizvoditeli kontenta. S drugoy storoni, proizvoditel' kontenta ne gotov predostavlat' semantiku, poskol'ku neponatno, kak i v kakom formate ee gotovi brat'.

Situacia oslojnaetsa e6e i tem, 4to ot naibolee dinami4noy i mobil'noy 4asti sozdateley kontenta (i 6uma, sootvestvenno) semantiki mojno i ne dojdat'sa. K primeru, 90% bloggerov, pi6u6ie (v srednem) po pare abzacev teksta, vrad li budut udelat' vnimanie xoro6emu i korrektnomu zapolneniu semanti4eskix dannix, zatrati na kotorix mogut previsit' zatrati na samu zapis'. A s u4etom togo, 4to aktual'nost' zapisi v bloge v srednem sostavlaet 3-7 dney, takoe zanatie predstavlaetsa somnitel'nim. Desat' tegov votknut' zna4itel'no pro6e.

Kstati, ni v odnom blogovskom dvijke ne predusmotreno sistemnoe vnesenie metainformacii k zapisi.

4to je kasaetsa tradicionnix saytov, to oni bolee inertni, i, skoree vsego, budut jdat' uje rabotau6ey texnologii - prosto tak, bez konfetki, nikto ne budet perelopa4ivat' bol'6oy ob&em kontenta.

4to v takoy situacii delat' poiskovoy sisteme? Pitat'sa samostoatel'no "vitanut'" semantiku iz indeksiruemogo teksta.
Dla etogo est' dva metoda:

- vosstanovlenie semantiki s ispol'zovaniem strukturno-lingvisti4eskix algoritmov;
- podbor semantiki po 6ablonu, to est' po sovpadeniu rada zna4imix slov; esli rad ukladivaetsa v 6ablon - sozdaetsa semanti4eskiy element.

Semantiku pro6e ne vosstanavlivat', a podbirat' po 6ablonu - eto bolee prostaa i menee zatratnaa texnologia. No vosstanovlenie semantiki daet bolee nadejnie i lu46ie rezul'tati.

No na perexodnoy period (do poavlenia polnomas6tabnogo Semantic Web) takoy podxod (teoreti4eski) mojet zna4itel'no ulu46it' poisk. A eto xoro6o dla pol'zovatela, poskol'ku daet vozmojnost' "logi4eskogo" (smislovogo) poiska.

Koda

Iz vsego vi6eskazannogo sleduet odna prostaa misl' - nado ne tol'ko sover6enstvovat' poiskovie algoritmi, no i udelat' bol'6e vnimania individual'nomu podxodu k pol'zovatelu. Potomu kak pol'zovatel' ocenivaet effektivnost' i ka4estvo poiska ne po texni4eskim xarakteristikam 4ernogo a6ika a.k.a. poiskovaa sistema, a po tomu, naskol'ko bistro i udobno on polu4it nujnie emu rezul'tati i ne polu4it nenujnie. Stroit' texnologii nujno isxoda iz potrebnostey pol'zovatela, a ne ottalkivaas' ot togo, 4to mojet predlojit' pol'zovatelu poiskovaa sistema.

I e6e nujno ponimat', 4to dla dal'ney6ego ser'eznogo razvitia poiska poiskovie texnologii i algoritmi doljni izmenit'sa ka4estvenno i pereyti na noviy uroven', a ne var'irovat'sa v vide konceptual'nix (i ne o4en') nadstroek k su6estvuu6ey (klassi4eskoy) poiskovoy texnologii.

3
Создание эксклюзивных сайтов, юзибилити анализ и бесплатный анализ под запросы основных поисковых машин
Контактная информация :
тел. +7(98I) 7608865

Написать письмо на e-mail
icq 415547094  romverрейтинг на mail.ru сайта romverinbox.ru
© 1997 - 2024 romver.ru

Полная карта сайта Display Pagerank