|
ÀÁÐÀÊÀÄÀÁÐÀ (Òîæå ñàìîå íî â ÷èòàåìîì âèäå)
Ot perevod4ika: ne dumau, 4to otkrivau Ameriku etim perevodom, po
bol'6omu s4etu isku6enniy xabrapol'zovatel' ne naydet dla seba mnogo
novogo i neobi4nogo. Odnako, na moy vzglad, eto neploxaa
ob6eobrazovatel'naa stat'a, v kotoroy udobno sobrani i rassmotreni
osnovnie vexi i principi raboti poiskovix ma6in. Original stat'i
opublikovan v jurnale Wired za mart 2010 goda. Preduprejdau srazu —
stat'a dlinnaa.
Xotite
li vi uznat', kak Google sobiraetsa izmenit' va6u jizn'? Ostanovites'
okolo komnati sove6aniy Uagadugu vo vtornik utrom. Eto re6aetsa zdes',
v Kalifornii, v Mauntin V'u, v golovnom ofise
samoy vliatel'noy internet-kompanii v mire, v komnate, napolnennoy
trema desatkami injenerov, menedjerov i rukovoditeley, kotorie
opredelaut, kak sdelat' poiskovuu ma6inu e6e umnee. V etom godu
kompania Google predstavila okolo 550 usover6enstvovaniy v svoy
legendarniy algoritm, i kajdoe opredelaet vida4u informacii. Re6enia,
prinimaemie na ejenedel'nom Sove6anii po Ka4estvu Poiska, vliaut na
rezul'tati vida4i poiskovoy sistemi dla lubix va6ix zaprosov — «printer
Samsung SF-755p», «strani4ka Ed Hardy na MySpace» ili daje «stolica
Burkina Faso», kotoraa, kstati, nazivaetsa takje, kak i eta komnata dla
sove6aniy. Rukovodit processom Udi Menber,
glava Google po poisku s 2006 goda. Predpolagaemie izmenenia vmeste s
rezul'tatami mesacev testirovania v razli4nix stranax i na vsevozmojnix
azikax predstavlautsa odno za drugim. Na ekranax radom drug s drugom
otobrajautsa rezul'tati zaprosov do i posle izmenenia. Sledom za
vida4ey rezul'tata poiska «gitarniy centr vau-vau» — Menber kri4it:
«Polu4ilos'!»
Vozmojno, vi s4itaete, 4to posle desatiletnego bezuslovnogo
dominirovania na poiskovom rinke Google mojet rasslabit'sa. Sey4as eta
kompania kontroliruet 65 procentov vsex poiskovix zaprosov, i ona
edinstvennaa, 4'e ima sinonimi4no slovu «poisk». No tak je kak Google
ne gotov po4ivat' na lavrax, tak i ego konkurenti ne gotovi priznat'
porajenie. Soglasno zaavlenim celam i zada4am, v te4enie mnogix let
gigant Silikonovoy dolini ispol'zoval svoy tainstvenniy, kaju6iysa
vsevedu6im algoritm dla «organizacii mirovoy informacii». No za
neskol'ko poslednix let mnojestvo kompaniy brosili vizov Google v sfere
ego osnovnoy deatel'nosti: oni brosili vizov poiskovoy ma6ine, kotoraa
blagodara texnologi4eskomu vol6ebstvu i postoannomu usover6enstvovaniu
mojet udovletvorit' luboy vozmojniy zapros. Facebook priblizilsa k
poziciam Google, ras4itivaa, 4to ludi budut bol'6e doverat' sovetam
druzey, a ne rezul'tatam raboti bezlikoy formuli. Blagodara
vozmojnostam sintaksi4eskogo razbora svoego neprerivnogo potoka
soob6eniy, Twitter predstavil koncepciu poiska v rejime real'nogo
vremeni, perexvativaa poslednie razgovori i obsujdenia po mere togo kak
oni razvora4ivautsa. Yelp pomogaet ludam nayti restorani, ubor6ikov i
nanek, ispol'zua poisk po reytingu. Ni odin iz etix novix servisov ne
predstavlaet ugrozi sam po sebe, odnako vse vmeste oni prognoziruut
budu6ee, v kotorom poisk budet otkritim i 6irokim, i v kotorom carit ne
prosto poiskovaa ma6ina, a skoree nabor razli4nix poiskovix servisov.
Krome togo, naibol'6aa ugroza dla Google naxoditsa v polutore tisa4
kilometrax k severu: Bing. Peredelanniy i pereimenovanniy kompaniey
Microsoft poiskoviy servis s imenem, kotoroe, po zadumke, doljno
napominat' o vosklicanii «Bingo!» — «Evrika!» (a mojet, eto ima
izvestnogo amerikanskogo pevca ili nazvanie strip-bara iz seriala The
Sopranos), bil zapu6en v iune pro6logo goda s dovol'no optimisti4nimi
prognozami. (The Wall Street Journal
nazval ee «bolee privlekatel'nim, 4em Google»). Obnovlenniy vne6niy vid
i reklamnaa kampania v 100 millionov dollarov pomogli uveli4it' dolu
zaprosov na poiskovom rinke S6A s 8 do primerno 11 procentov, i eto
koli4estvo uveli4itsa vdvoe, kak tol'ko reguliruu6ie organi pozvolat
ispol'zovat' poiskovuu ma6inu Bing dla Yahoo.
Komanda Bing sosredoto4ilas' na otdel'nix slu4aax, v kotorix algoritmi
Google ne vsegda pokazivaut udovletvoritel'nie rezul'tati. Naprimer, v
to vrema kak Google otli4no spravlaetsa s indeksirovaniem publi4nix
internet-saytov, on ne imeet dostupa v rejime real'nogo vremeni k
zaputannim i postoanno menau6imsa massivam dannix o viletax i pribitax
samoletov. Microsoft pokupaet Farecast — internet sayt, kotoriy
postoanno otslejivaet tarifi aviaperevoz4ikov dla predskazania rosta
ili padenia cen na bileti — i predostavlaet svoi dannie v poiskovoy
vida4e Bing. Microsoft sover6il podobnie priobretenia v oblasti
zdravooxranenia, normativnix dokumentov, a takje pokupki i prodaji
tovarov i uslug — v oblastax, gde po ix ras4etam, algoritmi Google
nesover6enni.
No daje v kompanii Bing priznaut, 4to esli nujno prosto vvesti slovo
dla poiska i polu4it' relevantnie rezul'tati, Google vse e6e o4en'
daleko vperedi. Odnako v Bing polagaut, 4to daje pri xoro6ix
rezul'tatax v nekotorix predmetnix oblastax, gde Bing prevosxodit
Google, ludi ne budut ispol'zovat' tol'ko ix servis i dla drugix
zaprosov. «Algoritmi neobi4ayno vajni v poiske, odnako oni ne
edinstvennoe, na 4to nujno obra6at' vnimanie», — govorit Brayan
Makdonal'd, vice-prezident Microsoft po poisku, — «vi vibiraete ma6inu
ne tol'ko po mo6nosti dvigatela».
Otvet Google mojno rezumirovat' v 4etirex slovax: «mike siwek lawyer mi».
Amit Singal napisal, 4to re6enie etogo koana — v poiskovoy stroke ego
kompanii. Singal, sorokaletniy djentel'men, nositel' po4etnogo zvania
«Kollega Google», nagrajdenniy 4etire goda nazad premiey za
perepisanniy kod poiskovoy ma6ini v 2001 godu. On najal klavi6u «vvod».
V mgnovenie oka poavilas' stranica ssilok. Verxniy rezul'tat spiska
vedet k uristu Mayklu Siveku iz goroda Grand Rapids v 6tate Mi4igan.
Eto sover6enno bezobidniy rezul'tat poiska — odin iz tex, kotorie
servera Google obrabativaut milliardi raz v den', no on obman4ivo
slojen. Naberite tot je samiy zapros v Bing, k primeru, i pervaa zapis'
na stranice budet o 4lenax nacional'noy futbol'noy ligi S6A, odnim iz
kotorix avlaetsa igrok po imeni Lawyer Milloy. Rezul'tati poiska
zanimaut neskol'ko stranic, no ni na odnoy net pramoy ssilki na Siveka.
Eto sravnenie pokazivaet silu i daje intellektual'nost' algoritmov
Google, otto4ennix bes4islennoe koli4estvo raz. Oni obladaut, kajetsa,
vol6ebnoy sposobnost'u ponimat' zaprosi pol'zovateley, nezavisimo ot
togo, kak i naskol'ko gramotno oni sostavleni. Google nazivaet etu
sposobnost' ka4estvom poiska, i za godi svoego su6estvovania kompania
t6atel'no skrivala process, blagodara kotoromu polu4autsa takie to4nie
rezul'tati. No sey4as a siju s Singalom v Zdanii ¹43 poiskovogo
giganta, gde rabotaet otdel razrabotki poiskovogo adra, tak kak Google
dala mne besprecendentnuu vozmojnost' posmotret', kakim obrazom
dostigaetsa ka4estvo poiska. Pri4ina etogo o4evidna: vi mojete dumat',
4to algoritm eto nemnogo bol'6e, 4em vsa ma6ina, no podojdite, poka mi
ne priotkroem zavesu i ne uvidim, na 4to sposoben etot algoritm.
Klu4evie osobennosti poiska Google
«Algoritmi poiska Google postoanno izmenautsa i sover6enstvuutsa dla
polu4enia rezul'tatov viso4ay6ego ka4estva. Predstavlaem neskol'ko
naibolee znamenatel'nix ras6ireniy i ulu46eniy s poavlenia indeksa citirovania stranic». — Stiven Levi.
Backrub (sentabr' 1997) — poiskovaa ma6ina, kotoraa rabotala na
serverax Stenfordskogo universiteta po4ti dva goda, polu4iv6aa nazvanie
Google. Ee osnova — ranjirovanie stranic v zavisimosti ot koli4estva i
ka4estva vne6nix ssilok — bilo krupnim texni4eskim dostijeniem.
Noviy algoritm (avgust 2001) — poiskoviy algoritm bil polnost'u reorganizovan, 4tobi uprostit' dobavlenie novix faktorov ranjirovania.
Analiz vzaimosvazey (fevral' 2003) — pervaa zapatentovannaa
osobennost' Google, kotoraa ranjiruet bolee visoko te sayti, na kotorie
ssilautsa bolee avtoritetnie isto4niki.
Fritz (leto 2003) — eto ulu46enie pozvolaet Google
modernizirovat' indeksaciu v luboy moment, a ne tol'ko krupnimi blokami
obnovleniy.
Personalizirovannie rezul'tati (iun' 2005) — pol'zovateli mogut
razre6at' Google otslejivat' istoriu ix poiska dla obespe4enia
personalizirovannix rezul'tatov.
Bigdaddy (dekabr' 2005) — obnovlenie ma6ini pozvolilo bolee polnuu indeksaciu seti internet.
Universal'niy poisk (may 2007) — noviy universal'niy poisk,
postroenniy na poiske kartinok, novostax Google i poiske po knigam
pozvolil pol'zovatelam polu4at' informaciu, predstavlennuu v razli4nom
vide na edinoy stranice rezul'tatov poiska.
Poisk v rejime real'nogo vremeni (dekabr' 2009) — otobrajaet rezul'tati iz Twitter i blogov srazu posle publikacii.
Istoria algoritma Google na4inaetsa s vvedenia indeksa citirovania
stranic, sistemi, izobretennoy v 1997 godu soosnovatelem Google Larri
Peydjem vo vrema u4ebi v Stenforde. Stav6ee legendarnim ozarenie Peydja
zaklu4alos' v ranjirovanii stranic v zavisimosti ot koli4estva i
vajnosti ssilok, vedu6ix na nix. Takim obrazom ispol'zovalsa
kollektivniy razum seti internet dla opredelenia relevantnosti saytov.
Eta koncepcia prosta i obladaet 6irokimi vozmojnostami, i, poskol'ku
Google bistro stal naibolee uspe6noy poiskovoy ma6inoy v internete,
Peydj i Sergey Brin, vtoroy osnovatel' Google, rascenivaut indeks
stranic kak fundamental'nuu innovaciu ix kompanii.
Odnako eto e6e ne vse. «Ludi podderjali ideu indeksa citirovania
stranic, potomu 4to ona ponatna», — govorit Menber, — «no su6estvuet
mnojestvo drugix osobennostey, kotorie ulu46aut relevantnost' vida4i».
Eto ispol'zovanie opredelennix faktorov, kontekstnix priznakov, kotorie
pomogaut poiskovoy ma6ine ranjirovat' millioni vozmojnix rezul'tatov
zaprosa, obespe4ivaa popadanie naibolee poleznix v verx spiska.
Poisk po seti internet — eto process, sostoa6iy ix neskol'kix etapov.
Sna4ala Google analiziruet veb-stranici, sobiraa informaciu so vsex
dostupnix saytov. Zatem eta informacia razdelaetsa i indeksiruetsa
(organizuetsa po alfavitu, primerno kak v slovare). Poisk nujnoy
stranici osnovivaetsa na informacii, kotoruu ona soderjit. Kajdiy raz,
kogda pol'zovatel' vvodit zapros, proindeksirovannaa informacia
pro4esivaetsa v poiskax nujnogo otveta i pol'zovatelu vozvra6aetsa
spisok, obi4no soderja6iy sotni tisa4 ili millionov vxojdeniy. Ves'
fokus, odnako, sostoit v ranjirovanii — opredelenii, kakoy iz otvetov
postavit' vo glavu spiska.
Vot gde prixodat na pomo6' kontekstnie priznaki. Vse poiskovie ma6ini
ispol'zuut ix, no ni odna ne u4itivaet takoe koli4estvo faktorov, a
mojet, ne ispol'zuet ix s takim opitom, kak Google. Indeks citirovania
stranici — eto odin iz faktorov, atribut veb-stranici (polu4aetsa, 4to
ego veli4ina vajna dla kajdogo sayta v seti internet), kotoriy pomogaet
opredelit' relevantnost' stranici. Nekotorie faktori sey4as kajutsa
o4evidnimi. Na rannix etapax algoritmi Google udelali osoboe vnimanie
zagolovku stranici — eto, bezuslovno, vajniy priznak dla opredelenia
relevantnosti. Drugoy klu4evoy faktor ispol'zuet tekst tela rabo4ix
ssilok, kotorie vedut s odnoy stranici na druguu. V rezul'tate «kogda
proizvoditsa poisk, nujnaa stranica budet sverxu, daje esli ona sama ne
soderjit slov, kotorie vi vveli v zapros», — govorit Skott Xasan,
kotoriy bil arxitektorom Google na rannix etapax i rabotal vmeste s
Peydjem i Brinom v Stenforde, — «eto bilo kruto». Pozje faktorami stali
takje svejest' informacii (po odinakovim zaprosam bolee pozdnie
stranici mogut bit' bolee poleznimi, 4em starie) i geografi4eskiy
faktor (Google mojet grubo opredelit' geografi4eskie koordinati
pol'zovatela i predpo4tet rezul'tati, kotorie blije k ego
mestopolojeniu). Sey4as poiskovaa ma6ina ispol'zuet bolee 200 faktorov dla ranjirovania rezul'tatov.
Injeneri Google otkrili, 4to nekotorie iz naibolee vajnix faktorov
mogut bit' naydeni blagodara samoy suti raboti Google. Indeks
citirovania stranici priznan vidau6eysa sistemoy dla opredelenia
popularnosti poiskovimi ma6inami: millioni ludey sami opredelaut, na
4to ssilat'sa v seti. Eto nastoa6aa demokratia. No Singal zametil, 4to
injeneri iz zdania ¹43 ispol'zuut e6e odnu demokratiu — rabotu soten
millionov ludey, kotorie i6ut 4erez Google. Dannie, sozdavaemie
pol'zovatelami v processe poiska — po kakim rezul'tatam oni perexodat,
kakie slova oni zamenaut v zaprose, esli rezul'tat ix ne udovletvoraet,
kak ix zaprosi zavisat ot geografi4eskogo mestopolojenia — okazivautsa
bescennimi svedeniami dla opredelenia novix faktorov i ulu46enia
poiskovoy vida4i. Samiy o4evidniy primer etogo processa — eto
personalizirovanniy poisk Google, osobennost', kotoraa ispol'zuet
istoriu zaprosov pol'zovatela i ego mestopolojenie kak faktori dla
opredelenia relevantnosti rezul'tata. No v osnovnom Google ispol'zuet
etu ogromnuu massu nakoplennix dannix dla korrektirovki algoritma.
Takim je obrazom ispol'zuetsa neobi4ayno glubokaa baza znaniy, kotoraa
pomogaet interpretirovat' ob6iy smisl kriti4eski vajnix zaprosov.
Voz'mem, k primeru, metod, po kotoromu Google opredelaet sinonimi. «Mi
na6li lovkiy sposob», — govorit Singal, — «ludi izmenaut slova v
zaprosax. Naprimer, kto-to nabiraet «kartinki sobak», a potom «kartinki
6enkov». Takim obrazom mi ponimaem, 4to, vozmojno, «6enki» i «sobaki»
vzaimozamenaemi. Mi takje u4li, 4to esli vi vskipatili vodu, to eto
gora4aa voda. Blagodara pol'zovatelam mi zanovo viu4ili semantiku, i
eto dalo o4en' bol'6oy 6ag vpered».
Odnako su6estvuut nekotorie pregradi. Sistema opredelenia sinonimov
Google ponimaet, 4to sobaki poxoji na 6enkov i 4to vskipa4enaa voda
gora4aa. No ona takje re6it, 4to gora4aa sobaka (xot-dog) eto toje
samoe, 4to vskipa4eniy 6enok. Eta problema bila ustranena v konce 2002
goda novatorskim obnovleniem, osnovannom na teoriax filosofa Ludviga Vitgen6teyna
o zavisimosti smisla slova ot konteksta. Tak kak Google sobraet i
xranit milliardi dokumentov i veb-stranic, oni bili proanalizirovani,
dla togo 4tobi ponat', kakie slova blizki po smislu drug k drugu.
Slovoso4etanie «Gora4aa sobaka» (hot dog) bilo naydeno v zaprosax,
soderja6ix takje «xleb», i «gor4ica», i «beysbol» — ne s kipa4enimi
dvornagami. Eto pomoglo algoritmu ponimat', 4to ozna4aet slovo
«xot-dog» i millioni drugix terminov. «Sey4as, esli vi vvedete «Gandhi
bio», mi znaem, 4to bio zna4it biografia», — govorit Singal, — «a esli
vi vvedete «bio warfare», to bio zna4it «biologi4eskaa»».
Na protajenii svoey istorii Google razrabotala neskol'ko sposobov
dobavlenia novix faktorov ranjirovana tak, 4to bi ne naru6alas' rabota
pol'zovateley. Kajduu paru let proisxodit global'noe izmenenie sistemi
— vrode togo, kak vixodat novie versii Windows. Eto bol'6oe sobitie v
Mauntin V'u, no ono ne vinositsa na publiku. «Na6a rabota poxoja na
smenu dvigateley samoleta, kotoriy letit so skorost'u 1000 kilometrov v
4as na visote desati tisa4 metrov nad zemley», — govorit Singal. V 2001
godu, 4tobi prisposobit'sa k bistromu rostu interneta, Singal polnost'u
perepisal izna4al'niy algoritm Peydja i Brina, vklu4iv sistemu bistrogo
dobavlenia novix faktorov poiska. (Odin iz pervix dobavlennix faktorov
novoy sistemi razdelaet kommer4eskie i nekommer4eskie stranici,
obespe4ivaa nujnie rezul'tati dla pol'zovateley, kotorie i6ut tovari
ili uslugi). V tom je godu injener Kri6na Bxarat
predpolojil, 4to ssilki s ob6epriznannix avtoritetnix saytov doljni
imet' bol'6iy ves, i razrabotal vliatel'niy faktor, kotoriy uveli4ival
stepen' doveria k ssilkam na kompetentnix saytax. (Na eto bil polu4en
perviy patent Google). Samoe poslednee global'noe izmenenie, nazvannoe
Caffeine, popravlalo sistemu vnesenia indeksov tak, 4tobi uprostit'
injeneram dobavlenie novix faktorov.
Google izvestna izobretatel'nost'u v poo6renii podobnix novovvedeniy;
kajdiy god kompania provodit vnutrennuu demonstracionnuu vistavku,
nazivaemuu CSI (Crasy Search Ideas — bezumnie poiskovie idei) dla
viavlenia neobi4nix, no poleznix predlojeniy. Odnako, bol'6ey 4ast'u
process izmenenia poiskovoy ma6ini — eto neprekra6au6aasa iznuritel'naa
rabota perebora ploxix rezul'tatov dla opredelenia neto4nostey. Odin iz
bezuspe6nix poiskov vo6el v legendu: gde-to v 2001 godu Singal uznal o
ploxix rezul'tatax poiska po zaprosu «audrey fino». Google napravlal
pol'zovateley na ital'anskie sayti, posva6ennie Odri Xepbern (fino
po-ital'anski zna4it «milaa»). «Mi ponimali, 4to na samom dele eto
4'e-to ima», — govorit Singal, — «no sistema bila ne nastol'ko
soobrazitel'noy».
Neuda4a s «audrey fino» privela Singala k mnogoletney razrabotke
sposoba obrabotki sistemoy imen sobstvennix — a eto 8% vsex zaprosov.
4tobi re6it' zada4u, emu pri6los' osvoit' taynoe iskusstvo bigrammnogo 6ifra,
kotoriy razdelaet razli4nie slova v otdel'nie vzaimosvazannie elementi.
Naprimer «new york» predstavlaet soboy dva nerazrivnix slova
(bigramma). No takje est' «new york times», kotoriy o4evidno ukazivaet
na drugoy vid poiska. I vse snova menaetsa, esli zapros budet «new york
times square». 4elovek srazu vidit razli4ie, no u Google net podvala,
zapolnennogo sotnami tisa4 operatorov za malen'kimi stolikami. Google
polagaetsa na algoritm.
Zapros
«mike siwek lawyer mi» illustriruet, kak Google dostigaet sover6enstva.
Kogda Singal nabiraet komandu 4tobi prodemonstrirovat' kod pod kajdim
naydennim rezul'tatom, stanovitsa ponatno, kakie faktori povliali na
vibor samix virxnix ssilok: bigrammnaa svaz' pokazivaet, 4to eto ima,
sinonim i geografi4eskoe mestopolojenie. «Razberem etot zapros s to4ki
zrenia injenera», — ob&asnaet Singal, — «mi vidim — aga! Mi mojem
razbit' zapros vot tak. Mi vi4islaem, 4to «lawyer» — eto ne familia, a
«siwek» — eto ne ima. I zaodno 4to «lawyer» eto ne gorod v Mi4igane.
«lawyer» — eto advokat».
Eta dobitaa cenoy bol'6ix usiliy realizacia vnutrenney raboti poiskovoy
ma6ini Google, sobrannaa blagodara dannim, vvedennim milliardami
pol'zovateley: «rock» — eto skala. E6e eto kamen', a mojet bit' i
bulijnik. Napi6ite ego kak «rokc», i eto vse ravno budet «rock». No
napi6ite speredi «little» i on stanet stolicey Arkanzasa (Little Rock).
A Arkanzas (Arkansas) — eto ne kov4eg (ark), no esli tol'ko radom net
Noa (Noah's Ark). «Zavetnaa cel' poiska — ponat', 4to xo4et
pol'zovatel'», — govorit Singal, — «poetomu nujno podbirat' ne slova, a
ix zna4enia».
I Google prodoljaet sover6enstvovat'sa. Nedavno poiskoviy injener Morin
Xeymans obnarujil problemu s zaprosom «Cindy Louise Greenslade».
Algoritm ponimaet, 4to emu nujno iskat' 4eloveka — v etom slu4ae eto
psixolog iz goroda Garden Grouv v Kalifornii, no razmestit' doma6nuu
strani4ku Grinsleyd v pervuu desatku rezul'tatov ne polu4alos'. Xeymans
obnarujil, 4to Google snijaet relevantost' ee stranici, tak kak
Grinsleyd ispol'zovala ne polnoe vtoroe ima, kak v poiskovom zaprose, a
tol'ko ego inicial. «Nam nujno u4itivat' i eto», — govorit Xeymans.
Poetomu on dobavil faktor, kotoriy i6et po inicialu vtorogo imeni.
Sey4as doma6naa stranica Grinsleyd na patom meste.
Sey4as desatki podobnix izmeneniy proxodat 4erez xoro6o otlajenniy
process testirovania. Sotni rabotnikov Google po vsemu miru za svoimi
doma6nimi komp'uterami ocenivaut rezul'tati razli4nix zaprosov,
otme4aa, kogda izmenenia v sisteme ulu46aut ili uxud6aut vida4u. No u
Google takje est' armia testirov6ikov — eto milliardi pol'zovateley,
kotorie nevol'no virtual'no u4astvuut v postoannom eksperimente nad
ka4estvom poiska. Kajdiy raz, kogda injeneri testiruut izmenenia, oni
zapuskaut noviy algoritm dla nebol'6ogo procenta slu4aynix
pol'zovateley, ispol'zua ix kak bol'6uu kontrol'nuu gruppu.
Issledovaniy izmeneniy nastol'ko mnogo, 4to Google pri6los' otkazat'sa
ot tradicionnogo nau4nogo principa — v odin moment vremeni doljen
provoditsa tol'ko odin eksperiment. «Po bol'6instvu zaprosov k Google
vi naxodites' v neskol'kix kontrol'nix ili eksperimental'nix gruppax
odnovremenno», — govorit injener po poiskovomu ka4estvu Patrik Rili i
zatem popravlaet seba — «po pravde govora, vse zaprosi vklu4eni v
kakoy-nibud' test». Drugimi slovami, kajdiy raz, kogda vi 4to-to i6ete
4erez Google, vi avlaetes' podopitnim krolikom.
Gibkost' — vozmojnost' dobavlat' novie faktori, obnovlenie koda i
odnovremennoe testirovanie rezul'tatov — vot 4to pozvolaet Google
utverjdat', 4to oni viderjat luboe sorevnovanie s Bing, ili s Twitter,
ili s Facebook. Na samom dele, za poslednie 6est' mesacev Google vvel
bolee 200 ulu46eniy, nekotorie iz kotorix kajutsa podrajaniami, esli ne
skazat' bol'6e, predlojeniy ix konkurentov. (Google govorit, 4to eto
prostoe sovpadenie, i obra6aet vnimanie na to, 4to novie osobennosti
dobavlautsa regularno uje mnogo let). Odno iz nix — eto poisk v rejime
real'nogo vremeni, s neterepniem ojidav6iysa s tex por, kak Peydj
zaavil neskol'ko mesacev nazad, 4to Google budet skanirovat' ves'
internet kajduu sekundu. Sey4as, kogda kto-to vvodit interesuu6iy ego
zapros, sredi desati sinix ssilok Google dobavlaet oblast' s
„poslednimi rezul'tatami“ — promativau6iysa spisok svejenapisannix
zapisey s novostnix resursov, blogov i mikroblogov. Dla etogo Google
e6e raz ispol'zuet faktori dla dobavlenia samix relevantnix zapisey v
neprerivno obnovlau6iysa potok. «Mi nabludaem za otvetami na zapisi, za
tem, skol'ko ludey 4itaut ix, opredelaem kto avtor — 4elovek ili
robot», — govorit Singal, — «mi znaem, kak eto opredelit', potomu 4to
mi zanimaemsa etim uje desat' let».
Vmeste s poiskom v rejime real'nogo vremeni Google predstavil drugie novie osobennosti, vklu4aa servis, nazvanniy Goggles,
kotoriy v processe poiska analiziruet fotografii s mobil'nix telefonov.
Eto — 4ast' neprekra6au6egosa dvijenia navstre4u postoannomu i
povsemestnomu prisutstviu poiska v jizni 4eloveka. S raspoznavaniem
obrazov i golosa smartfoni stali glazami i u6ami. Esli nayden
pravil'niy faktor, predmetom poiska mojet bit' 4to ugodno.
Grandioznaa vi4islitel'naa mo6nost' i propusknaa sposobnost' daet
Google neosporimoe preimu6estvo. Nekotorie nabludateli govorat, 4to eto
priemu6estvo sil'no zatrudnaet novim servisam put' ot testov do
rabo4ego rejima. No Menber govorit, 4to ne odna ifrastruktura sdelala
Google liderom: «O4en', o4en', o4en' vajnaa klu4evaa sostavlau6aa — eto
to, 4to mi nabiraem pravil'nix ludey».
Po vsem priznakam Ki Lu
otnositsa k odnim iz takix ludey. «A ispitivau k nemu ogromnoe
uvajenie», — govorit Menber, kotoriy rabotal s 48-letnim specialistom v
oblasti teorii vi4islitel'nix ma6in iz Yahoo. No Lu prisoedinilsa k
Microsoft v na4ale pro6logo goda dla togo 4tobi vozglavit' komandu
Bing. Kogda ego spra6ivaut o ego celax, Lu, miniaturniy muj4ina, odetiy
v djinsi i ruba6ku s logotipom Bing, tixo i razmerenno citiruet: „O4en'
vajno pomnit', 4to eto dolgoe pute6estvie“. Pri etom on smotrit kak Uma
Turman v fil'me „Ubit' Billa“ i ves' ego vid govorit «a ne sobiraus'
uxodit'».
Na samom dele, u kompanii, viigrav6ey brauzernuu voynu poslednego
desatiletia, otli4niy potencial dla xoro6ego poiska. V to je vrema eti
ludi obladaut sverxestestvennoy uverennost'u, oni jelaut bol'6e, 4em
mojet obespe4it' algoritm Google. «Esli paradigma ne izmenitsa, budet
o4en'-o4en' trudno sorevnovat'sa s segodna6nimi triumfatorami», —
govorit Garri 6am, glava razrabotki adra poiska v Microsoft. «No, s
drugoy storoni, paradigma mojet i izmenit'sa».
Tak ili ina4e, daje esli proizoydet podobnoe izmenenie, algoritm Google
mojet prisposobit'sa i k nemu. Vot po4emu Google — grozniy protivnik,
on postroil ma6inu, dostato4no bistruu dla togo, 4tobi u4est' po4ti
lubuu ugrozu, i poka 4to konkurentam ne4ego protivopostavit'
visokoka4estvennim rezul'tatam poiska Google. Luboy mojet predlojit'
noviy sposob pokupki biletov na samolet. No tol'ko Google znaet, kak
nayti Mayka Siveka.
|
|