| Вначале давайте вспомним, почему слова вроде VisitedRank или TrustRank так
волнуют интернет-общественность. Все помнят, что только благодаря высокому
качеству поиска когда-то Google потеснил на рынке “старичков”. Это относительно
высокое качество поиска было связано с алгоритмом PageRank. Теперь же, когда
поисковики захлёбываются от спама, все “по аналогии” ждут нового лидера, а
вместе с ним и нового алгоритма. Среди разнообразных ранков VisitedRank (или
ViewPank) вспоминают особенно часто. Алгоритм VisitedRank нельзя назвать ни
новым, ни оригинальным. Он не нов, к примеру еще в 2002м году его обсуждали Грей и
Коваленко под видом “коэффициент популярности”. А неоригинален он, т.к.
является неким отражением PageRank`а, т.е. если PageRank меряет вероятность
попадания посетителя на страницу априори (до опыта, т.е. до визита), то
VisitedRank уже меряет ее апостериори (после опыта, т.е. после визита). В теории
эти 2 показателя должны рисовать одинаковые картины мира (точнее веба), ну а на
практике в вебе есть здоровенные области с “темной материей”, которые поисковики
не могут наблюдать, есть флешмобы, акции вирусного маркетинга и многое другое,
что отклоняет реальную популярность страниц (VisitedRank) от рассчитаной
(PageRank). Параллельный учет этих двух показателей мог бы корректировать
погрешности и накрутки.
Как поисковики могут мерять популярность страниц у
посетителей? Самое простое - с помощью тулбаров, которые они так назойливо
впаривают посетителям. Этот вариант придуман Алексой (см. ее Traffic Rankings). Сейчас
применяется в Гуглевом тулбаре - взамен показывается PageRank страницы, в
Ядекс.Баре - взамен показывается ТИЦ, а также в Рамблер Ассистенте (отправляет
запросы вида get.assist.rambler.ru/stat/hit.gif?link=http://mydomain.com/ ) и
тулбаре LiveInternet (запросы вида
toolbar.li.ru/cgi-bin/tbr.html?width=0&affil_id=toolbar_setup&url=http://mydomain.com/)
- взамен ничего не показывается =). Запросы последних 2х проверял снифером
сам. Мне кажется, что у больших поисковиков есть еще одна возможность
мониторить популярность тех или иных сайтов - договориться с производителями
браузеров. Понятно, что Live.com c IE7 “договорятся” легко, ну а Гугл с Мозиллой
и так на короткой ноге. Речь идет об антифишинговых фильтрах. И здесь уже у
“больших пацанов” все готово, остается только сменить деволтовый байтик в
следующем обновлении. В IE7 достаточно перевести опцию “Phishing FilterTurn of
automatic website checking” в положение “Turn on” и информация о каждом хите
польется на нужный сайт, а в Firefox`е версии 2 и выше достаточно опцию
browser.safebrowsing.remoteLookups сменить с false на true и информация о хитах
пойдет по адресу, который указан в другой опции -
browser.safebrowsing.provider.0.lookupURL, а пока у вас один антифишинговый
провайдер (дефолтовый), то адрес в этом lookupURL примерно такой:
http://sb.google.com/safebrowsing/lookup?… Отдельно стоит упомянуть Оперу. Она,
кажется, с девятой версии и так сливает информацию о хитах на
sitecheck.opera.com (тоже проверял), т.е. с ней можно просто договориться, как
договаривались с ней ранее о дефолтовом встроенном поисковике.
Есть еще одна
мысль, о том, какую пользу поисковики смогут извлечь из статистики посещений
сайтов. Имея количество хитов и посетителей по сайтам, можно посчитать отношение
первых ко вторым, т.е. получим качество ресурсов. Ну а это уже весомый аргумент
в общем алгоритме ранжирования SERP, который из графа ссылок никак не
получишь.
|
|