Психологи помогают людям бороться с их проблемами, принимать правильные решения. Поисковые машины по большому счету делают то же самое — помогают делать правильный выбор Официальная должность Дугласа Меррилла — вице-президент Google по разработкам. Но по факту он IT-директор этой компании. Интересно, что у этого IT-директора нет технического образования, зато есть докторская степень по психологии. Впрочем, название специализации Меррилла звучит вполне технически — «искусственный интеллект». Самого вице-президента мало смущает противоречие между его работой и научной степенью: «Психологи помогают людям бороться с их проблемами, принимать правильные решения. Поисковые машины по большому счету делают то же самое — помогают делать правильный выбор».
НАЙДЕТСЯ ВСЕ Ближайшие 20 лет будут очень интересными в развитии поисковых технологий, уверяет Меррилл. «Почти 10 лет назад, в 1998 г., когда возникла Google, все решили, что проблема поиска в Сети решена, — вспоминает он. — Дескать, надо просто описывать каждый новый сайт несколькими ключевыми словами, и этого будет достаточно для полноценного интернет-серфинга». Между тем каждый месяц содержание англоязычного Интернета меняется на 10%. «Чтобы индексировать все новые сайты, да еще и на сотне языков, нужно, чтобы ваш штат удваивался каждый год, а население нескольких стран работало только на вас», — говорит Меррилл. Чтобы выдавать точные результаты, эффективнее и интереснее анализировать то, как пользователи ведут поиск в Сети. Если, забив в поисковик слово «Африка», они остановились на каком-то сайте, значит, тот рассказывает об Африке. Чем больше людей сделают то же самое, тем выше в результатах поиска будет этот сайт. «Может, для кого-то это звучит примитивно, — говорит вице-президент Google, — но будущее поиска связано именно с методичным изучением поведения интернет-пользователей. Не стоит изобретать велосипед и заставлять людей самих описывать все новые сайты, которые они посещают». А что же распиаренная концепия Web 2.0, которая как раз предполагает максимальное участие самих пользователей? «Web 2.0 — великий феномен, — отвечает Меррилл, — но сообщества пользователей не смогут заменить огромные компьютеры, которые ежесекундно запоминают и анализируют путь пользователя в Интернете». Благодаря тем огромным массивам информации о посетителях Сети, которые глобальные поисковики ежедневно получают в свое распоряжение, неуклонно будет расти их преимущество перед небольшими интернет-компаниями. С другой стороны, локальные поисковики порой обладают лучшей релевантностью поиска, потому что говорят с пользователями на их языке. Но первоклассное владение морфологией нескольких десятков мировых языков для глобальных поисковиков — это, можно сказать, задача вчерашнего дня. Важно не просто понимать язык пользователя, важно помочь ему найти информацию на языке, которого он не знает. Например, перевести запрос китайского студента о творчестве Ганди на хинди, чтобы он мог получить доступ к индийской части Интернета. Уже сейчас, забив в строку поиска Pushkin, любой англичанин найдет слова стихотворения «Я помню чудное мгновенье…» на русском. А через несколько лет эти строки будут доступны ему уже на английском. В мире, который все больше похож на глобальную деревню, такой перевод будет все больше востребован, уверяет Меррилл. Поисковики буквально на глазах будут становиться все умнее и умнее. Они станут не только переводить слова, но и учитывать местную специфику запроса. Американец и русский получат разные результаты, забив в строку поиска слово «футбол», ведь первый, скорее всего, будет иметь в виду национальную игру с продолговатым мячом. Это вовсе не значит, что поисковик будет обладать искусственным интеллектом, который и подскажет ему такой алгоритм. Как кропотливые муравьи, каждый день миллионы пользователей будут сами находить связи между разными кусками Сети. Поисковику останется лишь фиксировать их. Самое важное для поисковиков в будущем — научиться интерпретировать запросы пользователей на базе имеющихся данных. Понимать, к примеру, что, когда пользователь ищет «самую большую гору в мире», он имеет в виду не ее вес, а высоту. ПОНЯТЬ КЛИЕНТА Чтобы быть успешным в будущем, Google надо собирать все больше информации о своих пользователях, лучше понимать их запросы. У наблюдателей это вызывает множество опасений: компания сама может злоупотреблять подобными сведениями и продавать их на рынке, а может стать жертвой хакеров. Меррилл указывает, что хакеры угрожают любой IT-компании. А Google особенно тщательно заботится о защите своих данных. Компания даже не сообщает о количестве и точном местоположении серверов, на которых хранится такая информация. Также, по словам Меррилла, речи не идет о том, чтобы в будущем торговать данными о своих пользователях: «Иначе кто станет искать через нас информацию?» В ближайшие годы, уверяет он, утихнут и споры вокруг вторжения поисковиков в область чужой интеллектуальной собственности. За последние два года Google много раз обвиняли в нарушении авторских прав. Сначала это были американские литературные ассоциации, протестовавшие против проекта Google Book Search, который позволяет вести поиск по книжным текстам. Потом протестовали издатели газет, журналов и новостных агентств. Последние обвиняли компанию в том, что она лишает их части прибыли, собирая в своем разделе «Новости» самые свежие и интересные тексты. Скоро и те и другие осознают, надеется Меррилл, что поисковики не размещают на этих страницах рекламы и скорее приводят к ним читателей, а не отбирают. Ксения Болецкая smoney.ru/article.shtml?2007/11/26/4493
|