Официально поисковая машина Yandex.Ru была анонсирована 23 сентября 1997 года. На сегодняшний день Yandex имеет самую большую в русской сети поисковую базу (проиндексировано 20 млн документов объемом более 200 Гб). Шестого июня 2000 г. компания "Яндекс" на сервере www.yandex.ru представляет новую версию своей поисковой машины. Теперь поиск осуществляется не только по веб-страницам, но и по специализированным массивам данных.
Отличительные особенности Yandex - поиск на естественном языке, большая и актуальная база данных страниц русского Интернета, интеграция машины поиска с интернет-каталогом, изучение запросов пользователей, вспомогательные службы.
Простой поиск
Поиск происходит с учетом морфологии русского языка, например: "идет"= идет, идут, идти, шел, шла и т.д. Если необходимо осуществить поиск по точной словоформе, то перед ним ставится знак "!" (без пробела). Различаются слова, набранные строчными и прописными буквами. По умолчанию ищутся документы, содержащие хотя бы одно слово запроса. "+" делает наличие ключевого слова в документе обязательным. "-" перед словом исключает документы, которые его содержат. Поддерживается поиск по фразе. Фраза заключается в кавычки. Яндекс поддерживает собственную систему обозначений булевых операторов:
Синтаксис
Что означает оператор
Пример запроса
пробел или &
логическое И (в пределах предложения)
лечебная физкультура
&&
логическое И (в пределах документа)
рецепты && (плавленный сыр)
|
логическое ИЛИ
фото | фотография | снимок | фотоизображение
( )
группирование слов
(технология | изготовление) (сыра | творога)
~
бинарный оператор И НЕ (в пределах предложения)
банки ~ закон
~~
бинарный оператор И НЕ (в пределах документа)
путеводитель по парижу ~~ (агентство | тур)
/(n m)
расстояние в словах (-назад +вперед)
поставщики /2 кофемузыкальное /(-2 4) образованиевакансии ~ /+1 студентов
&&/(n m)
расстояние в предложениях (-назад +вперед)
банк && /1 налоги
Также поддерживаются следующие специальные операторы для поиска в опреденных областях html-документов:
Синтаксис
Что означает оператор
Пример запроса
$title (выражение)
поиск в заголовке
$title (CompTek)
$anchor (выражение)
поиск в тексте ссылок
$anchor (CompTek | Dialogic)
#keywords=(выражение)
поиск в ключевых словах
#keywords=(поисковая система)
#abstract=(выражение)
поиск в описании
#abstract=(семиотика | знак)
#image="значение"
поиск файла изображения
#image="tort*"
#hint=(выражение)
поиск в подписях к изображениям
#hint=(памятник)
#url="значение"
поиск на заданном сайте (странице)
#url="www.comptek.ru*"
#link="значение"
поиск ссылок на заданный URL
#link="www.yandex.ru*"
Яндекс поддреживает специальные операторы, которые могут влиять на ранжирование результатов поиска. При поиске для каждого найденного документа Яндекс вычисляет величину релевантности (соответствия) содержания этого документа поисковому запросу. Список найденных документов перед выдачей пользователю сортируется по этой величине в порядке убывания. Релевантность документа зависит от ряда факторов, в том числе от частотных характеристик искомых слов, веса слова или выражения, близости искомых слов в тексте документа друг к другу и т.д.
Задание веса слова или выражения применяется для того, чтобы увеличить релевантность документов, cодержащих "взвешенное" выражение. Для этого используется специальные оператор ":число"
Оператор
Пример
Пояснение
слово:число(поисковое_выражение):число
"знаковые системы" семиотика:5
Будут найдены документы, содержащие фразу "знаковые системы" и слово "семиотика", но чем в документе чаще встречается слово "семиотика", тем выше он окажется к началу списка результатов
На странице простого поиска имеется строка для ввода ключевых слов, а также дополнительные опции, позволяющие уже на начальном этапе уточнить область поиска с помощью селекторных кнопок. Ниспадающее меню справа позволяет производить поиск как во всем российском Интернете, так и в его регионах и государствах ближнего зарубежья Искать в категориях: возможность тематического ограничения области поиска благодаря интеграции с каталогом List.ru (http://www.list.ru).
Расширенный поиск
Словарный фильтр - первая область уточнения на странице расширенного поиска Ниспадающее меню слева:
обязательно - слово должно присутствовать в документе желательно - наличе слова не обязательно, но если оно есть, документы с ним ранжируются выше исключить - слово не должно присутствовать в документе операторы - ввод запроса с использованием поисковых операторов Яндекса
Ниспадающее меню центре:
все формы - задание поиска слова с учетом всех его словоформ точная форма - так как оно введено Ниспадающее меню справа: ограничение поиска опреденной областью документа: предложение, документ, фраза, заголовок, аннотация, ссылка, адрес.
Дата - задание ограничения по дате появления документа в сети Интернет: либо за определенный период времени: любой, последние две недели, последний месяц и т.д., либо до или после опреденной даты. Сайт/вершина - ограничение области поиска конкретным сайтом и исключение сайта из поиска Ссылка - возможность искать/исключить из поиска страницы со ссылками на данный URL Изображение - искать страницы со ссылками на файлы картинок/картинку с подписью. Специальные объекты - поиск специальных объектов в структуре html-документа: скрипт, аплет, объект, стиль. Язык - поиск документов на русском языке или латинице. Формат выдачи - задание формата выдачи документа: полный, краткий, только URL и количества ссылок на странице с результатами (от 10 до 100). Поиск по регионам - ограничение области поиска несколькими географическими регионами.
Результаты поиска
Результаты поиска представлены в виде заголовка документа, первого предложения из текста, URL-адреса документа и его размера в килобайтах. По умолчанию результаты поиска выводятся в сгруппированном по сайтам виде и в порядке убывания степени релевантности. Ссылки "по дате" и "по страницам" позволяют прергруппировать результаты поиска.
Найденные документы могут иметь пометки "совпадение фразы", "строгое соответствие" или "нестрогое соответствие" (по мере убывания релевантности). "Нестрогие" документы отделены от прочих горизонтальной серой линией. Если первым же найденным оказывается документ с подписью "нестрогое соответствие" (выделено красным), возможно, это значит, что стоит переформулировать запрос.
При группировке по серверам у каждого найденного документа есть ссылка "Все с сервера" - запрос на получение всех страниц этого сервера, соответствующих запросу. "Найти похожие документы" - Если один из найденных документов ближе к искомой теме, чем остальные, можно нажать на ссылку "найти похожие документы" (она расположена под кратким описанием этого документа). Яndex проанализирует страницу и найдет документы, похожие на указанный. В конце каждой страницы с результатами поиска находятся ссылки Поискать то же самое на: AltaVista - Rambler - Апорт! - List.ru - @RUS - К&М Возможно, такая ссылка будет полезна, если поисковый запрос не принес желаемых результатов. Запрос будет передан в другие поисковые системы и каталоги.
Внизу страницы располоены также ссылки на результаты поиска в новостных лентах информационных и интернет-магазинах (выводится только при точном соответствии запросу).
Справа на странице результатов расположены ссылки на соответствиующие разделы тематического каталога List.ru. nlr.ru/res/inv/ic_old/yandex.htm