Главный инженер Google Мэтт Каттс (Matt Cutts) написал в своем
блоге,
что поисковик усилил работу по избавлению пользователей от поискового
спама, который создают так называемые "контентные фермы" ("Контентные
фермы" (англ. content farms) - это сайты, наполненные
неоригинальным, либо автоматически сгенерированным содержимым). Каттс отметил, что несмотря на активную борьбу команды Google
со спамом, за последний месяц его количество заметно увеличилось. Ну а
так как доля "чистого веб-спама" со временем уменьшается, Google решил
сосредоточиться на борьбе с "контентными фермами". "В 2010 году, мы
внесли два значительных изменения в алгоритмы, сфокусированные на
низкосортных сайтах, - пишет Каттс. - Тем не менее, мы до сих пор
слышим громкие просьбы усилить противодействие сайтам, содержащим
преимущественно спам и низкокачественный контент". В Google вновь
изменили алгоритм поиска, в результате чего понизилось ранжирование
сайтов, копирующих чужой контент. Позднее в своем блоге Каттс
написал, что изменения в алгоритме коснутся не более 2% запросов.
"Общий эффект состоит в том, что пользователи с большей вероятностью
увидят сайты с оригинальным контентом, а не сайты, собирающие или
копирующие контент с сайтов-оригиналов", - отметил он.
К сожалению, главный инженер Google не стал уточнять, каким образом
поисковик будет определять уникальность контента, как отнесется к
"зеркалам" с сайтов и что будет с крупными трастовыми сайтами, если те
копируют содержимое небольших блогов.
Изменения в поисковом алгоритме Google активно обсуждаются в Интернете.
Например, на Хабрахабре рассказывают, что под новый фильтр попадают
не только "контентные фермы", но и интернет-магазины, нарушающие правила
поискового сервиса, а также "взломанные" нормальные сайты. В целом
инициатива Google встречена положительно, так как сайты-пустышки и
"контентные фермы" последнее время сильно засорили Интернет. С другой
стороны, некоторые комментаторы считают, что борьба с "контентными
фермами" заранее обречена на провал, так как любой может скопировать,
например, содержание Википедии, убрать посторонние ссылки (которые в
текстах Вики встречаются повсеместно) и выложить на свой сайт. По-идее,
такая страница будет выглядеть для поискового робота лучше, чем оригинал.
Кроме того, до сих пор непонятно, каким образом Google будет определять
первоисточник информации, копирайтеры беспокоятся, что в случае, если
крупный портал с высоким PR станет копировать информацию с небольших
сайтов или блогов, то поисковик именно его будет считать сайтом с
оригинальной информацией.
Напомним, у Google и ранее работали фильтры, призванные пресечь
деятельность "контентных ферм".
Duplicate Content Filter накладывается на сайты, заподозренные в
краже чужого контента. Как правило, подобные сайты находятся на низких
позициях в выдаче, а их содержание относится к дополнительным результатам
поиска (supplementary results).
Omitted Results Filter обращает внимание на страницы, содержание
которых в точности (включая теги title, description и т.д.) совпадает с
контентом страниц оригинального сайта. В принципе, эти страницы могут
попасть в выдачу, если пользователь при запросе активирует опцию
расширенного поиска "show omitted results".
Google для защиты интеллектуальной собственности объявил борьбу не
только "контентным фермам", но и файлообменным сервисам и
торрент-трекерам. Google удалил из саджестов и мгновенных результатов поиска
Instant Search термины, которые напрямую ассоциируются с торрентами, в
первую очередь это словосочетания, содержащие слова “torrent”,
“BitTorrent”, “RapidShare” и их производные.
Нововведение вызвало неоднозначную реакцию в Интернете: с одной стороны,
борьба за авторские права только приветствуется, а удаление из саджестов
словосочетаний, связанных с торрентами, можно считать реверансом Google в
сторону правообладателей. С другой стороны, пока непонятно, будет ли
какая-нибудь польза от нововведения поисковика. Дело в том, что с
введением запрета из мгновенных результатов поиска исчезли и вполне
легальные сайты, имеющие в своих названиях "torrent", в то время как
названия множества нелегальных торрент-трекеров продолжают открываться в
саджестах. Кроме того, хотя ряд сайтов исчез из подсказок, это вряд ли
помешает желающим что-то скачать, так как результаты поиска по
вышеназванным словосочетаниям ничуть не изменились.