Компания Реаспект разработала новую оценку спамности доноров. Она в
большей мере отражает степень спамности доноров, т.к. использует при
анализе оценку оптимизированности анкоров. Собственно, во многом именно
на основе анализа анкоров поисковые системы делают вывод о спамности
ссылок (тот же «Мадридский доклад» и метрику «SEO-text»).
Метрика исходящих хостов на страницу (ссылок на страницу)
Пообщавшись с большим количеством SEO-специалистов, мы поняли, что
сегодня часто используется простая метрика «ссылок на страницу» или
«хостов на страницу». Её смысл: «Чем больше донор имеет ссылок на уникальные хосты, и чем меньше у него страниц, тем он спамнее».
Так же часто для расчёта качества донора некоторые специалисты
используют количество входящих ссылок на донор, их посещаемость и т.п.
То есть вся оценка о КАЧЕСТВЕ сводится к оперированию данных о
КОЛИЧЕСТВЕ (доноров, получателей, посетителей и кучей других
количественных метрик).
Мы задумались. Посмотрим со стороны поисковых систем. Поисковые
системы не борются со ссылками. Они борются с псевдо-ссылками. Они не
борются с сайтами, на которых много исходящих ссылок. Они борются с
сайтами, на которых много псевдо-ссылок для манипулирования их
алгоритмами.
Поэтому оперировать ТОЛЬКО количественной информацией при оценке
спамности донора – всё-таки не совсем правильный подход. При проведении
прошлого исследования
по выявлению различных признаков коммерческих и некоммерческих анкоров,
мы проанализировали множество анкор-листов сайтов, не продающих ссылки.
Сайт, не продающий ссылки, по данной метрике может оказаться очень
спамным. Хотя, с точки зрения поисковой системы, это должен быть вполне
«чистый» источник данных (с которых часто ссылаются на википедию,
популярные форумы, хостинги изображений и т.п.).
Метрика оптимизированности анкор-листа
Мы решили оценить степень спамности доноров оценивая
оптимизированность их исходящих анкор-листов. Применили простую
эвристику, основная суть которой заключается в учёте количества:
- безанкорных ссылок (ссылок-картинок и урловых ссылок – http://; в спамных анкор-листах их доля обычно слишком низкая),
- анкорных коммерческих ссылок (те слова и фразы, которые наиболее
часто содержатся в коммерческих ссылках – выявлены так же по результатам
прошлого исследования),
- хостов-получателей – в качестве понижающего коэффициента (если их
500 и более – коэффициент равен 1; если хостов-получателей 1, то
коэффициент стремится к нулю).
Данные факторы учавствуют в формуле в виде различных степенных логарифмических функций. Сами функции подбирались эмпирически.
Полученная формула показывает достаточно хорошую эффективность
оценки спамности анкор-листов. Ручная оценка специалистом и оценка
сервиса, использующего эту эвристику, совпадает минимум в 90% случаев. В
то время, как оценки, использующие в основе метрику «исходящих хостов
на страницу» совпадают с оценкой специалиста существенно реже (50-60%).
Этот же сервис мы смогли применить не только для оценки спамности
исходящих анкор-листов. Но и оценки заспамленности акцепторов (входящих
анкор-листов) – сайтов, которые находятся в активном продвижении.
Пример данных из нашего сервиса:
При желании, в формулу можно добавить и некоторые другие показатели
(например, посещаемость, цитируемость, упоминаемость донора в качестве
дисконтирующих коэффициентов).
В целом, идея достаточно простая и построена по логике поисковых систем. Пользуйтесь:)
|