СЕЙЧАС НЕ АКТИВЕН, ИНФОРМАЦИЯ ВЗЯТА ИЗ ПРОШЛЫХ НАБЛЮДЕНИЙ.

Первыми, кто запатентовал систему учета внешних ссылок, стала компания Google. Алгоритм получил название PageRank.

PageRank – это алгоритм расчета «авторитетности» страницы, а также сам показатель «авторитетности» в числовом выражении. PageRank рассчитывается для каждой веб-страницы отдельно, и определяется PageRank’ом (цитируемостью) ссылающихся на нее страниц. Своего рода замкнутый круг.

Google существует давно – Smart Sites

Во втором случае значение PageRank есть число, характеризующее исключительно голосующую способность всех входящих ссылок на страницу и то, как сильно они рекомендуют эту страницу.

Когда все другие факторы, такие как тэг <title> и ключевые слова, учтены, Google использует PageRank, чтобы откорректировать результаты так, что более «важные» сайты поднимутся соответственно вверх на странице результатов поиска пользователя. Т.о., порядок ранжирования в Google работает следующим образом:

  1. Найти все страницы, соответствующие ключевым словам поиска.
  2. Отранжировать соответственно «страничным факторам», таким, как ключевые слова.
  3. Учесть текст ссылок на страницы.
  4. Откорректировать результаты данными PageRank.

Как определяется PageRank?

Теория Google гласит, что если Страница A ссылается на Страницу В, то Страница А считает, что Страница B – важная страница. Текст ссылки не используется в PageRank. PageRank также влияет на важность ссылок на страницу. Если на страницу указывают много важных ссылок, то ее ссылки на другие страницы также становятся более важными.

В качестве критерия, выражающего важность страницы, была выбрана теоретическая посещаемость страницы.

Google PageRank – Smart Sites

Рассмотрим модель путешествия пользователя по сети путем перехода по ссылкам. Предполагается, что пользователь начинает просмотр сайтов с некоторой случайно выбранной страницы. Затем по ссылкам он переходит на другие ресурсы. При этом есть вероятность того, что посетитель покинет сайт и вновь начнет просмотр документов со случайной страницы (в алгоритме PageRank вероятность такого действия принята 0,15 на каждом шаге). Соответственно, с вероятностью 0,85 он продолжит путешествие, перейдя по одной из доступных на текущей странице ссылок (все ссылки при этом равноправны). Продолжая путешествие до бесконечности, он побывает на популярных страницах много раз, а на малоизвестных – меньше.

Таким образом, PageRank веб-страницы определяется как вероятность нахождения пользователя на данной веб-странице; при этом сумма вероятностей по всем веб-страницам сети равна единице, так как пользователь обязательно находится на какой-либо странице.

Поскольку оперировать вероятностями не всегда удобно, то после ряда преобразований с PageRank можно работать в виде конкретных чисел (как, например, мы привыкли видеть его в Google ToolBar, где каждая страница имеет PageRank от 0 до 10).

Google PR – Smart Sites

Согласно описанной выше модели получаем, что:

  • Каждая страница в сети (даже если на нее нет внешних ссылок), проиндексированная Google, изначально имеет ненулевой PageRank (хотя и очень маленький);
  • Каждая страница, имеющая исходящие ссылки, передает часть своего PageRank страницам, на которые ссылается. При этом переданный PageRank обратно пропорционален числу ссылок на странице – чем больше ссылок, тем меньший PageRank передается по каждой. Таким образом, внутренние ссылки сайта учитываются при расчете веса PageRank для других страниц сайта.
  • PageRank передается не полностью, на каждом шаге происходит затухание (та самая вероятность 15%, когда пользователь начинает просмотр с новой, случайно выбранной страницы).

Насколько важен PageRank?

Когда Гугл только появился, можно было с уверенностью сказать, что ссылка была точным признаком рекомендации. Однако, в настоящее время это больше не так по двум очень важным причинам:

  1. Интернет существенно изменился. Ссылка сегодня – это, скорее лишь связанный сайт, лицензионное требование или ответная услуга (как перекрестные ссылки), чем истинная рекомендация.
  2. Как только вы создадите поисковую машину, которая рассматривает ссылки как рекомендации, люди начнут пытаться воздействовать на ссылки. Как только они станут воздействовать на них, ссылки перестанут быть рекомендациями.

Поэтому надежность информации, обеспечиваемой ссылками, не обязательно хороша, и она постоянно уменьшается. Это является причиной низкой и все время уменьшающейся важности PageRank в алгоритме ранжирования Google.

Тем не менее, у PageRank есть одно реабилитирующее его свойство. На него трудней влиять, чем на любой другой фактор ранжирования. Это означает, что у PageRank есть возможность дать вам преимущество перед конкурентами, когда он использован в комбинации с другими приемами оптимизации для поисковых машин.

Рассмотрим теперь, каким образом PageRank может влиять на ранжирование результатов поиска (говорим «может», так как в чистом виде PageRank уже давно не участвует в алгоритме Google, как это было раньше). С влиянием PageRank все обстоит очень просто – после того, как поисковая система нашла ряд релевантных документов (используя текстовые критерии), отсортировать их можно согласно PageRank – так как логично будет предположить, что документ, имеющий большее число качественных внешних ссылок, содержит наиболее ценную информацию.

Таким образом, алгоритм PageRank «вытесняет» наверх в поиске те документы, которые и без поисковика наиболее популярны.

В настоящее время PageRank не используется непосредственно в алгоритме Google. Это и понятно – ведь PageRank характеризует лишь количество и качество внешних ссылок на сайт, но совершенно не учитывает ссылочный текст и информационное содержимое ссылающихся страниц – а именно этим факторам придается максимальное значение при ранжировании. Предполагается, что для ранжирования Google использует так называемый тематический PageRank (то есть учитывающий только ссылки с тематически связанных страниц), однако детали этого алгоритма известны лишь разработчикам Google.

Значения PageRank

Узнать значение PageRank для любой веб-страницы можно с помощью Google ToolBar, который показывает значение PageRank в диапазоне от 0 до 10.

ToolBar Google имеет ряд ограничений:

  1. Временами ToolBar определяет вес приблизительно. Если открыть страницу, которой нет в индексе Google, но есть страница, очень близкая к ней в индексе, то ToolBar отобразит свое предположение о весе PageRank. Эта догадка бесполезна для наших целей, потому что она не представлена ни в каких вычислениях PageRank. Единственный способ выяснить, использует ли ToolBar догадку, это ввести URL в поисковую форму Google и увидеть, появится ли страница. Если нет, значит, он предполагает!
  2. Значения PageRank, показываемые в Google ToolBar, пересчитываются достаточно редко (раз в несколько месяцев), поэтому ToolBar показывает в некотором роде устаревшую информацию. То есть сама поисковая система Google учитывает изменения во внешних ссылках гораздо быстрее, чем эти изменения отображаются в Google ToolBar.
  3. ToolBar дает только представление реального веса PageRank: он показывает не точное значение PageRank, а лишь диапазон PageRank, в который попадает сайт, причем номер диапазона (от 0 до 10) определяется по логарифмической шкале. Поясним на примере: каждая страница имеет точное значение PageRank, известное только Google. Для определения нужного диапазона и вывода информации на ToolBar используется логарифмическая шкала (пример показан в таблице):
Реальное значение PR Значение ToolBar
1-10 1
10-100 2
100-1000 3
1000-10 000 4

Все цифры условны, однако наглядно демонстрируют, что диапазоны PageRank, показываемые в Google ToolBar, не равнозначны друг другу. Например, поднять PageRank c 1 до 2 легко, а с 6 до 7 гораздо сложнее.

Красивый Google – Smart Sites

Зачем нужен PageRank?

На практике PageRank используется в основном в двух целях:

  1. Быстрая оценка уровня раскрученности сайта. PageRank не дает точной информации о ссылающихся страницах, но позволяет быстро и просто «прикинуть» уровень развития сайта. Для англоязычных сайтов можно придерживаться следующей градации: PR 4 – 5 – наиболее типичный PR для большинства сайтов средней раскрученности. PR 6 – очень хорошо раскрученный сайт. PR 7 – величина, практически недостижимая для обычного вебмастера, но иногда встречается. PR 8, 9, 10 – встречаются только у сайтов крупных компаний (Microsoft, Google и т.п.). Знание PageRank можно использовать при обмене ссылками, для того чтобы оценить качество предложенной к обмену страницы и в других подобных ситуациях.
  2. Оценка уровня конкуренции по поисковому запросу. Хотя PageRank и не используется непосредственно в алгоритмах ранжирования, тем не менее позволяет косвенно оценить конкурентность заданного запроса. Например, если в выдаче поисковой системы стоят сайты с PageRank 6-7, то сайт с PageRank 4 имеет очень мало шансов подняться в топ.

Зачем нужен Google? Smart Sites.

Возврат к списку