Алгоритм от Яндекса – YATI

Алгоритм от Яндекса – YATI
Smart Sites
Февраль 10, 2021г.
Алгоритм от Яндекса – YATI – блог Smart Sites

В сегодняшнем выпуске нашего SEO блога мы бы хотели поговорить о новом алгоритме Яндекса, который запустился в 2020 году – «YATI». Расскажем, как он влияет на поисковую оптимизацию. Как к нему адаптироваться и нужно ли это делать вообще? Также попытаемся разобрать ряд теоретических положений, посвященных происхождению этого алгоритма, какие шаги сделали поисковая система, чтобы к нему прийти. И поразмышляем над вопросом: «Яндекс или Google – поисковик, который задаёт тренды ранжирования?». Работы на сегодня много, как вы видите, давайте начинать!

Что такое YATI

В 2020 году специалисты Яндекс анонсировали одно крупное изменение алгоритма, это была технология YATI – «архитектура нейросетей-трансформеров», которая призвана повысить качество понимания «смысла» текста с точки зрения поисковой системы, отзеркаливая на поведение рядового пользователя.

Аббревиатура YATI является сокращением английской формулировки Yet Another Transformer with Improvements (дословно от Яндекс Переводчик: «еще один трансформатор с улучшениями»). То есть это некая система и называется трансформатор, на основе нейросетей (а как мы помним все поисковые системы работает по принципу «чёрного ящика»), с определенными улучшениями. Она предложена Яндексом в качестве доработки архитектуры трансформеров, которая достаточно широко используется для решения задач компьютерной лингвистики и понимания естественного языка.

По большому счету, в этом нет ничего суперсложного. В разрезе SEO – это новый фактор, который играет существенную роль в ранжировании. Что такое нейронные сети? В этом тоже нет ничего запредельного. Это некий метод машинного обучения, способ извлечения из машины знаний, исходя из загруженной информации. Кроме того, это попытка оценки «смысла» страницы и ее близости запросу.

А что было раньше?

Поисковая система Яндекс вплоть до 2016 года не учитывала примерно 95% всей текстовой информации на страницах сайта, сами факторы существовали, но просто таков был их принцип работы. Естественно специалисты Яндекс хотели большего, т.к. видели большое количество накруток со стороны веб-мастеров рассчитанные на воздействие именно на текстовый фактор ранжирования, но это были скорее попытки, и поисковая система систем видела текст приблизительно так:

Текстовый вид страницы – SEO блог Smart Sites

Алгоритмы Яндекса до YATI

То, что подсвечено жёлтым поисковая система воспринимает и потенциально учитывает в ранжировании по запросу «продвижение». Но при этом мы можем наблюдать, что большая часть текста, который находится на картинке без цветного выделения, и поисковая система не брала во внимание этот текст, окружающий ключевые фразы.

В этом и заключается основная проблема – поисковая система Яндекс не могла извлекать из текста всю информацию, которая в нем содержалась. Это послужило толчком к развитию технологий нейронных сетей, и на текущий момент она уже достаточно развилась.

Что такое YATI?

Мы хотели бы разобрать 5 основных вопросов, связанных с изучением нового алгоритма Яндекса, запущенного в 2020 году:

  1. Чем отличаются регулярные изменения от Core Update (алгоритм YATI относится к категории Core Update).
  2. Как используются нейронные сети в алгоритмах ранжирования.
  3. Поговорим об отличиях и сходствах подходов BERT (Bidirectional Encoder Representations from Transformers), который запущен в Google, и YATI.
  4. Коснемся актуальной темы, которая волнует многих SEO-специалистов – сможет ли новый алгоритм победить накрутку поведенческих факторов.
  5. Дадим несколько практических рекомендаций маркетологам, владельцам бизнеса и SEO-специалистам.

Общая картина в Яндексе за 2020 год

Колебания поискового трафика – SEO блог Smart Sites

Хорошей новостью, что сейчас есть возможность различать некоторые регулярные изменения, которые постоянно происходят и анонсируются в поиске. Только Google за один 2018 год произвел порядка 300 изменений. В Яндексе, в связи с меньшим штатом инженеров, количество более скромное, но сопоставимое. Наряду с этим есть фундаментальные изменения, и Core Update, как правило, затрагивает большую долю поисковых запросов. Эти изменения часто связаны с переобучением алгоритма или с изменением подхода и новыми идеями, затрагивают фундаментальные принципы ранжирования.

Изменение, переход от одного к другому – SEO блог Smart Sites

Изменения алгоритмов

Анонсируются эти Core Update в разных поисковых системах по-разному. Например, в Google Дэнни Салливан емко рассказал о последних нововведениях 2020 в своем блоге.

Анонсы в Google – SEO блог Smart Sites

Яндекс по факту не анонсирует запуски, но часто раскрывает больше деталей на русском языке в статьях на Habr или еще где-то.

Все материалы про адаптацию к алгоритму BERT и его запуск был в открытых источниках. У всех пользователей всегда есть возможность понять, каким образом люди приходят к тем или иным идеям, погрузиться в эти факторы глобально.

По факту Яндекс анонсировал запуск нового алгоритма в ноябре, но в ноябре не было никаких изломов средних показателей выдачи.

Колебания выдачи в Яндексе

При небольших штормах выдачи ситуация постоянно меняется, но происходит это достаточно плавно. Когда запускается новый алгоритм, как правило, происходят большие изменения многих показателей, буквально их «скачок» как в плюс, так и в минус. К примеру, средний возраст документов в выдаче или средняя длина URL-адресов, доля доменных зон выдачи – усредненные показатели, которые не часто меняются.

Есть предположения, что реальная дата запуска YATI отличная от прогнозируемой была «размазана» во времени. Скорее всего, это был конец сентября, косвенно об этом говорит один из разработчиков – глава нейросетевых технологий в Яндексе. То есть мы уже давно живем в новых реалиях с новым алгоритмом Яндекса.

Нейросети Яндекс – SEO блог Smart Sites

Что такое нейронные сети

Не нужно бояться новой терминологии, в ней нет ничего сложного и запредельного. Как SEO-специалисты свободно используют термины «парсинг», «хостинг», «Минусинск», «ап», «зона видимости» и т.д., так и математики, работающие с машинным обучением, окружили себя «своей» терминологией и специализированными сервисами.

Машинное обучение в поиске используется с 2000-х годов, нейронные сети – один из методов такого обучения.

В 2009 году Яндекс анонсировал алгоритм «Снежинск», который использовал технологию MatrixNet – это стало реальным прорывом в области поиска на тот момент. До этого инженеры поисковой системы хотели активно использовать аналитическую формулу, но столкнулись с рядом трудностей и поняли, что нужно обучить алгоритм, который будет сам разбираться и выстраивать определенным образом документы, исходя из обучающей выборки. Эта технология и получила название MatrixNet.

В 2016 году Яндекс впервые публично заявил о применении нейросетей, хотя они использовались и раньше, в частности, в технологии «Яндекс Переводчик».

Основные вехи развития Яндекс – SEO блог Smart Sites

Google в 2013 придумал Word2vec, а в 2019 году – BERT. Алгоритм Word2vec был первым заходом, который представлял собой нейронную сеть, только в миниатюре с одним слоем, где есть входящий и выходящий вектор, и есть некоторый слой без функции активации. Word2vec могла и может переводить любое слово, на которое вы попадаете, в некоторый вектор «смысла» размерности 300.

Эти векторы обладают интересными свойствами. С помощью простого обучения мы можем вычислить, на сколько слова близки друг другу по смыслу. То есть, мы даем большое количество выражений, и алгоритм сам вычисляет, какая вероятность, что это слово встретится в контексте рядом.

«Смешанная» выдача

В таких случаях один из факторов «тянет» в свою сторону. В каком-то смысле это можно воспринимать как борьбу между теми факторами, которые отвечают за смысл, и теми, которые отвечают за «обычные вхождения» в текст. При этом понятно, что в борьбе принимают участие все остальные группы факторов:

  • поведенческие;
  • хостовые (сайт);
  • ссылочные;
  • другие.

В результате выдача носит смешанный характер, как на примере с фразой «картина, где небо закручивается»:

Пример смешанной выдачи Яндекс – SEO блог Smart Sites

По запросу находятся результаты, в которых нет точного вхождения слов, но есть фразы, похожие по смыслу – например, картина «Звездная ночь» Ван Гога. Также присутствуют документы, в которых есть точное вхождение запроса. Здесь максимально ярко проиллюстрирована борьба нейронной сети со смыслом, с классическими SEO-шными факторами.

Можно сделать вывод, что Яндекс строит все не по принципу «мы придумали новый фактор, который теперь будет описывать смысл и смысловую близость запроса и документа», а по принципу «давайте добавим к текущим факторам набор дополнительных рычагов, которые будут улучшать выдачу».

И тут можно сделать простой, но очень важный отзыв:

ФАКТОРЫ СМЫСЛОВОЙ НАГРУЗКИ ТЕКСТА СТАЛИ БОЛЕЕ ПРИОРИТЕТНЫМИ НАД ФАКТОРОМ ВХОЖДЕНИЯ КЛЮЧЕВЫХ СЛОВ В ТЕКСТЕ В ВЫДАЧЕ ЯНДЕКС*.

*больше можно применить к МНЧ фразам.

Важно знать! – SEO блог Smart Sites

Алгоритм Яндекса YATI

Приведенные выше примеры – это примеры из анонсов алгоритмов Палеха и Королева, где Яндекс говорит примерно такие вещи: «Мы придумали поисковый запрос, видим, что по нему была нерелевантная выдача, а теперь она стала релевантной». То есть по запросу «фильм про человека, который выращивал картошку на другой планете» в выдаче есть фильм «Марсианин». Как только Яндекс это анонсировал, большое количество сайтов растиражировали новость. Алгоритм ломался, так как поисковая система продолжала отдавать предпочтение классическим вхождениям в текст.

BERT и YATI

YATI рассматривается как один из конкурентов BERT, об этом сказано в анонсе и в раскрытии технических деталей на Habr. BERT способен решать большее количество задач, не только понимание смысла текстов. Это нейронная сеть, тоже на трансформерах, двунаправленная и предобученная таким образом, чтобы добавить к ней один или два дополнительных слоя. Достаточно дообучить ее, и она будет решать задачи: на разделение запросов и ответов, поиск этих вопросов, поиск сущностей, в том числе задач на поиск смысловой близости.

Вывод: 7 вещей, которые мы рекомендуем!

И если говорить о рекомендациях, то мы бы посоветовали семь важных дел. Которые вам надо сделать, как SEO-специалисту для оптимизации под алгоритмы YATI, чтобы позиции росли.

1. Оптимизируйте под YATI.
Вам следует уже сейчас понять, что грядёт крупное изменение и уже сейчас необходимо начать работать.

2. Форматирование текста на фрагменты и акценты.
Избавляйтесь от СЕО-текстов, сейчас необходимы тексты, которые можно будет легко читать, и они будут иметь чёткую структуру, понятную и разбитую на логические части.

3. Анализируйте и оптимизируйте запросный индекс для документов.
Анализируйте по каким запросам и на какой УРЛ был совершён переход на вашу страницу, если по вашему мнению не совпадает ключевое слово странице – стоит задуматься.

4. Запросный индекс для хоста.
Вам необходимо понимать соответствует в целом ваш сайт желаемым запросам.

5. Расширяйте семантическое ядро для продвижения в сторону низкочастотных запросов.
Хоть многие считают, что НЧ запросы неприоритетные при сборе семантического ядра сайта и может не стоит их собирать вообще в свой список «запрос-страница». Мы вам рекомендуем наоборот обратить на них внимание и с низкочатных запросов вы можете получить более целевых пользователей и заявок.

6. Проводите конкурентный анализ.
Чтобы полноценно охватить, рекомендуем проанализировать:

  • показы конкурентов по запросам;
  • акценты на текстах: тематические слова, фразы, структура;
  • структура сайта и охват запросов из семантического ядра.

Сквозная аналитика конкурентов – это один из самых важнейших инструментов в SEO!

7. Не забывайте про классику поисковой оптимизации: текст, точные вхождения, все слова в Title.
Работайте над своим сайтом, и вы увидите светлое будущее! Желаем вам удачи!

Работать над сайтом – SEO блог Smart Sites
Smart Sites
Разработка и продвижение сайтов в поисковых системах
alarm_on 10.02.2021
remove_red_eye 1
Другие записи