Googlebot сканирует и индексирует первые 15 МБ контента на странице

В справочной документации Google, касающейся работы Googlebot, появился новый небольшой материал с указанием ограничения по размеру сканируемого файла. Там указывается, что робот будет сканировать первые 15 МБ содержимого html-файла или поддерживаемого текстового файла:

«После первых 15 МБ файла Googlebot прекращает сканирование и рассматривает для индексации только первые 15 МБ контента».

Googlebot сканирует первые 15 МБ – новости СЕО от Smart Sites

Как сообщил представитель Google Джон Мюллер в своем Twitter-аккаунте, это касается только html-файла, другие элементы, такие как изображения, видео, CSS и JavaScript, извлекаются отдельно.

«Встроенные ресурсы/содержимое, извлеченное с помощью тегов IMG, не являются частью html-файла», – уточнил Мюллер.

Это означает, что контент страницы должен быть структурирован таким образом, чтобы поместить SEO оптимизированную информацию в первые 15 МБ html-файла или поддерживаемого текстового файла. Это также означает, что изображения и видео по возможности должны быть сжаты, а не кодироваться непосредственно в html.

Проверить, какие части страницы видит и отображает поисковый робот Google можно при помощи инструмента проверки URL-адресов в Google Search Console.

Другие новости