Soft 404 — что это такое

by admin

Автор Л.Ладонина

Soft 404 — это ошибка индексирования, так называемая «ложная 404». Таков метод Google помечать контент, который выглядит как несуществующий, но при этом отдающий ответ  существующего — 200ok (про коды ответов недавно писалось в статье про редиректы).

Что попадает под это определение и какие последствия для сайта? Про определение можно почитать у Гугла. А от себя добавлю, когда это происходит:

  1. На странице мало своего контента. Например, это раздел в интернет-магазине, в котором нет товара и ничего на эту тему не написано — ни подписаться на поступление, ни когда его ждать, ни что купить взамен. Просто пустая (или почти пустая) содержательная часть. Или информационный сайт, в котором есть раздел или рубрика, а материала в нём нет. Наличие меню, заголовка, футера, сайдбара не имеет значения — поисковики умеют сегментировать страницу и понимать, что это содержание сквозное, а здесь речь именно о содержательной части.
    Или с сайта был удалён какой-то материал или товар, и на странице даже может быть написано — 404, контента не существует, товара больше нет. Но она отдаёт код отклика 200ok, т.е. существующей. В этом случае то, что видит пользователь, и то, что видит робот, должно совпадать — нужно обязательно настроить код ответа 404 на месте несуществующей страницы. Тогда не будет никакого противоречия, робот просто удалит её из индекса, не будет перегружать ваш сервер попытками проиндексировать то, чего больше нет и понижать ваш рейтинг из-за наличия ошибок. Большинство популярных CMS делает это по умолчанию — вы спокойно удаляете ненужный материал, движок автоматически назначает ему 404 код, а вы можете разве что позаботиться о внешнем виде страницы с сообщением об ошибке — в принципе всё уже настроено.
  2. На сайте что-то ломалось, но он не сообщал роботам и посетителям о том, что вышел из строя с помощью соответствующего кода — например, 503, временно недоступен, или 502 — недоступен. Вместо этого он выдавал кусок программного кода, сообщение о недоступности или пустой экран с кодом 200ok. В этот момент страницу посетил робот Google, сосканировал вместо нужного контента ошибочный и определил её как ложную 404. Кстати, этот вариант встречается часто.

Последствия ошибки soft 404

Страница, которую поисковик пометил как ложную 404, считается ошибкой индексирования и помещается в соответствующий раздел Search Console (в панели вебмастера Google, к которой обязательно нужно подключиться). Из поискового индекса она как ошибочная исключается — так же, как истинная 404 ошибка.

  1. В случае 1 это логично, но оставлять это так нельзя. Если вы хотите вернуть страницу отсутствующего товара в индекс, добавьте контент — напишите примечание, предложите товары замены либо настройте редирект 301 или, в случае временного отсутствия, 302 — на другой товар, либо на верхнюю или родственную рубрику. Либо удалите его безвозвратно с истинным откликом 404.
  2. В случае 2 это плохо. Проверьте, доступны ли страницы и есть ли на них достаточно контента, если маловато — например, всего 1-2 товара, добавьте какое-то содержание. И далее можно нажать кнопку валидации. Google запустит процесс проверки и вернёт их в индекс. Второй вариант — отправить ошибочные страницы на переобход робота, но если их много, это займет больше вашего времени. После проверки на возвращение в индекс и затем в поиск уйдёт несколько дней.

По теме: