Какие страницы сайта WordPress не нужно индексировать

В совершенстве, наш сайт должен обеспечивать максимально открытый и полный доступ к индексации полезного контента как пользователей, так и поисковый машин, но в то же время скрывать все технические страницы и дублирующий контент сайта/блога.

Но к сожалению, подобное в WordPress по-умолчанию бывает крайне редко (а точнее никогда), и поэтому об этом должен позаботиться сам вебмастер, используя такие приемы как: добавление файла robots.txt, в котором прописывается табу для поисковых систем (более подробно о robots, можно прочитать в статье “Зачем нужен файл robots.txt?“, а также “Правильный файл robots.txt для WordPress“), использование закрывающих тегов “Noindex/Nofollow“, и конечно не попадание в индексацию дублирующих страниц предусмотрено плагином All In One SEO Pack.

Зачем нужно закрывать подобную информацию от поисковых систем? Поисковики крайне негативно относятся к ресурсам, на которых находится большое количество дублирующего контента, а также технической информации (к примеру данные о зарегистрированных пользователях), и как следствие, могут быть наложены некие санкции, которые будут портить нам жизнь.

Давайте обозначим основные пункты, которые желательно закрыть от индексации поисковыми системами:

Данные о зарегистрированных пользователях.

По сути, что такое информация о зарегистрированном пользователе? Это совсем небольшая страничка на сайте, в которой прописано всего пара фраз о пользователе: его имя и e-mail, которая не несет в себе совершенно никакой полезной информации. А ведь таких пользователей может быть несколько тысяч, а это значит – несколько тысяч одинаковых страниц.

RSS — лента

Ее желательно также закрыть от индексации, так как не всегда поисковые системы корректно работают с данной системой (в особенности на данный момент). При переходе поискового робота на RSS ленту, у него чаще всего возникает несколько десятков ошибок, которые повторяются раз за разом, при их посещении вашей rss ленты.

Данный пункт весьма индивидуален, и если вы не замечаете особых проблем с индексацией rss, то закрывать от индексации ленту новостей не стоит.

Страницы – дубли

Это пожалуй самая распространенная проблема большинства WordPress блогов, поскольку поисковые роботы, а в особенности Google, индексируют все без разбору, а значит могут проиндексировать одну и ту же страницу несколько раз, но под разными url адресами. Подобные страницы необходимо закрывать от индексации.

К примеру, если страница находится в общем списке, а также в списке тегов, то получается дубль одной и той же страницы. Поэтому последний список лучше закрыть от индексирования. Также в этом нам помогает правильно настроенный плагин All In One SEO Pack (или подобный), который по большей части не допускает индексации дублированного контента.

Облако тегов или Облако меток

Вы наверное не раз замечали на многих сайтах различные виды облака тегов, которые как правило расположены в сайдбаре? Это по сути просто набор ключевых слов, расположенных в виде списка, или круга тех же ключевых слов, который вращается.

Подобную фишку лучше не использовать вовсе или закрыть тегами noindex и nofollow, поскольку для поисковых систем, подобное видится обычным списком ключевых слов, которые представляют собой какой-то бессмысленный набор слов, расположенных в хаотичном порядке.

Внешние ссылки

И конечно же стоит забывать о внешних ссылках, особенно которые обитают на вашем сайте без вашего ведома. Подобные ссылки необходимо закрыть от индексации закрывающими тегами noindex и nofollow, или если есть возможность вообще их удалить. Как выявить и обезвредить все внешние ссылки можно прочитать в статье “Определяем количество внешних ссылок на сайте, после чего закрываем их тегами noindex и nofollow“.

Также многие вебмастеры закрывают индексацию ссылок в комментариях, так как считается, что подобные ссылки отдают достаточно большой “вес” посторонним сайтам. Но конечно же бездумно закрывать вообще все комментарии не следует, поскольку бывают случаи, что благодаря грамотным комментариям пользователей, страница часто вырывается в ТОП поискового запроса.

comments powered by HyperComments

Оставьте мне собщение