Оптимизируем robots.txt под WordPress

Очень часто мне приходят от читателей письма, в которых меня просят рассказать о настройке robots.txt. Как правило, людей интересует оптимизация этого файла под конкретные движки, типа DLE, Joomla и WordPress. На основании этого я и написал данное руководство, в котором буду отвечать на популярные вопросы.

Что такое robots.txt?

robots.txt — это файл, который размещен в корне Вашего сайта на хостинге. Поисковые роботы Яндекса, Гугла и других поисковых систем, когда попадают на Ваш сайт, в первую очередь ищут этот файл, чтобы посмотреть, какие страницы Вы разрешаете проиндексировать, а какие нет.

Для чего нужен robots.txt?

Иногда очень целесообразно запретить роботам индексацию определённых файлов и страниц, дабы избежать ненужных ошибок и дублированного контента. Ведь дублированный контент безжалостно наказывается поисковыми машинами в виде понижения позиций в выдаче.

Зачем использовать robots.txt для WordPress?

В системе WordPress дублированный контент всплывает на страницах рубрик, архивов и тегов, именно их мы будем скрывать от индексации, прописывая нужные команды.

Как создать robots.txt?

Создание этого файла не вызывает особых затруднений. Всё что нам нужно – обычный текстовый редактор, в котором мы будем прописывать команды. Сам файл сохраняется в формате .txt под названием “robots”. Обратите внимание, что все буквы прописываются в нижнем регистре!

Как прописать адрес карты сайта в robots.txt?

Как правило, адрес карты прописывается в самом начале файла robots.txt и имеет следующий вид:

User-agent: *
Sitemap: http://www.[url].ru/sitemap.xml

Чуть ниже мы запрещаем индексацию служебных каталогов, чтобы поисковики не допускали ошибок при сканировании контента:

# disallow all files in these directories
Disallow: /cgi-bin/
Disallow: /wp-admin/
Disallow: /wp-includes/
Disallow: /wpcontent/themes/
Disallow: /wpcontent/plugins/
Disallow: /trackback/
Disallow: /*?*
Disallow: */trackback/

Теперь мы закрываем весь PHP и страницы тегов, рубрик и архивов, т.к. там содержится дублированный контент. Кроме того, прячем фид, т.к. попытки его индексирования приводят к ошибкам.

User-agent: Googlebot
# disallow all files ending with these extensions
Disallow: /*.php$
Disallow: /*.js$
Disallow: /*.inc$
Disallow: /*.css$
Disallow: /*.gz$
Disallow: /*.cgi$
Disallow: /*.wmv$
Disallow: /*.png$
Disallow: /*.gif$
Disallow: /*.jpg$
Disallow: /*.cgi$
Disallow: /*.xhtml$
Disallow: /*.php*
Disallow: */trackback*
Disallow: /*?*
Disallow: /category/
Disallow: /tag/
Disallow: /archives/
Disallow: /feed/
Disallow: /wp-*
Allow: /wp-content/uploads/

Теперь открываем доступ к поиску всех картинок в блоге:

# allow google image bot to search all images
User-agent: Googlebot-Image
Allow: /*

Ну вот, вроде бы, и всё… Ах да, если вы крутите в блоге рекламу от Google AdSense, то необходимо будет прописать ещё пару строк:

# allow adsense bot on entire site

User-agent: Mediapartners-Google*
Disallow: /*?*
Allow: /wp-content/
Allow: /tag/
Allow: /category/
Allow: /*.php$
Allow: /*.js$
Allow: /*.inc$
Allow: /*.css$
Allow: /*.gz$
Allow: /*.cgi$
Allow: /*.wmv$
Allow: /*.cgi$
Allow: /*.xhtml$
Allow: /*.php*
Allow: /*.gif$
Allow: /*.jpg$
Allow: /*.png$

Теперь наш robots.txt полностью заточен под наш блог.

В целом должен получиться файл с вот таким сожержанием:User-agent: *

Sitemap: http://www.[url].ru/sitemap.xml

# disallow all files in these directories
Disallow: /cgi-bin/
Disallow: /wp-admin/
Disallow: /wp-includes/
Disallow: /wp-content/themes/
Disallow: /wp-content/plugins/
Disallow: /trackback/
Disallow: /*?*
Disallow: */trackback/

User-agent: Googlebot
# disallow all files ending with these extensions
Disallow: /*.php$
Disallow: /*.js$
Disallow: /*.inc$
Disallow: /*.css$
Disallow: /*.gz$
Disallow: /*.cgi$
Disallow: /*.wmv$
Disallow: /*.png$
Disallow: /*.gif$
Disallow: /*.jpg$
Disallow: /*.cgi$
Disallow: /*.xhtml$
Disallow: /*.php*
Disallow: */trackback*
Disallow: /*?*
Disallow: /category/
Disallow: /tag/
Disallow: /archives/
Disallow: /feed/
Disallow: /wp-*
Allow: /wp-content/uploads/

# allow google image bot to search all images

User-agent: Googlebot-Image
Allow: /*

# allow adsense bot on entire site

User-agent: Mediapartners-Google*
Disallow: /*?*
Allow: /wp-content/
Allow: /tag/
Allow: /category/
Allow: /*.php$
Allow: /*.js$
Allow: /*.inc$
Allow: /*.css$
Allow: /*.gz$
Allow: /*.cgi$
Allow: /*.wmv$
Allow: /*.cgi$
Allow: /*.xhtml$
Allow: /*.php*
Allow: /*.gif$
Allow: /*.jpg$
Allow: /*.png$
17.07.2012
Просмотров: 2168


Похожие статьи

03.06.2015

12 бинес идей в интернете для новичков

Сегодня сложно найти, хоть одно пристежную организацию, которая не рекламировалась в интернете или хотя бы не имела официальных представителей в сети. И это не удивительно, так как в сети крутятся суммы не меньше чем в офлайне. В этой статье мы рассмотрим несколько бизнес идей в интернете, которые может реализовать даже новичок, который не имеет глубоких знаний в интернет бизнесе.
подробнее
29.03.2015

Как выбрать интернет-магазин

Сегодня популярностью пользуются интернет-магазины. Многие покупают одежду, бытовую технику, мебель и прочее именно через Интернет. В первую очередь, это удобно, так как не нужно выходить из дома в поисках товара, все можно делать сидя на стуле в уютной обстановке. Второе, как правило, товар в интернет-магазинах дешевле, ну и третье – это доставка домой.
подробнее
21.03.2015

Продвижение сайта статьями

На сегодняшний день продвижение сайта статьями по праву считается самым эффективным способом внешней оптимизации. В отличие от простых ссылок на сайт, размещение таковых в статьях создает цельный информационный образ материала, который в своих статьях ссылается на продвигаемый нами сайт.
подробнее
09.02.2015

Создание сайтов СПб – качество от TOP-advance

Как показывает практика, наличие у компании сайта еще не является гарантией ее востребованности и популярности. Случается, что ресурс не оправдывает ожиданий. Причин для этого несколько. Предлагаем обозначить их, чтобы защитить вас от опасностей и разочарований. Вы нашли фирму, предлагающую создание сайтов в СПб, оплатили все услуги, но через некоторое время поняли, что полученный продукт не решает ваших целей. Этому существует несколько объяснений.
подробнее
13.03.2013

Что такое юзабилити сайта?

Основная цель любого создателя сайта это привлечь максимальное количество пользователей сети Интернет. Это во многом зависит от такого понятия как юзабилити. В дословном переводе с английского это слово расшифровывается как «удобное использование».
подробнее
27.02.2013

Как раскрутить свой сайт. 3 полезных совета для начинающих

Первое, за что вы задумали взяться, это заработок на своем личном сайте. Создав некоторое количество уникальных статей, вы наполнили ими свой сайт, которому предстоит приносить для вас денежный доход. Зарегистрировали аккаунт GoogleAdSense, установили рекламные коды и ждете.
подробнее
27.02.2013

Верстка сайта. Гармония визуального и текстового рядов

Одна из ошибок начинающих web-мастеров — перегруженность страниц сайта визуальной информацией. С одной стороны, такая тенденция понятна: яркая графика и флэш-анимация должны привлечь внимание посетителя и задержать его на странице. Однако стоит помнить и о недостатках такого подхода.
подробнее
26.07.2012

Социальная сеть Facebook обогатит российских инвесторов

Корпорация Facebook, которая является владельцем самой востребованной социальной сети, подготовила одно из крупнейших финансовых размещений на фондовой бирже за весь период ее существования. Для запланированного на конец года текущего IPO вышеупомянутая компания оценила себя в девяносто пять миллионов долларов.
подробнее
17.07.2012

IP-Телефония

Ip-телефония пришла к нам в начале XXI века, и сразу же после прихода, стала стремительно развиваться. После ее прихода, эксперты стали прогнозировать, что АТС, осталось жить совсем недолго. Но это далеко не так!
подробнее
17.07.2012

Как раскрутить собственный сайт

В настоящее время все больше людей используют всемирную паутину для управления своими финансовыми счетами, запускают собственный бизнес или просто «раскручивают» собственный имидж.
подробнее
Для комфортного доступа к этому сайту, в вашем браузере должен быть включен JavaScript