Дубли страниц. Как найти и удалить дубли страниц на сайте

Всем привет, уважаемые читатели блога disseo.ru. В данной статье я рассмотрю очень важный вопрос, который определит будущее развитие ресурса и успех в его продвижении. Поговорим с вами о таком понятии, как дубли страниц на сайте или WordPress блоге. А так же подробно рассмотрим вопросы касающиеся поиска дублей страниц и их удаление.

Дубли страниц

На сегодняшний день различают два вида дублей страниц на сайте — полные (четкие) и нечеткие.

Полный (четкий) дубль — это страницы на одном сайте или блоге, которые содержат полностью идентичный (одинаковый) контент, но имеют различные URL адреса.

Не полный (нечеткий) дубль — это страницы, которые имеют или содержат в себе много одинакового контента, но они не полностью одинаковые и имеют различные URL адреса.

Их наличие может привести к ухудшению индексации, читайте пост “Почему сайт не индексируется поисковыми системами”, проседанию позиций в поисковой выдаче и к наложению фильтров.

Появление дублей страниц на сайте может быть обусловлено различными причинами.

  • Технические недоработки. Что включает в себя наличие битых ссылок, файл robots.txt, создание карты сайта и настройка sitemap.xml, использование фреймов и flash меню, а так же настройка 301 редиректа.
  • Ошибки оптимизатора. Влияние на поисковые машины и черная seo оптимизация.
  • Автоматические дубли страниц. Многие CMS системы способный автоматически создавать дубли страниц на сайте без участия оптимизатора или веб — разработчика. Среди них WordPress (анонс) и Joomla.

А теперь, уважаемые читатели, я предлагаю рассмотреть, как найти или осуществить поиск дублей страниц на сайте.

Как найти дубли страниц на сайте

Существует множество бесплатных способов, основанных как на использовании Яндекс и Google, так и с применением программных инструментов, которые анализируют доменное имя. Начну, пожалуй, с самых простых и трудоемких.

Яндекс. Первоочередное что вам необходимо сделать, так это открыть Яндекс и пройти меню «Расширенный поиск».

Поиск дублей страниц на сайте

В открывшемся окне, в поле «Я ищу» необходимо скопировать фрагмент текста из статьи, которую вы подозреваете в дублировании и  вставить его туда, предварительно окружив «Кавычками». В строке «На сайте» укажите доменное имя и нажать на кнопку «Найти».

Расширенный поиск дублей страниц

Если будут найдены дубли страниц, то результат поиска будет содержать более одного ответа.

Дубли страниц на сайте

Google. Так же, как и в предыдущем способе, копируете фрагмент текста в «кавычках» и вставляем в окно поиска Google, через пробел от текста напишите следующую строку:

Site:examplesite.ru

Обратите внимание на изображение ниже, чтобы избежать лишних вопросов.

Поиск дублей страниц в Google

Если найдутся дубли страниц, то они появятся в выдаче. Переходим от простых и примитивных способов к использованию специализированных инструментов.

Как найти дубли страниц с помощью СайтРепорт

Помимо использования Яндекс и Google, можно воспользоваться специальным сервисом по анализу сайтов СайтРепорт. Для того, чтобы им воспользоваться, для начала необходимо на него перейти и зарегистрироваться. Далее в строку поиска введите адрес вашего ресурса и нажмите на кнопку «Анализировать», предварительно поставив «Переключатель» в  строку "Бесплатная диагностика сайта".

Анализ дублей страниц

Далее программа перекинет вас в «Заказ нового анализа», на которой нажмите по ссылке «Статус и ход выполнения».

Поиск дублей страниц на сайте

Теперь в окне «Мои проекты» вы можете следить за происходящим. После того, как все завершится, нажмите на «Автоматический отчет», чтобы узнать результаты.

Удалить дубли страниц на сайте

В следующем оконце, чтобы узнать о том, есть ли у вас на ресурсе дублированный контент, нужно перейти во вкладку «Отчет по анализу контента» расположенную слева и прокрутить окно вниз, для того чтобы появилось следующее.

Отчет по анализу контента

Так же с помощью сервиса СайтРепорт можно осуществлять анализ конкурентов.

Как удалить дубли страниц на сайте

На данный момент я знаю 4 действенный способа того, как удалить дубли страниц на сайте и сейчас я вам о них расскажу.

1. Ручное удаление. Вы находите дубликат и удаляете его так, как описано в посте «Как удалить страницу из поиска».

2. Канонический тег.  Тег rel=”canonical”, указывает поисковым машинам, какая из записей или постов будет участвовать в поиске. Сделать, это можно предварительно настроив плагин All in One Seo Pack.

Как удалить дубликаты страниц

3. Директива Disallow. На мой взгляд, это один из лучших приемов, для того чтобы удалить дубли страниц с сайта. Например, если дублированные статьи находятся в какой то определенной директории, а это вы поймете, проанализировав их адрес, то можно закрыть эту директорию в robots.txt.

Disallow: / название директории

4. 301 редирект. В этом случае затрагивается проблема отображения блога в выдаче с www и без www. Подробнее об этом, вы можете прочитать в моем блоге.

Если у вас возникнут какие-нибудь вопросы о том, как найти и удалить дубли с сайта, то обращайтесь с комментариями. Чем смогу, тем помогу. А так же, не забывайте подписываться на обновление блога.

С уважением, Дороднов Иван!

Поделиться в соц. сетях

0

Получайте свежие посты прямо на E-mail: