Недавно хостер начал жаловаться на возросшую нагрузку на сервер. И это не удивительно, ведь количество просмотров возросло по сравнению с весной в 2-3 раза.
С количеством просмотров увеличилось и количество поисковых ботов, постоянно что-то ищущих на сайте. Некоторые из них начали качать страницы за гигабайтами, и блог начал превышать отведенные ему лимиты. В конце концов закончилось тем, что блог был заблокирован в течении нескольких дней. Чтобы выйти из этой ситуации, мне пришлось оптимизировать настройки доступа к сайту для поисковых ботов, а так же и для всех остальных посетителей. Обобщив все советы, которые относятся к снижению нагрузки на сервер, я добавил в файл robots.txt определенные директивы.
robots.txt — файл, в котором содержатся указания для поисковых систем. Это обычный текстовывй файл с командами, оформленными особым образом. Он размещается в корневой папке вашего блога. Для снижения нагрузки, создаваемой поисковыми ботами, нужно добавить в файл robots.txt такие установки:
User-agent:* Crawl-delay: 2 User-agent: Unknown robot Disallow: / User-agent: * Disallow: /cgi-bin/ Disallow: /wp-login.php Disallow: /wp-register.php Disallow: /wp-includes/ Disallow: /xmlrpc.php Disallow: /wp-admin Disallow: /wp-content/plugins Disallow: /wp-content/themes Disallow: /tag/ Disallow: /category/ Disallow: /trackback/ Disallow: /feed/ Disallow: /comments/ Disallow: */trackback/ Disallow: */feed/ Disallow: */comments/ Disallow: /?feed= Disallow: /?s= Disallow: /*?* Disallow: /*? Sitemap: https://n-wp.ru/sitemap.xml User-agent: Yandex Disallow: /cgi-bin/ Disallow: /wp-login.php Disallow: /wp-register.php Disallow: /wp-includes/ Disallow: /xmlrpc.php Disallow: /wp-admin Disallow: /wp-content/plugins Disallow: /wp-content/themes Disallow: /tag/ Disallow: /category/ Disallow: /trackback/ Disallow: /feed/ Disallow: /comments/ Disallow: */trackback/ Disallow: */feed/ Disallow: */comments/ Disallow: /?feed= Disallow: /?s= Disallow: /*?* Disallow: /*? Host: n-wp.ru
Как видно, все директивы можно разделить на две части: для всех и для Яндекса. Для неизвестных роботов индексация блога запрещена. Для всех без исключения запрещена индексация фидов, трекбеков, комментариев, поисковых запросов, архивов, страниц с выборками по тегам. Так же запрещена индексация папок с плагинами и темами, страниц регистрации. В общем, оставлены только сами посты — пусть поисковики по ним ходят. Это было сделано, чтобы исключить появление в поисковой выдаче дублей — пути, ведущему к одному и тому же посту. В итоге нагрузка от поисковых ботов снизилась почти вдвое, что позволило экономить гигабайты трафика. Благодаря этому сайт был разблокирован и продолжил свою работу.
Disallow: /comments/??? Комментарии – уникальный контент. Простите, но ИМХО глупо запрещать к индексации комментарии.
Мои публикации — не догма. Я уверен, что найдутся многие, у кого опыта и знаний больше, и я ни в коей мере не буду с ними спорить, а лишь только выслушаю и скажу спасибо. Если вы считаете, что закрывать комментарии от индексации не стоит — не закрывайте. Однако глупым иное мнение считать не стоит, тем более когда речь идет о таких неоднозначных вещах, как комментарии.
А как на счет сапы, ее робот пробьет эту стену?
А как на счет сапы, ее робот пробьет эту защиту?
А робот sape учитывает директивы из robots.txt? Думаю, что нет, значит на него эти правила не распространяются.
Спасибо, утвердил ваши рекомендации фильтров. Просто вчера в 21:13 заблокировали мой акк, а на нем 30 сайтов. В течении 40 мин добился разблокировки с обещанием снизить нагрузку. Может что-то посоветуете конкретно или прочитать что-то?
Посоветую ознакомиться с этими постами:
Как уменьшить нагрузку на сервер | оптимизация .htaccess: https://n-wp.ru/kak-umenshit-nagruzku-na-server-optimizaciya-htaccess/
Как уменьшить нагрузку на сервер, создаваемую поисковыми ботами: https://n-wp.ru/kak-umenshit-nagruzku-na-server-sozdavaemuyu-poiskovymi-botami/
Как уменьшить нагрузку на блог: блокировка запросов на обновление и отключение автоматического управления ревизиями: https://n-wp.ru/kak-umenshit-nagruzku-na-blog-blokirovka-zaprosov-na-obnovlenie-i-otklyuchenie-avtomaticheskogo-upravleniya-reviziyami/
Так же советую обязательно посмотреть посты о кэшировании: https://n-wp.ru/tag/kesh
после применения указанных настроек. Что-то изменилось в индексировании?
Поясните :)