Маркетинговое агентство полного цикла

Адрес офиса:
Работаем
по РФ

Звоните Пн-Пт: 9 - 18

+7 (914) 943-66-77 info@lukavchenko.ru

Меню сайта

Директива crawl-delay в robots.txt: что работает сейчас

Техническое SEO без мифов

Crawl-delay в robots.txt часто добавляют, чтобы снизить нагрузку от поисковых роботов. Но в 2026 году эта директива уже не является универсальным решением: Google её не поддерживает, Яндекс отказался от её учёта, а часть других роботов может трактовать её по-своему.

Ниже - практичная инструкция: когда crawl-delay вообще имеет смысл, чем его заменить, как не замедлить индексацию и что проверить перед правками в robots.txt.

Главный вывод
Не ставить “на всякий случай”
Для Google
Не работает
Для Яндекса
Использовать Вебмастер

Что такое crawl-delay простыми словами

Crawl-delay - это неофициальная директива robots.txt, которая просит робота делать паузу между запросами к сайту. Например, значение Crawl-delay: 5 означает просьбу не обращаться к сайту чаще одного раза в 5 секунд.

Проблема в слове “просит”. Это не жёсткий технический запрет, не стандарт для всех поисковых систем и не гарантия, что бот будет вести себя именно так.

Важно

Если сайт медленно отвечает, падает под ботами или получает тысячи технических URL в обходе, начинать нужно не с crawl-delay, а с логов сервера, дублей, параметров URL, кеширования и правил индексации.

Как Google, Яндекс и Bing относятся к crawl-delay

Самая частая ошибка - написать универсальный совет “добавьте crawl-delay для всех поисковиков”. На практике поисковые системы относятся к этой директиве по-разному.

Система / робот Учитывает crawl-delay? Что делать вместо слепой настройки
Googlebot Нет. Google поддерживает user-agent, allow, disallow и sitemap, но не crawl-delay. Убирать дубли, ускорять сервер, исправлять 5xx, настраивать canonical, noindex и внутреннюю структуру.
Яндекс Нет в старом смысле. Яндекс отказался от учёта crawl-delay и перенёс управление в инструмент “Скорость обхода”. Использовать Яндекс.Вебмастер и чаще оставлять режим “Доверять Яндексу”, если нет доказанной нагрузки.
Bing / MSNBot Да, но с ограничениями и риском замедлить обновление индекса. Ставить только при подтверждённой нагрузке и выбирать минимальное значение.
SEO-краулеры и сторонние боты Зависит от конкретного бота. Для агрессивных роботов чаще эффективнее Disallow, firewall, rate limiting, Cloudflare/CDN или правила на сервере.

Когда crawl-delay не решит проблему

Crawl-delay часто используют как “пластырь”, когда сайт уже технически болеет. Но если причина нагрузки в дублях, параметрах фильтров или слабом сервере, задержка не исправит источник проблемы.

Фасетные фильтры

Каталог генерирует тысячи URL с параметрами сортировки, цвета, размера, цены. Робот тратит обход на дубли вместо важных страниц.

Слабое кеширование

Каждый визит бота запускает тяжёлые PHP/SQL-запросы. Даже нормальная частота обхода может давать перегрузку.

Ошибки 5xx

Если сервер периодически отвечает 500, 502, 503 или 504, поисковики могут снизить доверие к стабильности сайта.

Лишние технические страницы

Корзина, поиск по сайту, личный кабинет, UTM-дубли, страницы пагинации и внутренние результаты поиска могут съедать crawl budget.

Если параллельно разбираете индексацию и запреты, полезно свериться с материалом про Meta robots, X-Robots-Tag и robots.txt: там проще понять, чем отличается запрет сканирования от запрета индексации.

Как проверить, нужен ли вам crawl-delay

Решение должно опираться не на чужой robots.txt, а на данные вашего сайта. Минимальный порядок проверки такой:

Чек-лист проверки

  • Посмотрите access logs за 7-14 дней: какие user-agent создают больше всего запросов.
  • Проверьте, совпадают ли IP и reverse DNS с реальными ботами Google, Яндекса, Bing.
  • Выделите URL, которые чаще всего обходятся: фильтры, сортировки, поиск, пагинация, параметры.
  • Сравните пики обхода с ошибками 5xx, ростом TTFB, падениями сервера и жалобами пользователей.
  • Проверьте robots.txt валидатором и убедитесь, что важные CSS, JS и коммерческие страницы не закрыты.

Пример плохого и хорошего подхода

Плохой вариант

Поставить большое значение “на всякий случай”, потому что так увидели у конкурента.

User-agent: *
Crawl-delay: 20
Disallow: /

Риск: сайт может стать хуже доступен для обхода, а запрет Disallow: / вообще закрывает весь сайт от сканирования.

Хороший вариант

Сначала закрыть мусорные зоны, настроить карты сайта, убрать дубли и только потом ограничивать конкретного бота, если это подтверждено логами.

User-agent: *
Disallow: /wp-admin/
Disallow: /?s=
Disallow: /*?orderby=
Allow: /wp-admin/admin-ajax.php
Sitemap: https://example.ru/sitemap_index.xml

Для Яндекса скорость лучше смотреть в Яндекс.Вебмастере, а для мусорных и агрессивных ботов - использовать серверные ограничения.

Что спросить у SEO-специалиста или разработчика

Если подрядчик предлагает поставить crawl-delay, нормальный следующий вопрос - “на основании каких данных?”. Ответ должен быть не общим, а привязанным к логам, ботам, ошибкам и URL.

Логи

Какие роботы создают нагрузку и сколько запросов они делают в пиковые часы?

Индексация

Какие важные страницы могут начать переобходиться медленнее после ограничения?

Альтернативы

Почему не подходит кеширование, CDN, rate limiting, canonical, noindex или чистка параметров?

Контроль

Какие метрики проверяем через неделю: ошибки, TTFB, количество просканированных URL, попадание в индекс?

Красные флаги в настройке robots.txt

  • Подрядчик копирует robots.txt конкурента без анализа структуры вашего сайта.
  • Crawl-delay ставят большим значением без логов и без понимания, какой бот грузит сервер.
  • Закрывают CSS, JS, изображения или коммерческие разделы, а потом удивляются проблемам с индексацией.
  • Путают “запретить сканирование” и “запретить индексацию”. Robots.txt не всегда удаляет URL из выдачи.
  • Не проверяют результат после публикации: валидатор, Search Console, Яндекс.Вебмастер, логи, ошибки сервера.

Если задача шире, чем один robots.txt, посмотрите материал про GEO-продвижение сайта: там логика похожая - поисковикам и AI-системам нужно давать чистую, понятную и проверяемую структуру данных.

Честный блок: проблема может быть не в ботах

Иногда владелец сайта видит просадку, медленную индексацию или слабые заявки и думает, что виноваты роботы. На практике причина может быть в другом: слабый сервер, тяжёлая CMS, плохой оффер, низкая конверсия, сезонность, цена, некачественная обработка заявок или отсутствие аналитики.

Поэтому технические правки нужно связывать с бизнес-метриками. Если поисковый трафик есть, но заявок мало, один crawl-delay не поможет. Нужны аудит посадочных страниц, коммерческих факторов, скорости, форм, доверия и аналитики.

Что должно быть в норме

  • Важные страницы доступны к сканированию и есть в sitemap.
  • Сервер стабильно отвечает без массовых 5xx и резкого роста TTFB.
  • Дубли и технические URL не съедают бюджет обхода.
  • Заявки, звонки и формы отслеживаются в аналитике.

Для системной работы можно начать с SEO-продвижения с прозрачным планом работ, где технические задачи оцениваются вместе с трафиком, заявками и коммерческими факторами.

Что делать дальше: безопасный порядок действий

  1. Снимите факты. Логи, ошибки, частота обхода, user-agent, проблемные URL, нагрузка на сервер.
  2. Уберите технический мусор. Закройте лишние параметры, поиск по сайту, сортировки, служебные директории.
  3. Проверьте индексацию. Важные страницы должны быть доступны, внутренне связаны и указаны в sitemap.
  4. Настройте скорость там, где это реально работает. Для Яндекса - через Вебмастер, для Bing - осторожно и минимально, для агрессивных ботов - через сервер.
  5. Проверьте результат. Через 7-14 дней сравните логи, ошибки, скорость ответа, страницы в обходе и динамику индексации.

Не уверены, что robots.txt не мешает SEO?

Начните не с случайных правок, а с проверки: какие страницы открыты, какие закрыты, что видят Google и Яндекс, где теряется бюджет обхода и есть ли технические ошибки, влияющие на заявки.

Заказать SEO-разбор сайта

Генеративный ИИ поиск

Спросить ИИ об этой статье

Откройте статью в ИИ-сервисе и получите краткое саммари: главную идею, выводы, практические рекомендации и вопросы по теме.

Выберите ИИ-сервис или скопируйте промпт вручную.

Калькулятор

расчет стоимости

FAQ по crawl-delay

Нужно ли добавлять crawl-delay в robots.txt?
Не по умолчанию. Сначала нужно доказать нагрузку по логам. Для Google директива не работает, для Яндекса управление вынесено в Яндекс.Вебмастер, а для Bing её можно применять осторожно.
Можно ли закрыть сайт от индексации через robots.txt?
Robots.txt управляет сканированием, но не всегда гарантирует удаление URL из выдачи. Для запрета индексации чаще используют meta robots noindex или X-Robots-Tag, если страница доступна для обхода.
Как понять, что robots.txt настроен неправильно?
Признаки: важные страницы не обходятся, в логах много дублей, растёт число исключённых URL, закрыты CSS/JS, sitemap указан неверно, а в Search Console или Яндекс.Вебмастере появляются ошибки доступа.
Почему большой crawl-delay опасен?
Чем больше задержка, тем меньше страниц робот успеет обойти. Для крупных сайтов это может замедлить обновление важных страниц в индексе.
Что лучше: crawl-delay или rate limiting?
Для поисковых систем лучше использовать их официальные инструменты и чистую структуру сайта. Для агрессивных сторонних ботов серверный rate limiting часто надёжнее, чем просьба в robots.txt.

Бесплатно!

Рассчитайте стоимость продвижения прямо сейчас