Ответить Новая тема Новый опрос 
 Агрессивное сканирование google ботами
PENNST


Новичок
Сообщений: 41
Регистрация: 16-02-2015


13-08-2019 01:56
Всем доброго времени суток.

90+ дней назад гугл-боты создавали нагрузку на сервер и я ограничил скорость сканирования сайта. Пару дней назад ограничение спало и за последние два дня ботом с ip адреса 66.249.64.199 поступило 6,4565 CPU, %, что сильно нагрузило сервер.

Мне интересно он и дальше так же агрессивно будет сканировать или снова будет требоваться ограничивать скорость сканирования?

Отмечу, что ранее такого не замечалось и все было нормально. Никогда до этого момента трех месячной давности сайт на превышал ограничения серверных минут хостинга. А потом стало как помазано и гугл боты стали так рьяно сканировать сайт.
 
Вне форума
ПМ 
Щелкните, и это сообщение будет добавлено в ваш ответ как цитата Цитировать этот ответ
Dulco


Cпециалист
Сообщений: 223
Откуда: Краснодар
Регистрация: 05-07-2012


13-08-2019 20:57
Как пишут на различных форумах, есть способы ДоС атак через google, еще возможны сбои скриптов, где то какой то глюк или с базой какие то проблемы. Если нет возможности перейти на более дорогой тариф, то воспользуйтесь моим модулем http://prestadev.ru/addons/administration/518-bl......shop-16-17.html. Он автоматически будет блокировать IP адреса превышающие количество запросов в определенный промежуток времени. Потом вручную Вы можете разблокировать IP поисковиков.
 
Вне форума
ПМ Отправить эл.сообщение 
Щелкните, и это сообщение будет добавлено в ваш ответ как цитата Цитировать этот ответ
PENNST


Новичок
Сообщений: 41
Регистрация: 16-02-2015


14-08-2019 15:54
Цитата:( Dulco @ 13-08-2019 21:57 Смотреть сообщение )
Как пишут на различных форумах, есть способы ДоС атак через google, еще возможны сбои скриптов, где то какой то глюк или с базой какие то проблемы. Если нет возможности перейти на более дорогой тариф, то воспользуйтесь моим модулем http://prestadev.ru/addons/administration/518-bl......shop-16-17.html. Он автоматически будет блокировать IP адреса превышающие количество запросов в определенный промежуток времени. Потом вручную Вы можете разблокировать IP поисковиков.


Понял. Буду смотреть.
 
Вне форума
ПМ 
Щелкните, и это сообщение будет добавлено в ваш ответ как цитата Цитировать этот ответ
Serg_em
Новичок
Сообщений: 3
Регистрация: 16-02-2017


26-08-2021 10:04
Парни, всем привет. Помогите забанить бота по имени Petalbot. Блокировка в .htaccess по IP не помогает, он заходит с разных адресов. Пробовал так:
<IfModule mod_rewrite.c>
RewriteCond %{HTTP_USER_AGENT} petalbot [NC]
RewriteRule .* - [F,L]
</IfModule>
Тоже не помогло. У кого-нибудь есть решение как не пускать этого гада на сайт?
 
Вне форума
ПМ Отправить эл.сообщение 
Щелкните, и это сообщение будет добавлено в ваш ответ как цитата Цитировать этот ответ
Алекс


Администратор
Сообщений: 4516
Откуда: Красноярск
Регистрация: 29-05-2009


25-09-2021 01:48
Цитата:( Serg_em @ 26-08-2021 11:04 Смотреть сообщение )
Парни, всем привет. Помогите забанить бота по имени Petalbot. Блокировка в .htaccess по IP не помогает, он заходит с разных адресов. Пробовал так:
<IfModule mod_rewrite.c>
RewriteCond %{HTTP_USER_AGENT} petalbot [NC]
RewriteRule .* - [F,L]
</IfModule>
Тоже не помогло. У кого-нибудь есть решение как не пускать этого гада на сайт?

Правило указанное вами выше должно рабатать, возможно в логах вы видите переходы, но со статусом 403 - доступ запрещён.
Напр.:
Код:
[дата число и тд.] "GET / HTTP/1.1" 403 1013 "-" "Mozilla/5.0 (Linux; Android 7.0;) AppleWebKit/537.36 (KHTML, like Gecko) Mobile Safari/537.36 (compatible; PetalBot;+https://webmaster.petalsearch.com/site/petalbot)"

Если правило не срабатывает поместите его в самый верх .htaccess.

Если установлен nginx и имеется возможность правки конфигурации, добавьте нечто подобное:
Код:
if ($http_user_agent ~* "(trendictionbot|Re\-re Studio|Adsbot|BackupLand|VelenPublicWebCrawler|serpstatbot|trendiction|DotBot|AhrefsBot|exabot|MJ12bot|PetalBot|URLGrabber|CryptoAPI|TurnitinBot|BLEXBot|Bluestacks|Bittorrent|LinkpadBot|MegaIndex|SemrushBot|linkdexbot|SMTBot|BUbiNG|DeuSu|CCBot|SiteExplorer|SeznamBot|ExtLinksBot|Barkrowler|MauiBot)") {
        return 403;
    }
 
Вне форума
ПМ Отправить эл.сообщение 
Щелкните, и это сообщение будет добавлено в ваш ответ как цитата Цитировать этот ответ
Ответить Новая тема Новый опрос