Re: Подскажите - как бороться с парсерами
Anton Kuznetsov
maybe на arjlover.net
Вт Апр 26 17:16:21 MSD 2011
Одним нжинксом тут не отделаешься, он поможет если парсят в 100 потоков, а
так... в любом случае парсер будет приспосабливаться. Пишите анализатор
логов и баньте по айпи. Пока это однопотоковый скрипт на одном адресе -
ничего сложного. ;)
2011/4/20 maxim <maxim at della.ua>
> У нас портал. На нем обьявления.
> И возникает ситуация когда конкуренты начинают парсить скриптами сайт и
> копипастить обьявления.
> поставил в настройках nginx
>
> http {
> .....
> limit_req_zone $binary_remote_addr zone=one:5m rate=25r/s;
> limit_zone two $binary_remote_addr 1m;
> .....
>
> server {
> listen 80;
> ......
> limit_req zone=one burst=35 nodelay;
> limit_conn two 5;
>
> Но не помогло. Вчера была такая картина
> Айпи Время Хиты
> 93.126.72.176 20:28:07 - 20:28:07<http://my.212.ua/ru/statistics/visit_routes?page=9&search%5Bdate%5D=2011-04-19&search%5Bip%5D=93.126.72.176#>1
> 93.126.72.176 20:28:06 - 20:28:06<http://my.212.ua/ru/statistics/visit_routes?page=9&search%5Bdate%5D=2011-04-19&search%5Bip%5D=93.126.72.176#>1
> 93.126.72.176 20:28:05 - 20:28:05<http://my.212.ua/ru/statistics/visit_routes?page=9&search%5Bdate%5D=2011-04-19&search%5Bip%5D=93.126.72.176#>1
> 93.126.72.176 20:28:05 - 20:28:05<http://my.212.ua/ru/statistics/visit_routes?page=9&search%5Bdate%5D=2011-04-19&search%5Bip%5D=93.126.72.176#>1
> 93.126.72.176 20:28:04 - 20:28:04<http://my.212.ua/ru/statistics/visit_routes?page=9&search%5Bdate%5D=2011-04-19&search%5Bip%5D=93.126.72.176#>1
> 93.126.72.176 20:28:04 - 20:28:04<http://my.212.ua/ru/statistics/visit_routes?page=9&search%5Bdate%5D=2011-04-19&search%5Bip%5D=93.126.72.176#>1
> 93.126.72.176 20:28:04 - 20:28:04<http://my.212.ua/ru/statistics/visit_routes?page=9&search%5Bdate%5D=2011-04-19&search%5Bip%5D=93.126.72.176#>1
> 93.126.72.176 20:28:03 - 20:28:03<http://my.212.ua/ru/statistics/visit_routes?page=9&search%5Bdate%5D=2011-04-19&search%5Bip%5D=93.126.72.176#>1
> 93.126.72.176 20:28:02 - 20:28:02<http://my.212.ua/ru/statistics/visit_routes?page=9&search%5Bdate%5D=2011-04-19&search%5Bip%5D=93.126.72.176#>1
> ....
> 93.126.72.176 20:26:52 - 20:26:52<http://my.212.ua/ru/statistics/visit_routes?page=9&search%5Bdate%5D=2011-04-19&search%5Bip%5D=93.126.72.176#>1
> 93.126.72.176 20:26:51 - 20:26:51<http://my.212.ua/ru/statistics/visit_routes?page=9&search%5Bdate%5D=2011-04-19&search%5Bip%5D=93.126.72.176#>1
> 93.126.72.176 20:26:51 - 20:26:51<http://my.212.ua/ru/statistics/visit_routes?page=9&search%5Bdate%5D=2011-04-19&search%5Bip%5D=93.126.72.176#>1
> 93.126.72.176 20:26:51 - 20:26:51<http://my.212.ua/ru/statistics/visit_routes?page=9&search%5Bdate%5D=2011-04-19&search%5Bip%5D=93.126.72.176#>1
>
> Тоесть с этого айпи каждую секунду происходит одно соединение.
> Понятно что это не человек.
> Подскажите как с таким боротся? Возможно я неверно указал настройки? Или
> это не силами nginx делается?
>
>
> _______________________________________________
> nginx-ru mailing list
> nginx-ru at nginx.org
> http://nginx.org/mailman/listinfo/nginx-ru
>
>
--
Best regards,
Anton Kuznetsov.
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://nginx.org/pipermail/nginx-ru/attachments/20110426/4078cc2e/attachment.html>
Подробная информация о списке рассылки nginx-ru