Re: nginx зависает

Maxim Dounin mdounin на mdounin.ru
Чт Ноя 25 14:28:32 MSK 2010


Hello!

On Thu, Nov 25, 2010 at 10:23:38AM +0300, Артем Паньков wrote:

> Система Centos 5.4
> Раз в двое суток на проекте с посещаемостью 50000 просмотров в сутки
> зависает nginx. LA = 2.00(ровно и не меняется, nginx занимает ровно 100%
> процессора), вроде никакого особого статуса в топе нет
>  PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND
> 19496 nginx     25   0 77744 3252  848 R 100.2  0.1 481:38.24 nginx
> 17412 nginx     25   0 77336 2980  856 R 99.6  0.0 481:38.54 nginx

[...]

> После, что сообщает debug.log в момент зависания:
> 2010/11/25 01:46:39 [notice] 16259#0: signal 17 (SIGCHLD) received
> 2010/11/25 01:46:39 [alert] 16259#0: worker process 17411 exited on signal
> 11

Вот тут должна была образоваться корка.  Если не образовалась - 
читать тут:

http://wiki.nginx.org/Debugging

Если образовалась - читать там же, но остальное.

[...]

> Данное поведение на сервере начала появляться недавно. Похоже, после
> включения кэширования анонимов.

[...]

> *куда копать?*

Никаких ужасных проблем в конфиге не видно, так что либо это бага 
в кеше, либо проблемы с атомарными операциями[1]. Для начала - 
показать backtrace и вывод nginx -V.

[1] Буквально на днях в английском листе рассылки приходил 
товарищ, у которого судя по всему атомарные операции вообще не 
работали.  И там тоже был то ли RHEL, то ли какая-то производная.  
И nginx собранный gcc 4.1.

У него проблема вылечилась убиранием inactive=1m в кеше (но я 
подозреваю что вылечилась только всилу "moderate load", при 
больших нагрузках опять вылезет).  На предложение попробовать 
пересобраться без gcc'шных атомарных операций он пока не 
откликнулся:

http://nginx.org/pipermail/nginx/2010-November/023723.html

Maxim Dounin



Подробная информация о списке рассылки nginx-ru