Re: nginx в ядре завис

Igor Sysoev igor на sysoev.ru
Ср Дек 29 22:58:35 MSK 2010


On Wed, Dec 29, 2010 at 10:52:17PM +0300, Михаил Монашёв wrote:

> Здравствуйте.
> 
> Вот такая картина:
> 
>  top
> last pid: 38341;  load averages: 29.97, 30.23, 29.17 up 128+06:59:21 20:11:31
> 77 processes:  31 running, 46 sleeping
> CPU:  0.0% user,  0.0% nice, 99.9% system,  0.0% interrupt,  0.1% idle
> Mem: 1609M Active, 8570M Inact, 2149M Wired, 424M Cache, 3284M Buf, 19G Free
> Swap:
> 
>   PID USERNAME    THR PRI NICE   SIZE    RES STATE   C   TIME   WCPU COMMAND
> 92850 www           1 122   20  1222M  1214M RUN     5 218:15 28.56% nginx
> 92859 www           1 121   20  1222M  1214M CPU0    3 215:05 28.37% nginx
> 92854 www           1 121   20  1222M  1215M CPU7    5 221:26 28.27% nginx
> 92853 www           1 121   20  1222M  1215M RUN     0 223:09 28.17% nginx
> 92840 www           1 122   20  1222M  1215M CPU4    4 221:51 27.98% nginx
> 92838 www           1 121   20  1224M  1215M RUN     3 242:50 27.78% nginx
> 92856 www           1 121   20  1224M  1215M RUN     0 218:41 27.78% nginx
> 92858 www           1 121   20  1224M  1214M RUN     6 217:53 27.78% nginx
> 92855 www           1 121   20  1222M  1215M RUN     5 213:39 27.78% nginx
> 92860 www           1 121   20  1226M  1217M CPU2    2 211:49 27.69% nginx
> 92832 www           1 122   20  1222M  1214M RUN     5 240:12 27.59% nginx
> 92844 www           1 121   20  1222M  1214M RUN     2 237:11 27.59% nginx
> 92861 www           1 121   20  1224M  1215M RUN     7 222:23 27.59% nginx
> 92836 www           1 121   20  1222M  1214M RUN     2 224:10 27.49% nginx
> 92839 www           1 121   20  1224M  1215M RUN     7 223:32 27.29% nginx
> 92837 www           1 122   20  1222M  1215M RUN     5 219:08 27.29% nginx
> 92847 www           1 122   20  1224M  1216M RUN     4 214:18 27.20% nginx
> 92848 www           1 121   20  1222M  1215M RUN     3 227:21 26.86% nginx
> 92857 www           1 122   20  1224M  1214M RUN     3 221:02 26.86% nginx
> 92852 www           1 121   20  1222M  1214M RUN     4 212:14 26.86% nginx
> 92833 www           1 121   20  1224M  1215M RUN     0 226:34 26.56% nginx
> 92843 www           1 121   20  1224M  1215M RUN     2 221:21 26.56% nginx
> 92849 www           1 121   20  1224M  1215M RUN     6 218:07 26.56% nginx
> 92834 www           1 121   20  1222M  1214M RUN     0 222:42 26.46% nginx
> 92842 www           1 121   20  1224M  1217M RUN     2 208:29 26.37% nginx
> 92841 www           1 121   20  1222M  1215M RUN     1 219:15 26.27% nginx
> 92835 www           1 121   20  1222M  1214M CPU5    0 230:22 26.17% nginx
> 92851 www           1 122   20  1224M  1214M RUN     3 222:21 25.98% nginx
> 92845 www           1 121   20  1222M  1214M CPU3    0 221:35 25.88% nginx
> 92846 www           1 121   20  1222M  1215M RUN     7 210:42 25.59% nginx
> 
> nginx ни чем не прибивается. К диску не обращается вообще. При запросе к
> стуб-статусу tcp-соединение тут же рвётся. ktrace ничего не натрейсил
> - файл 0 длины. FreeBSD 8.1-RELEASE Сервер ребутнули. сейчас нормально
> работает.
> 
> nginx version: nginx/0.8.46
> configure arguments: --prefix=/usr/local/etc/nginx --with-cc-opt='-I /usr/local/include' --with-ld-opt='-L /usr/local/lib' --conf-path=/usr/local/etc/nginx/nginx.conf --sbin-path=/usr/local/sbin/nginx --pid-path=/var/run/nginx.pid --error-log-path=/var/log/nginx-error.log --user=www --group=www --with-file-aio --http-client-body-temp-path=/var/tmp/nginx/client_body_temp --http-fastcgi-temp-path=/var/tmp/nginx/fastcgi_temp --http-proxy-temp-path=/var/tmp/nginx/proxy_temp --http-scgi-temp-path=/var/tmp/nginx/scgi_temp --http-uwsgi-temp-path=/var/tmp/nginx/uwsgi_temp --http-log-path=/var/log/nginx-access.log --with-http_stub_status_module --with-pcre
> 
> 
> Без отфильтрованного nginx-а top выглядит вот так:
> 
> top -S
> last pid: 38355;  load averages: 30.06, 30.22, 29.22 up 128+07:00:02 20:12:12
> 162 processes: 39 running, 101 sleeping, 22 waiting
> CPU:  0.0% user,  0.0% nice,  100% system,  0.0% interrupt,  0.0% idle
> Mem: 1609M Active, 8570M Inact, 2149M Wired, 424M Cache, 3284M Buf, 19G Free
> Swap:
> 
>   PID USERNAME    THR PRI NICE   SIZE    RES STATE   C   TIME   WCPU COMMAND
>     0 root         10 -68    0     0K   144K -       2 623.6H  9.77% kernel
>    11 root          8 171 ki31     0K   128K RUN     0    ???  0.00% idle
>    19 root          1  46    -     0K    16K syncer  6  68.5H  0.00% syncer
>    12 root         22 -60    -     0K   352K WAIT    0  59.2H  0.00% intr
>     3 root          1  -8    -     0K    16K -       0  25.4H  0.00% g_up
>     4 root          1  -8    -     0K    16K -       7  20.7H  0.00% g_down
>    20 root          1  44    -     0K    16K sdflus  7 736:28  0.00% softdepflush
>     8 root          1  52    -     0K    16K ipmire  7 563:30  0.00% ipmi0: kcs
>     9 root          1  44    -     0K    16K psleep  6 512:27  0.00% pagedaemon
>    13 root          1  44    -     0K    16K -       6 366:33  0.00% yarrow
>    21 root          1  44    -     0K    16K flowcl  7 278:41  0.00% flowcleaner
>    18 root          1  44    -     0K    16K vlruwt  6  91:51  0.00% vnlru
>     2 root          1  -8    -     0K    16K -       7   9:38  0.00% g_event
> 
> посмотрел ченж-лог. Ничего подобного не нашёл. Стоит обновляться?

Это похоже на проблемы в ядре: если ktrace ничего не выдаёт, значит
циклится где-то внутри сисколлов.


-- 
Игорь Сысоев
http://sysoev.ru



Подробная информация о списке рассылки nginx-ru