Re: nginx есть десятки гигабат памяти и сервер уходит в swap
Maxim Dounin
mdounin на mdounin.ru
Вт Янв 11 21:28:36 UTC 2022
Hello!
On Tue, Jan 11, 2022 at 06:10:43PM +0300, Дугин Сергей wrote:
> Здравствуйте, Maxim.
>
> Вы писали 11 января 2022 г., 16:09:07:
>
> > Hello!
>
> > On Tue, Jan 11, 2022 at 05:54:36AM +0300, Дугин Сергей wrote:
>
> >> Здравствуйте, Maxim.
> >>
> >> Вы писали 10 января 2022 г., 22:07:16:
> >>
> >> > А что при этом в конфиге? В частности, worker_connections и
> >> > всевозможные буфера (client_header_buffer_size,
> >> > large_client_header_buffers, client_body_buffer_size,
> >> > proxy_buffer_size, proxy_buffers, output_buffers и так далее)?
> >> > Если включён HTTP/2 - то ещё и http2_max_concurrent_streams.
> >> Эти параметры все по дефолту.
> >> HTTP/2 - нет
> >> http2_max_concurrent_streams - тоже нет
> >>
> >> > Отдельно интересно нет ли в конфиге сторонних модулей. А если
> >> > есть, то воспроизводится ли проблема без них.
> >> Сторонних модулей нет и не ставил
> >> в папке /usr/lib64/nginx/modules/
> >> нет ничего
>
> > [...]
>
> >> > Судя по всему, растут те процессы, которые собственно занимаются
> >> > обработкой соединений: на современных линуксах распределение
> >> > соединений между рабочими процессами может быть сильно
> >> > неравномерным, лечить проще всего включением accept_mutex'а
> >> > (https://trac.nginx.org/nginx/ticket/2285).
> >> Сделал worker_processes auto;
> >> форкеров стало ровно столько сколько ядер и теперь все форкеры кушают примерно одинаково:
> >> 6310 root 20 0 4494660 3.3g 2456 S 0.0 2.6 0:01.82 nginx
> >> 15109 root 20 0 4494660 3.3g 2452 S 2.3 2.6 0:01.32 nginx
> >> 15133 root 20 0 4494660 3.3g 2444 S 0.3 2.6 0:00.89 nginx
> >> 6216 root 20 0 4494660 3.3g 2420 S 0.0 2.6 0:00.65 nginx
> >> 6267 root 20 0 4494660 3.3g 2412 S 0.0 2.6 0:00.99 nginx
> >> 15085 root 20 0 4494660 3.3g 2344 S 1.6 2.6 0:00.94 nginx
> >> 6297 root 20 0 4494660 3.3g 2336 S 0.0 2.6 0:01.53 nginx
> >> 15097 root 20 0 4494660 3.3g 2332 S 2.3 2.6 0:01.09 nginx
> >> 14858 root 20 0 4494660 3.3g 2256 S 0.0 2.6 0:00.40 nginx
> >> 15045 root 20 0 4494660 3.3g 2300 S 0.7 2.6 0:00.54 nginx
> >> 15026 root 20 0 4494660 3.3g 2288 S 0.7 2.6 0:00.55 nginx
> >> и так далее
>
> > В смысле - после включения accept_mutex'а?
>
> Сделал так:
> events {
> accept_mutex on;
> }
> и так
> worker_processes auto;
>
> потребление процессами вроде равномерно.
>
> Но ночью сделал
> worker_processes 6;
> и было так:
> PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
> 9477 root 20 0 101.9g 86.7g 2172 S 1.0 69.0 82:54.87 nginx
> 9467 root 20 0 5078884 275248 2204 S 1.0 0.2 9:18.31 nginx
> 9472 root 20 0 3510260 267848 2176 S 3.9 0.2 5:51.72 nginx
> 9475 root 20 0 3510260 258752 2252 S 1.0 0.2 8:01.37 nginx
> 9463 root 20 0 3510260 257088 2240 S 1.3 0.2 6:41.24 nginx
> 9480 root 20 0 3510260 224516 2256 S 0.3 0.2 7:15.55 nginx
> 9750 root 20 0 3510256 20856 1104 S 0.0 0.0 0:20.91 nginx
> То есть
> accept_mutex on не помогло при малом числе процессов, но возможно и при worker_processes auto так же будет на более длинном промежутке
Судя по цифрам - accept_mutex скорее помог, и соединения
разбалансировались между рабочими процессами. Но, похоже, проблема
скорее в том, что делается в рамках некоторых редких запросов, и
эти запросы и приводят к росту потребляемой памяти. Это
согласуется с тем, что видно в конфиге, см. ниже.
> >> При запуске писало 1.7g, сейчас уже 3.3g
> >> то есть при запуске потребляет 48*1.1=81,6g памяти,
> >> а сейчас уже 158,4G и сервер уже очень бодро свапится.
> >>
> >>
> >> > Почему растут - отдельный вопрос. Для начала, наверное, стоит
> >> > посмотреть, до какого размера процессы могут расти по памяти в
> >> > соответствии с текущими настройками. Грубая оценка максимального
> >> > потребления памяти одним рабочим процессом - worker_connections *
> >> > <сумма всех буферов>. Если она не превышена - то вопрос, скорее,
> >> > в настройках, не соответствующих имеющемуся объёму памяти. Если
> >> > превышена - то имеет смысл разбираться дальше.
> >>
> >> worker_connections поставил по дефолту
> >> буфера тоже все по дефолту
> >> worker_processes сделал 6
> >>
> >> перезапустил вижу по top такое:
> >> USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND
> >> root 15962 4.3 2.6 4477008 3467940 ? S 05:42 0:01 nginx: worker process
> >> root 15954 1.6 2.6 4477008 3467916 ? S 05:42 0:00 nginx: worker process
> >> root 15972 1.4 2.6 4477008 3467876 ? S 05:42 0:00 nginx: worker process
> >> root 15982 0.4 2.6 4477008 3467720 ? S 05:42 0:00 nginx: worker process
> >> root 15993 0.2 2.6 4477008 3467588 ? S 05:42 0:00 nginx: worker process
> >> root 44803 15.8 2.6 4477004 3467200 ? Ss 05:39 0:30 nginx: master process /usr/sbin/nginx -c /etc/nginx/nginx.conf
> >> root 16005 0.1 2.6 4477008 3465784 ? S 05:42 0:00 nginx: worker process
> >>
> >> В итоге 6 процессов кушают 3467940*6 около 20 гиг памяти при старте.
>
> > Занятно. А можно посмотреть конфиг полностью? В идеале - сразу
> > вывод "nginx -T", но можно выкинуть/отфильтровать имена серверов и
> > прочую приватную информацию.
>
> сделал так
> nginx -T | grep -v "server_name\|include\|access_log\|error_log\|\/var\/www\/\|^#\|ssl_certificate" > nginx.conf.1.txt
> IP заменил так же.
>
> Если удобнее могу архивнуть папку /etc/nginx/ и скинуть на личную почту.
Из наиболее подозрительного - вижу разрешённый SSI в некоторых
серверах. Возможно, проблема в том, что в каких-то ситуациях
создаётся очень много SSI-подзапросов, и они и потребляют память.
Из наименее интрузивного - проще всего включить логгирование
подзапросов (https://nginx.org/r/log_subrequest) и посмотреть, что
вылезет в логах (но в общем случае может быть непросто отличить
обычные запросы от подзапросов). Ну или просто выключить SSI и
посмотреть, уйдёт ли проблема.
--
Maxim Dounin
http://mdounin.ru/
Подробная информация о списке рассылки nginx-ru