Настройка nginx и ядра Linux для разрыва зависших соединений
Eugene Batogov
johnbat26 на gmail.com
Пт Фев 4 11:24:08 MSK 2011
Приветствую всех.
Тут случилась проблема c nginx & nginx_http_push_module (
http://ru.wikipedia.org/wiki/Comet_%28%D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5%29
)
Мы используем comet a.k.a Reverse AJAX.
Канал у клиентов ADSL. Очень часто рвется соединение по comet-у.
Когда из JavaScript вызывается abort для XMLHttpRequest, то соединения не
накапливаются.
Но когда рвется сеть на физическом уровне, то коннект остается на сервере и
висит бесконечно.
Команда netstat четко показывает зависшие ESTABLISHED соединения.
*Вопрос:* как настроить nginx или sysctl.conf или netfilter, чтобы он
гарантированно рвал зависшие соединения?
*Задача,* поддержать на сервере ~ 80000 одновременных соединений без утечек
памяти по соединениям.
------------------
Окружение:
*uname -a :* Linux server1 2.6.18-194.el5PAE #1 SMP Fri Apr 2 15:37:44 EDT
2010 i686 i686 i386 GNU/Linux
*OS:* CentOs 5.0
*nginx -V:*
nginx version: nginx/0.8.53
built by gcc 4.1.2 20080704 (Red Hat 4.1.2-48)
TLS SNI support disabled
configure arguments: --user=nginx --group=nginx --prefix=/usr/share/nginx
--sbin-path=/usr/sbin/nginx --conf-path=/etc/nginx/nginx.conf
--error-log-path=/var/log/nginx/error.log
--http-log-path=/var/log/nginx/access.log
--http-client-body-temp-path=/var/lib/nginx/tmp/client_body
--http-proxy-temp-path=/var/lib/nginx/tmp/proxy
--http-fastcgi-temp-path=/var/lib/nginx/tmp/fastcgi
--pid-path=/var/run/nginx.pid --lock-path=/var/lock/subsys/nginx
--with-http_secure_link_module --with-http_random_index_module
--with-http_ssl_module --with-http_realip_module --with-http_addition_module
--with-http_sub_module --with-http_dav_module --with-http_flv_module
--with-http_gzip_static_module --with-http_stub_status_module
--with-http_perl_module --with-mail --with-mail_ssl_module
--with-cc-opt='-O2 -g -m32 -march=i386 -mtune=generic
-fasynchronous-unwind-tables' --with-ipv6
--add-module=/usr/src/redhat/BUILD/nginx-0.8.53/nginx-upstream-fair
--add-module=/usr/src/redhat/BUILD/nginx-0.8.53/nginx-upload-progress-module
--add-module=/usr/src/redhat/BUILD/nginx-0.8.53/mod_zip-1.1.6
--add-module=/usr/src/redhat/BUILD/nginx-0.8.53/nginx_upload_module-2.2.0
--add-module=/usr/src/redhat/BUILD/nginx-0.8.53/nginx_mod_h264_streaming-2.2.7
--add-module=/usr/src/redhat/BUILD/nginx-0.8.53/nginx_http_push_module-0.692
--add-module=/usr/src/redhat/BUILD/nginx-0.8.53/nginx_upstream_hash-0.3.1
------
Вот часть конфига nginx.conf:
#######################################################################
# GLOBAL PARAMETERS
#######################################################################
user root;
worker_processes 8;
timer_resolution 100ms;
worker_rlimit_nofile 1000000;
worker_priority -5;
error_log /var/log/nginx/error.log crit;
pid /var/run/nginx.pid;
events {
worker_connections 100000;
use epoll;
}
#######################################################################
# HTTP PARAMETERS
#######################################################################
http {
include mime.types;
default_type application/x-javascript;
log_format main '$remote_addr - $remote_user [$time_local] $request '
'"$status" $body_bytes_sent "$http_referer" '
'"$http_user_agent" "$http_x_forwarded_for"';
access_log on;
client_header_buffer_size 1k;
large_client_header_buffers 4 4k;
gzip on;
gzip_min_length 1100;
gzip_buffers 64 8k;
gzip_comp_level 3;
gzip_http_version 1.1;
gzip_proxied any;
gzip_types text/plain application/xml application/x-javascript text/css;
output_buffers 32 512k;
sendfile_max_chunk 128k;
postpone_output 1460;
server_names_hash_bucket_size 64;
client_max_body_size 15m;
sendfile on;
tcp_nopush on;
tcp_nodelay on;
#send_lowat 12000;
#timeouts
keepalive_timeout 60 60;
client_header_timeout 1m;
client_body_timeout 1m;
send_timeout 1m;
reset_timedout_connection on;
...
---------
Мой sysctl.conf:
-----------
# Kernel sysctl configuration file for Red Hat Linux
# version 1.1
# For binary values, 0 is disabled, 1 is enabled. See sysctl(8) and
# sysctl.conf(5) for more details.
# Controls IP packet forwarding
net.ipv4.ip_forward = 0
# Controls source route verification
net.ipv4.conf.default.rp_filter = 0
# Do not accept source routing
net.ipv4.conf.default.accept_source_route = 0
# Controls the System Request debugging functionality of the kernel
kernel.sysrq = 0
# Controls whether core dumps will append the PID to the core filename
# Useful for debugging multi-threaded applications
kernel.core_uses_pid = 1
# Controls the use of TCP syncookies
net.ipv4.tcp_syncookies = 1
# Controls the maximum size of a message, in bytes
kernel.msgmnb = 65536
# Controls the default maxmimum size of a mesage queue
kernel.msgmax = 65536
# Controls the maximum shared segment size, in bytes
kernel.shmmax = 4294967295
# Controls the maximum number of shared memory segments, in pages
kernel.shmall = 268435456
###################
#Custom parameters#
###################
# We use it always
# Параметр представляет собой два целых числа, которые определяют диапазон
локальных портов,
# которые используются в клиентских соединениях, т.е. для исходящих
# соединений, которые связывают нашу систему с некоторым узлом сети, где мы
выступаем в качестве клиента
net.ipv4.ip_local_port_range = 1025 65535
# Быстрая утилизация сокетов находящихся в состоянии TIME_WAIT
net.ipv4.tcp_tw_recycle = 1
# Время пребывания сокета в состоянии FIN-WAIT-2
net.ipv4.tcp_fin_timeout = 3
# New param
# Длина очереди для входящих пакетов
net.core.netdev_max_backlog = 10000
# Количество возможных подключений к сокету, прежде чем будут отброшены
net.core.somaxconn = 262144
# Буфер под хранение SYN запросов на соединение. Значение по умолчанию 1024,
что очень мало для нагруженных серверов.
net.ipv4.tcp_max_syn_backlog = 262144
# Возможное количество сокетов в состоянии TIME_WAIT
net.ipv4.tcp_max_tw_buckets = 720000
# Опция включена, иначе не будет работать опция tcp_tw_reuse описанная ниже
net.ipv4.tcp_timestamps = 1
# Механизм, разрешающий использовать уже существующие сокеты которые
находятся в состоянии TIME_WAIT, если это не повредит безопасности.
net.ipv4.tcp_tw_reuse = 1
# Временной интервал попытки определения жизнеспособности соединения.
# По умолчанию 7200, т е через 2 часа после того как через соединение прочел
последний пакет,
# система отправит keep-alive запрос чтобы узнать состояние соединения.
Уменьшим этот параметр до 30 минут.
net.ipv4.tcp_keepalive_time = 30
# Количество посылок keepalive запросов и интервалов между запросами.
# По умолчанию делается 9 попыток с интервалом в 75 секунд, что в свою
очередь займет 9*75=11 минут и 25 секунд,
# что в сочетании с параметром по умолчанию net.ipv4.tcp_keepalive_time =
7200 дает нам
# значение 2часа 11 минут 25 секунд -- минимальное значение времени после
которого соединение будет закрыто нашей стороной
# после прохождения через это соединение последнего пакета. Это очень
большой интервал.
net.ipv4.tcp_keepalive_probes = 2
net.ipv4.tcp_keepalive_intvl = 10
# Максимальный размер буферов по умолчанию для приема и отправки данных
через сокеты (в байтах)
net.core.wmem_max = 33554432
net.core.rmem_max = 33554432
# Размер буферов по умолчанию для приема и отправки данных через сокеты (в
байтах)
net.core.rmem_default = 8388608
net.core.wmem_default = 4194394
# Настройка буферов для TCP и UDP соединений (min, default, max bytes) (в
байтах)
net.ipv4.tcp_rmem = 4096 8388608 16777216
net.ipv4.tcp_wmem = 4096 4194394 16777216
# Этот параметр дает ядру больше памяти для TCP.
# Это будет необходимо при 50k+ открытых соединений.
net.ipv4.tcp_mem = 109568 109568 109568
# Количество попыток закрыть соединение перед тем как оно будет разорвано
# принудительно. Если вы администрируете http-сервер, который испытывает
# большие нагрузки, то стоит подумать об уменьшении этого значения.
# Переменная принимает целое число. Значение по-умолчанию 7, что
# соответствует, примерно, от 50 секунд до 16 минут
net.ipv4.tcp_orphan_retries = 3
# Переменная задает максимальное число осиротевших (не связанных ни с
# одним процессом) сокетов. Если это число будет превышено, то такие
# соединения разрываются, а в системный журнал пишется предупреждение. Это
# ограничение существует исключительно ради предотвращения простейших
# разновидностей DoS-атак.
net.ipv4.tcp_max_orphans = 300000
net.ipv4.conf.eth0.rp_filter = 0
net.ipv4.conf.all.rp_filter = 0
# Максимальное значение открытых файлов. Что бы его узнать, выполните
#net.ipv4.netfilter.ip_conntrack_tcp_timeout_close = 30
#net.ipv4.netfilter.ip_conntrack_tcp_timeout_time_wait = 30
#net.ipv4.netfilter.ip_conntrack_tcp_timeout_last_ack = 120
#net.ipv4.netfilter.ip_conntrack_tcp_timeout_close_wait = 30
#net.ipv4.netfilter.ip_conntrack_tcp_timeout_fin_wait = 60
#net.ipv4.netfilter.ip_conntrack_tcp_timeout_established = 30
#net.ipv4.netfilter.ip_conntrack_tcp_timeout_syn_recv = 30
#net.ipv4.netfilter.ip_conntrack_tcp_timeout_syn_sent = 30
net.ipv4.tcp_fin_timeout = 30
net.ipv4.tcp_sack = 0
net.ipv4.tcp_timestamps = 0
# команду cat /proc/sys/fs/file-max
fs.file-max = 999999
# Virtual memory
# Использовать swap только в крайнем случае
vm.swappiness = 20
--
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://nginx.org/pipermail/nginx-ru/attachments/20110204/689c6d2d/attachment-0001.html>
Подробная информация о списке рассылки nginx-ru