upstream timed out

Dmitry Y. Labutin dmitry at labutin.com
Mon Oct 15 07:00:38 UTC 2012


Доброго времени суток.

Frontend nginx стоит в Москве. Backend nginx стоит в Нижнем Новгороде.
Между ними по traceroute 10 хостов. На Frontend в error лог наблюдает 
вот такая картина.

2012/10/15 10:33:31 [error] 5438#0: *67542270 upstream timed out (110: 
Connection timed out) while connecting to upstream
2012/10/15 10:34:42 [error] 5436#0: *67548075 upstream timed out (110: 
Connection timed out) while connecting to upstream
2012/10/15 10:34:44 [error] 5437#0: *67544442 upstream timed out (110: 
Connection timed out) while connecting to upstream
2012/10/15 10:34:44 [error] 5436#0: *67548077 upstream timed out (110: 
Connection timed out) while connecting to upstream
2012/10/15 10:34:44 [error] 5437#0: *67548502 upstream timed out (110: 
Connection timed out) while connecting to upstream
2012/10/15 10:34:45 [error] 5437#0: *67546503 upstream timed out (110: 
Connection timed out) while connecting to upstream
2012/10/15 10:34:46 [error] 5437#0: *67546508 upstream timed out (110: 
Connection timed out) while connecting to upstream

По статистике (делаю срезы раз в 10 минут) имеем в зависимости от 
количества посещение от 1 до 20 подобных ошибок за 10 минут.
При этом активность - это порядка 30-50 запросов в секунду.
Возьмем среднее. 10 ошибок в 10 минут и 40 запросов в секунду.
Получаем примерно 0.04% проблемных ситуаций. Замечу, что статистика 
пингов между хостами ВСЕГДА показывала около 1.5% потерь (ping timeout), 
а сообщения в логах nginx на frontend появилась только в середине 
прошлой недели.
Может быть подскажите, в какую сторону копать?

Дмитрий Лабутин



Подробная информация о списке рассылки nginx-ru