Re: подсчет кол-ва ошибок при обращении к апстриму

Maxim Dounin mdounin at mdounin.ru
Wed Aug 21 11:55:37 UTC 2013


Hello!

On Wed, Aug 21, 2013 at 07:35:48AM -0400, pturrr wrote:

> Добрый день.
> 
> У нас есть апстрим, у которого установлены достаточно маленькие значения
> таймаутов. В error.log пишется, что Connection timed out while reading
> upstream... Это для нас нормальная ситуация. Мы озаботились тем, чтобы
> считать кол-во ошибок, которые попадают в лог. Берем последнюю минуту,
> считаем все строки, где есть Сonnection timed out и рисуем график. 
> 
> Когда у нас произошел таймаут к апстриму, мы отдаем пустую страничку и HTTP
> 200/OK
> error_page 500 501 502 503 504 = наш локейшен, который отдает 200ок
> 
> В локейшене, который отдает 200ок у нас есть аксесс лог, в который мы пишем
> обращения к нему.
> 
> То есть у нас есть два лога - error.log, и access.log другого локейшена,
> куда нжинкс перенаправляет в случае ошибки первого. Логично было бы
> предположить, что кол-во ошибок за секунду было бы равно кол-ву ошибок
> access лога того локейшена, куды мы редиректим. Но это не так. Кол-во ошибок
> в error.log намного больше, чем кол-во обращений к локейшену, который отдает
> HTTP 200. 
> 
> Как такое может быть?

Если ошибка происходит "while reading upstream", то заголовок 
и начало ответа уже ушли клиенту, и отдать ему что-то другое уже 
не представляется возможным.

-- 
Maxim Dounin
http://nginx.org/en/donation.html



Подробная информация о списке рассылки nginx-ru