access.log

Илья Шипицин chipitsine на gmail.com
Ср Июл 13 09:00:30 UTC 2022


ср, 13 июл. 2022 г. в 13:49, Gena Makhomed <gmm на csdoc.com>:

> On 12.07.2022 22:59, Илья Шипицин wrote:
>
> > если рассматривать с точки зрения эффективного использования диска, то
> поля
> > $scheme, $host являются практически константами, можно не логировать их
> на
> > каждую строчку лога (а, например, разнести разные host-ы по разным
> логам).
>
> Разнести разные host-ы по разным логам - это на самом деле плохая идея.
> Когда различных хостов десятки и сотни - это становится очень неудобно.
> Кроме того, это отрицательно сказывается на производительности сервера,
> особенно если используется HDD а не SSD.
>

это полностью в вашей власти, писать в каждую строку host или делать
отдельные логи. насчет производительности в случае HDD - не соглашусь,
если писать с буферизацией (buffer=... и flush=...), то HDD отлично
справляется вплоть до тысяч запросов в сек, выше не проверял.


>
> Имея в наличии один access.log с помощью grep
> можно легко получить из него access.log для любого сайта:
> grep -P '\texample.com\t' access.log | less -S
>

удобство или неудобство действительно рассматривается в зависимости от
используемых инструментов.
что-то подсказывает, что использование grep как ежедневного инструмента -
ну такое. и grep это опять же
требует ssh доступа. навряд ли аналитикам это удобно.



>
> $scheme занимает всего несколько байт, и лучше уж пусть будет,
> для полноты картины, по сравнению с $http_user_agent - это мелочь.
>
> Для удобства чтения лога и для уменьшения его размера
> - можно из лога убрать информацию про таймзону:
>
>      map $time_iso8601 $time {
>          "~([0-9-]+)T([0-9:]+)" "$1 $2";
>          volatile;
>      }
>
>      log_format frontend '$time\t...';
>
> Тогда время в логе будет выглядеть примерно так:
>
> 2022-07-13 11:34:40
>
> а не так:
>
> 2022-07-13T11:34:40+03:00
>
> Переменная $time вместо $time_iso8601 в логе
> дает и меньший объем лога и его лучшую читаемость.
>

iso8601 удобен тем, что он поддерживается для импорта во что угодно.
соглашусь, что можно его убрать в логе, а потом добавить при импорте, если
надо


>
> Недостаток у этого варианта с переменной $time только
>

ко мне как-то приставали, чтобы сделать map, которая добавляет миллисекунды
))


> один - приходится программировать на конфигах nginx,
> используя map и регулярные выражения, - это несколько
> увеличивает объем конфига, но должно работать достаточно быстро.
>
> --
> Best regards,
>   Gena
> _______________________________________________
> nginx-ru mailing list -- nginx-ru на nginx.org
> To unsubscribe send an email to nginx-ru-leave на nginx.org
>
----------- следующая часть -----------
Вложение в формате HTML было извлечено…
URL: <http://mailman.nginx.org/pipermail/nginx-ru/attachments/20220713/435827b3/attachment.htm>


Подробная информация о списке рассылки nginx-ru