Re: помогите понять логику кеширования и буферизации

Maxim Dounin mdounin at mdounin.ru
Mon Jan 28 12:09:12 UTC 2013


Hello!

On Mon, Jan 28, 2013 at 01:22:52PM +0200, Trurl McByte wrote:

> 28 января 2013 г., 11:25 пользователь Maxim Dounin <mdounin at mdounin.ru>написал:
> 
> > On Mon, Jan 28, 2013 at 03:34:00AM -0500, Trurl wrote:
> >
> > > Не могу ничего понять из документации.
> > >
> > > Допустим у меня вот такой набор:
> > >    proxy_temp_path /var/lib/nginx/proxy 1 1;
> > >     proxy_cache_path /var/lib/nginx/proxy/cache levels=1:1
> > > keys_zone=main_cache:256m inactive=42h max_size=5m;
> > >     proxy_buffer_size   8k;
> > >     proxy_buffers       32 8k;
> > >     proxy_busy_buffers_size 64k;
> > >     proxy_max_temp_file_size 0;
> > > # ( рекомендовали тут так для ограничения дискового пространства,
> > > используемого nginx - если что в корне не верно - поправте меня)
> > >
> > > И при таком наборе nginx все равно запихал в кеш файл размером 249M,
> > выкинув
> > > всю мелочь и остался доволен.
> > > Что я делаю не так? Как ограничить максимальный размер кешируемого файла?
> >
> > Сейчас - никак.  Ну то есть с бекенда можно явно запретить
> > кеширование, либо же через proxy_no_cache.  Какой-либо директивы
> > "не кешировать файлы более N" - нет.
> >
> 
> У меня бекендов много разных, там и апачи, и nginx (прочие удалось заменить
> на nginx), в зависимости от целей. А proxy_no_cache не шибко применишь,
> если размер файла заранее не известен.

Это всё понятно, потому и было написано, что сейчас - никак.  Если 
бекенд не выдаёт информации, явно запрещающей или позволяющей 
запретить кеширование, то универсально работающего способа - нет.

> > > > Специальный процесс “cache manager” следит за максимальным размером
> > кэша,
> > > заданным параметром
> > > > max_size, и при превышении его размеров удаляет наименее востребованные
> > > данные.
> > > Это я вообще не понял. Общий размер кеша, на практике, ничего общего с
> > > max_size не имеет, зато подозрительно совпадает с размером, заданным в
> > > keys_zone, который, вроде бы должен задавать размер разделяемой памяти.
> >
> > Размер кеша может превышать установленный максимальный размер
> > (max_size), если cache manger ещё не успел его уменьшить,
> > либо он не может это сделать из-за того, что элементы кеша
> > используются рабочими процессами.
> >
> 
> Я это учитываю, разовые превышения не в счет. Я про то что _суммарный_
> размер кеша в долгосрочной перспективе и с приличной нагрузкой
> устаканивается в точно в размер keys_zone (!), хотя в документации об этом
> вообще ничего нет. При этом max_size вообще ни на что не влияет.

Размер keys_zone соотносится с размером кеша только опосредованно 
(т.к. ограничивает максимальное число элементов, которое может 
храниться в кеше).

Если max_size не учитывается - то скорее всего вы правите не тот 
конфиг, либо не перезагружаете его.

Сразу обращаю внимание: при изменении некоторых параметров кеша 
(путь, levels) nginx может отказаться перезагружать конфиг на 
лету, написав об этом в error log.  В таком случае нужно либо 
перезапустить nginx, либо провести процедуру обновления 
исполняемого файла.

> > При max_size=5m и характерном размере файлов 249m - ничего
> > удивительного, что наблюдаемая реальность мало совпадает с
> > желаемой.
> >
> 
> Не понял про "характерный", на тесте только один такой файл был, при его
> протаскивании из кеша выкидывается почти все (остается файликов на сумму
> дополняющую до 256m). Если файл крупнее 256m - то он не кешируется.
> Невзирая на то, что "Сейчас - никак". Но меня такое ограничение не очень
> устраивает.

Судя по всему, 256m - это то, во что у вас установлен параметр 
max_size.  При превышении max_size - из кеша начинают выкидываться 
старые ответы, и ответ больше max_size - будет практически сразу 
выкинут.  Но это не то же самое, что "не будет закеширован".

> > > Размер proxy_temp_path вообще не понятно как лимитируется. На практике -
> > > достижением 100% забитости диска, после чего все помирает.
> >
> > Совсем в теории - там может быть максимум worker_processes *
> > worker_connections * proxy_max_temp_file_size в отсутствии кеша, и
> > то же с заменой proxy_max_temp_file_size на максимальный размер
> > ответа, возвращаемого бекендом, если кеш включён.
> >
> 
> по такой логике при proxy_max_temp_file_size 0; вообще ничего не должно
> заполняться, а у меня до 50 гигов набегает.

При выключенном кеше - так и есть.  При включённом - от 
proxy_max_temp_file_size ничего не зависит, перечитайте ещё раз 
написанное выше.

> > На практике - под proxy_temp_path просто следует отводить
> > достаточно места.
> 
> 
> Вот только суммарный контент у меня измеряется в террабайтах. А кол-во
> коннектов до 20к на каждый сервер. На тестовом канал 200мбит. Что будет
> когда я его поставлю на продакшен, где отдельный гигабит на каждый сервер -
> я себе плохо представляю. Видимо там так и останется сквид, у которого со
> всем этим проблем нет. Зато у него со стабильностью проблемы...

Арифметика простая: 20k соединений - это 20k * (максимальный 
размер кешируемого файла) в proxy_temp_path максимум, в худшем 
случае.

Пытаться кешировать в таких условиях blue ray диски - таки да, 
некомфортно, согласен.  Но это скорее способ отстрелить себе ногу, 
чем практика.

-- 
Maxim Dounin
http://nginx.com/support.html



Подробная информация о списке рассылки nginx-ru