Re: Re: Re: Re: проблемы с производительностью
Науменков Алексей
a.naumenkov на yandex.ru
Сб Июл 17 14:31:27 MSD 2010
Насколько я понимаю drbd - все выглядит так.
Есть у меня раздел на жестком диске sdb1 - с которого производятся операции _чтения_ напрямую. А drbd некий модуль ядра, который исключительно реплицирует операции записи. Глядя на картинку -
http://www.drbd.org/users-guide/drbd-in-kernel.png
Файловая система ближе к сервисам чем drbd - следовательно кэширование файлов ОС должно эффективно работать.
Вдогонку по IO - несмотря на LA = 1.5 - тут проблем не наблюдается
[root на backend1 ~]# iostat
Linux 2.6.18-194.el5 07/17/2010
avg-cpu: %user %nice %system %iowait %steal %idle
0.08 0.00 0.10 0.04 0.00 99.78
Device: tps Blk_read/s Blk_wrtn/s Blk_read Blk_wrtn
sda 1.00 25.20 36.14 19725151 28285958
sda1 0.00 0.00 0.00 2682 94
sda2 1.00 25.20 36.14 19722165 28285864
sdb 13.88 30.76 1702.48 24076997 1332446868
sdb1 13.88 30.76 1702.48 24076077 1332446868
dm-0 0.85 1.20 6.34 939010 4960872
dm-1 6.73 24.00 29.80 18782400 23324992
dm-2 0.00 0.00 0.00 456 0
drbd0 5.13 30.71 25.13 24033432 19664144
17.07.10, 14:15, "Denis F. Latypoff" <latypoff на yandex.ru>:
> 17.07.10, 14:04, "Науменков Алексей" :
>
> > Денис, это было нашей первой гипотезой. Мы на время вынесли корень бекенда с раздела drbd, это картину не поменяло никак.
> >
> > Кроме того, объем программного кода не превышает 32 мегабайт - весь этот объем должен был успешно лечь и в кэш ОС - минуя активное чтение с ФС, и в opcode кэш - следовательно непонятна сама возможность возникновения проблемы. Можно ли как-то более точно выяснить, чтобы понять _точно_ в какие рассылки обращаться дальше? :)
> >
> > Кроме того, насколько я понимаю, нельзя "ждать IO в drbd", т.к. это не файловая система.
>
> А как drbd работает? Я думал это модуль ядра, тогда все IO-related вызовы будут заблокированы этой прослойкой.
> А статики много раздается?
>
> Вообще для таких монстро-подобных серверов 0.5с на рендеринг страницы это конечно ппц...
>
> >
> > 17.07.10, 13:13, "Denis F. Latypoff" :
> >
> > > > Здравствуйте.
> > > > Недавно запускал проект - пока еще малопосещаемый сайт(меньше 20 000 хитов в сутки).
> > > > Centos 5.4 + nginx 0.8.44-45 + apache 2.2
> > > > Заказчиком изначально было выделено железо под кластер:
> > > > 2 сервера 2xE5530 @ 2.40GHz, 16 Gb FBDIMM, 6xST3750630SS(7 оборотов) Raid 10 - задумывались под фронт+бекенд
> > > > 2 сервера 2хE5530 @ 2.40GHz, 32 Gb FBDIMM, 6xST3300657SS(15 оборотов) Raid 10 - задумывались под базу
> > > > Изначально под фронт + бекенд взяли 1 сервак из второй группы и под базу один сервак из второй группы. Все великолепно работало - скорость генерации страниц не превышала 0.5s, LA на фронте и базе не поднимался за 0.3
> > > > После вынесения фронта+бекенда на drbd + ext3 кластер из двух первых серверов на обоих их них LA стал составлять 1-1,3, время генерации страниц возросло до 2 секунд.
> > > > Всплесков посещаемости не было. База дышит спокойно как и раньше. Медленные запросы исключены. Использование eaccelerator изменений не дало. Статика полностью отдается nginx'ом.
> > > > Как узнать, в чем проблема на фронтах и куда копать?
> > >
> > > [...]
> > >
> > > nginx не причем. LA - это кол-во процессов в ожидании процессора.
> > > Процессор в вашем случае занят ожиданием IO в drbd.
> > > Пишите в рассылку по drbd.
> > >
> > > --
> > > br, Denis F. Latypoff.
> > >
> > > _______________________________________________
> > > nginx-ru mailing list
> > > nginx-ru на nginx.org
> > > http://nginx.org/mailman/listinfo/nginx-ru
> > >
> > >
> >
> > _______________________________________________
> > nginx-ru mailing list
> > nginx-ru на nginx.org
> > http://nginx.org/mailman/listinfo/nginx-ru
> >
> >
>
>
Подробная информация о списке рассылки nginx-ru