Re: нормализация uri
Maxim Dounin
mdounin на mdounin.ru
Пн Авг 17 14:58:45 UTC 2020
Hello!
On Mon, Aug 17, 2020 at 10:54:43AM +0300, Gena Makhomed wrote:
> On 14.08.2020 17:27, Maxim Dounin wrote:
>
> > > Есть такая конфигурация:
> > >
> > > client <=> nginx-frontend <=> nginx-backend <=> php-fpm
> > >
> > > Есть задача от SEO'шников/клиентов сделать так, чтобы несколько слешей,
> > > идущих подряд в uri, превращались в один слеш с помощью 301 редиректа,
> > > и чтобы точка в конце домена также убиралась с помощью 301 редиректа.
> > >
> > > Сейчас эту задачу можно решить только на стороне nginx-frontend
> >
> > Никто не запрещает решать эту задачу на любых других уровнях, в
> > том числе в php. Другой вопрос, что если менять URI на строне
> > nginx'а (например, проксируя с заменой части URI) - исходный URI
> > придётся явно пробрасывать и отдельно обрабатывать.
>
> Проксирование без замены части URI можно сделать так:
> location / { proxy_pass http://172.16.1.124$request_uri; }
> А как сделать проксирование с заменой части URI ?
Проксирование без заменыы части URI можно и нужно делать так:
location / { proxy_pass http://172.16.1.124; }
Подробнее об этом рассказано в описании директивы proxy_pass
(http://nginx.org/r/proxy_pass/ru), со слов "URI запроса
передаётся на сервер так: ..." и далее.
> Например, поменяв /path1/ на /path2/ при проксировании:
> location /path1/ { proxy_pass http://172.16.1.124/path2/; }
> не выключая при этом merge_slashes on; в конфиге nginx ?
Если хочется менять путь - исходный $request_uri можно пробросить
на бэкенд явно, в виде отдельного заголовка. E.g.,
proxy_set_header X-Original-URI $request_uri;
и его обрабатывать на бэкенде.
> Кроме того, задача убрать точку в конце домена example.com.
> выглядит нерешаемой на уровне php, потому что на nginx-backend
> запрос приходит уже без точки в конце доменного имени.
Поведение по умолчанию при проксировании предполагает, что на
бэкенд приходит имя, написанное в директиве proxy_pass. Никто не
мешает отправить на бэкенд ровно то, что пришло от клиента в
заголовке Host - либо собственно в заголовке Host запроса на
бэкенд (при этом, впрочем, отвалится обработка authority в строке
запроса), либо опяь же в виде отдельного заголовка.
> > > с помощью такого программирования на конфигах nginx для каждого
> > > виртуального сервера:
> > >
> > > # remove multiple sequences of forward slashes
> > > # The $uri variable with have duplicate slashes removed by default via [merge_slashes on] - just need to rewrite back to $uri
> > > # note: use of the "^[^?]*?" pattern avoids any matches in the querystring section of URI - which would cause an infinite redirect loop
> > > if ($request_uri ~ "^[^?]*?//") {
> > > rewrite "^" $scheme://$host$uri permanent;
> > > }
> > >
> > > if ($http_host ~ "\.$") {
> > > rewrite "^" $scheme://$host$uri permanent;
> > > }
> >
> > Отмечу, что тут "напрограммировано на конфигах" два XSS'а.
> > Эту и другие подобные проблемы умеет, AFAIK, ловить
> > https://github.com/yandex/gixy.
>
> gixy говорит про Possible HTTP-Splitting vulnerability.
> Using variables that can contain "\n" or "\r" may lead to http injection.
> https://github.com/yandex/gixy/blob/master/docs/en/plugins/httpsplitting.md
> Reason: At least variable "$uri" can contain "\n"
>
> Где здесь XSS ?
HTTP response splitting предоставляет атакующему контроль над
ответом, и XSS - одно из прямых и наиболее очевидных следствий.
> И почему nginx не может закодировать "\n" or "\r" перед тем,
> как применять $uri для построения проксированого запроса?
> Это выглядит как не закрытая security vulnerability в nginx.
Ничего не мешает, равно как и, скажем, заменить в отправляемом
перенаправлении A на B. Тут и в остальных подобныых директивах
(return, add_header, proxy_set_header, proxy_pass) nginx ожидает
корректно закодированне значения.
В случае директивы rewrite дополнительно гарантируется, что
переменные $1..$9, полученные из раскодированного URI запроса с
помощью регулярного выражения в первом параметре, будут
рассматриваться как раскодированные.
> > > Насколько высока вероятность того, что патч, реализующий
> > > дополнительную функциональность merge_slashes redirect;
> > > или normalize_uri on; будет принят в основную ветку nginx?
>
> > Задача не кажется типичной. Если очень хочется решать её силами
> > nginx'а - я бы рекомендовал начать с инкапсуляции нужных
> > перенаправленый в отдельных include-файлах, и/или решений на
> > скриптовых языках, или же отдельного модуля для нормализации.
>
> Что написать в include-файлах вместо
>
> if ($request_uri ~ "^[^?]*?//") {
> rewrite "^" $scheme://$host$uri permanent;
> }
>
> if ($http_host ~ "\.$") {
> rewrite "^" $scheme://$host$uri permanent;
> }
>
> чтобы не было XSS ?
rewrite ^(.*) $scheme://$host$1 permanent;
--
Maxim Dounin
http://mdounin.ru/
Подробная информация о списке рассылки nginx-ru