Re: Регекс локейшены с русскими именами

Maxim Dounin mdounin на mdounin.ru
Ср Июл 20 11:48:32 UTC 2011


Hello!

On Wed, Jul 20, 2011 at 06:41:09AM -0400, RedRat wrote:

> Имеется nginx 1.0.4 под которым работает
> DokuWiki с русскими именами страниц.
> Понадобилось все запросы к одному
> диапазону имён редиректить на другой. В
> случае обычного локейшена это делается
> без проблем, всё замечательно работает
> с русскими именами в URI. Проблема
> вылезла, когда я обычный локейшн
> попытался поменять на регексповый
> (чтобы ловить в него запросы без учёта
> регистра) - в него попадают только те
> запросы, русские буквы в которых в
> точности соответствуют содержанию
> регекспа, невзирая на наличие ~*.
> 
> Пример:
> 
> location ~* ^/старый: {
>     rewrite ^(.*):(.*)$ /новый:$2 permanent;
> }
> 
> В него попадают запросы, начинающиеся с
> "/старый:", но не попадают запросы,
> начинающиеся со "/Старый:".
> 
> ЧЯДНТ?

Для case-insensitive matching'а UTF-8 строк можно сделать так 
(если конечно pcre собран с UTF-8 и т.п.):

    location ~* (*UTF8)^/старый: {
        ...
    }

Но я *не* рекомендую так делать в общем случае, ибо на запросах с 
uri не являющимся валидной utf-8 строкой будет возвращена 500-я 
ошибка.  

Безопаснее решение - написать несколько статических location'ов 
или регулярное выражение с альтернативами, i.e.

    location /Старый: { ... }
    location /старый: { ... }

    location ~ ^/(?:С|с)тарый: { ... }

> P.S. Ещё один вопрос в догонку: в
> документации сказано, что выделения в
> регекс-локейшене можно потом
> использовать в других директивах. Я
> попробовал сделать так:
> 
> location ~* ^(/старый:)(.*)$ {
>     rewrite ^ /новый:$2 permanent;
> }
> 
> Nginx на такой локейшн не ругается - но и
> не работает. Вдумчивое чтение
> документации (два раза) не помогло.
> Подскажите, где я ошибаюсь.

Директива rewrite сама по себе выполняет регулярное выражение, 
соответственно $2 будет браться из него (последнего выполненного).  
Можно сделать с использованием именованных выделений, так:

    location ~ ^/старый:(?<page>.*)$ {
        rewrite ^ /новый:$page permanent;
    }

Maxim Dounin



Подробная информация о списке рассылки nginx-ru