Введение в Perl



Регулярные выражения (шаблоны). - часть 3


Perl версии 5 содержит дополнительные конструкции шаблонов:

(?#комментарий)- комментарий в теле шаблона.
(?:шаблон)- группировка как и '( )', но без обратной ссылки
(?=шаблон)- "заглядывание" вперед. Например /\w+(?=\t)/ соответствует слову, за которым идет табуляция, но символ '\t' не включается в результат.

Пример:

$s = "1+2-3*4"; if ($s =~ /(\d)(?=-)/) # Найти цифру за которой стоит '-' { print "$1\n"; # Результат '2' } else { print "ошибка поиска\n";}

(?!шаблон) - "заглядывание" вперед по отрицанию.

Пример:

$s = "1+2-3*4"; if ($s =~ /(\d)(?!\+)/) # Найти цифру за которой не стоит '+' { print "$1\n"; # Результат '2' } else { print "ошибка поиска\n";}

(?ismx) - "внутренние" модификаторы. Удобно применять в шаблонах, где например нужно внутри шаблона указать модификатор.

Правила регулярного выражения. (regex)

  • Любой символ обозначает себя самого, если это не метасимвол. Если вам нужно отменить действие метасимвола, то поставьте перед ним '\'.
  • Строка символов обозначает строку этих символов.
  • Множество возможных символов (класс) заключается в квадратные скобки '[]', это значит, что в данном месте может стоять один из указанных в скобках символов. Если первый символ в скобках это '^' - значит ни один из указанных символов не может стоять в данном месте выражения. Внутри класса можно употреблять символ '-', обозначающий диапазон символов. Например, a-z - один из малых букв латинского алфавита, 0-9 - цифра и т.д.
  • Все символы, включая специальные, можно обозначать с помощью '\' как в языке С.
  • Альтернативные последовательности разделяются символом '|' Заметьте что внутри квадратных скобок это обычный символ.
  • Внутри регулярного выражения можно указывать "подшаблоны" заключая их в круглые скобки и ссылаться на них как '\номер' Первая скобка обозначается как '\1'.
  • [] [] []




    Содержание  Назад  Вперед