Перейти к основному содержимому

Регулярные выражения

Регулярные выражения — специальная последовательность символов, которая помогает сопоставлять или находить строки python с использованием специализированного синтаксиса, содержащегося в шаблоне. Регулярные выражения распространены в мире UNIX..

Модуль Re для регулярных выражений в Python

В Python для работы с регулярными выражениями используется модуль re.

Основные функции модуля re:

  • объект Match - Объект возвращаемый функциями

  • match - ищет последовательность в начале строки

  • search - ищет первое совпадение с шаблоном

  • findall - ищет все совпадения с шаблоном. Возвращает результирующие строки в виде списка

  • finditer - ищет все совпадения с шаблоном. Возвращает итератор

  • compile - компилирует регулярное выражение. К этому объекту затем можно применять все перечисленные функции

  • fullmatch - вся строка должна соответствовать описанному регулярному выражению

Кроме функций для поиска совпадений, в модуле есть такие функции:

  • re.sub - для замены в строках
  • re.split - для разделения строки на части

Ссылки

Сайты для проверки регулярных выражений

  • Он-лайн отладка регулярок regex101 (не забудьте поставить галочку Python в разделе FLAVOR слева);
  • для Python - тут можно указывать и методы search, match, findall, и флаги.
    • К сожалению, иногда не все выражения воспринимает.
  • Еще один сайт для Python - не поддерживает методы
    • хорошо работает и отработал те выражения, на которые ругнулся предыдущий сайт.
    • Подходит для однострочного текста отлично.
    • С многострочным надо учитывать, что в Python будет другая ситуация.

Помощь в изучении регулярных выражений