Простой Python. современный стиль программирования - читать онлайн бесплатно полную версию книги . Страница 148

В этой проверке мы добавим туда следующие символы:

 три буквы ASCII;

 три знака препинания, которые не должны совпасть с шаблоном \w;

 символ Unicode LATIN SMALL LETTER E WITH CIRCUMFLEX (\u00ea);

 символ Unicode LATIN SMALL LETTER E WITH BREVE (\u0115):

>>> x = 'abc' + '-/*' + '\u00ea' + '\u0115'

Как и ожидалось, этот шаблон нашел только буквы:

>>> re.findall('\w', x)�

['a', 'b', 'c', 'к', 'e']

Текстовые строки

197

Шаблоны: использование спецификаторов

Теперь сделаем пиццу из знаков препинания, используя основные спецификаторы

шаблонов для регулярных выражений, показанные в табл. 7.4.

В этой таблице expr и другие слова, выделенные курсивом, означают любое

корректное регулярное выражение.

Таблица 7.4. Спецификаторы шаблонов

Шаблон

Совпадения

abc

Буквосочетание abc

(expr)

expr

expr1 | expr2

expr1 или expr2

Любой символ, кроме \n

^

Начало строки источника

$

Конец строки источника

prev ?

Ноль или одно включение prev

prev *

Ноль или больше включений prev, максимальное количество

prev *?

Ноль или больше включений prev, минимальное количество

prev +

Одно или больше включений prev, максимальное количество

prev +?

Одно или больше включений prev, минимальное количество

prev { m }

m последовательных включений prev

prev { m, n }

От m до n последовательных включений prev, максимальное количество

prev { m, n }?

От m до n последовательных включений prev, минимальное количество

[abc]

a, или b, или c (аналогично a|b|c)

[^abc]

Не (a, или b, или c)