три буквы ASCII;
три знака препинания, которые не должны совпасть с шаблоном \w;
символ Unicode LATIN SMALL LETTER E WITH CIRCUMFLEX (\u00ea);
символ Unicode LATIN SMALL LETTER E WITH BREVE (\u0115):
>>> x = 'abc' + '-/*' + '\u00ea' + '\u0115'
Как и ожидалось, этот шаблон нашел только буквы:
>>> re.findall('\w', x)�
['a', 'b', 'c', 'к', 'e']
Текстовые строки
197
Шаблоны: использование спецификаторов
Теперь сделаем пиццу из знаков препинания, используя основные спецификаторы
шаблонов для регулярных выражений, показанные в табл. 7.4.
В этой таблице expr и другие слова, выделенные курсивом, означают любое
корректное регулярное выражение.
Таблица 7.4. Спецификаторы шаблонов
Шаблон
Совпадения
abc
Буквосочетание abc
(expr)
expr
expr1 | expr2
expr1 или expr2
Любой символ, кроме \n
^
Начало строки источника
$
Конец строки источника
prev ?
Ноль или одно включение prev
prev *
Ноль или больше включений prev, максимальное количество
prev *?
Ноль или больше включений prev, минимальное количество
prev +
Одно или больше включений prev, максимальное количество
prev +?
Одно или больше включений prev, минимальное количество
prev { m }
m последовательных включений prev
prev { m, n }
От m до n последовательных включений prev, максимальное количество
prev { m, n }?
От m до n последовательных включений prev, минимальное количество
[abc]
a, или b, или c (аналогично a|b|c)
[^abc]
Не (a, или b, или c)