正则表达式(Regular Expression,简称 Regex)是用于处理字符串的一种强大工具,在 Python 中,正则表达式被广泛用于字符串的搜索、替换、匹配等操作。本教程将为您介绍 Python 中正则表达式的使用方法。

基础语法

1. 元字符

正则表达式中的元字符具有特殊的意义,用于匹配特定的字符或模式。

  • .:匹配除换行符以外的任意字符
  • *:匹配前面的子表达式零次或多次
  • +:匹配前面的子表达式一次或多次
  • ?:匹配前面的子表达式零次或一次
  • ^:匹配输入字符串的开始位置
  • $:匹配输入字符串的结束位置
  • []:匹配括号内的任意一个字符(字符类)
  • [^]:匹配不在括号内的任意一个字符(否定字符类)

2. 转义字符

某些字符在正则表达式中具有特殊意义,如果需要匹配这些字符本身,则需要使用转义字符 \

例如,要匹配字符串中的点号 .,需要使用转义字符 \.

实例

1. 匹配邮箱地址

import re

email = 'example@example.com'
pattern = r'^[a-zA-Z0-9_.+-]+@[a-zA-Z0-9-]+\.[a-zA-Z0-9-.]+$'
if re.match(pattern, email):
    print('邮箱地址匹配成功')
else:
    print('邮箱地址匹配失败')

2. 替换字符串

text = 'Hello, world!'
pattern = r'world'
replacement = 'Python'
result = re.sub(pattern, replacement, text)
print(result)  # 输出:Hello, Python!

扩展阅读

想要了解更多关于 Python 正则表达式的知识,可以阅读以下教程:

Python