正则表达式(Regular Expression,简称 Regex)是一种用于处理字符串的强大工具,它可以用来匹配、查找、替换字符串中的特定模式。
基本概念
- 模式(Pattern):正则表达式定义的规则,用于匹配字符串中的特定格式。
- 文本(Text):要被搜索的字符串。
- 匹配(Match):模式与文本中的某个部分相匹配。
语法
- 字符匹配:使用
.
来匹配除换行符以外的任意单个字符。 - 字符集匹配:使用方括号
[]
来匹配字符集内的任意一个字符。 - 量词:
*
:匹配前面的子表达式零次或多次。+
:匹配前面的子表达式一次或多次。?
:匹配前面的子表达式零次或一次。{n}
:匹配前面的子表达式恰好 n 次。{n,}
:匹配前面的子表达式至少 n 次。{n,m}
:匹配前面的子表达式至少 n 次,但不超过 m 次。
实例
假设我们要匹配一个电子邮件地址,可以使用以下正则表达式:
^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$
这个正则表达式的意思是:
^
:匹配字符串的开始。[a-zA-Z0-9._%+-]+
:匹配一个或多个字母、数字、点、下划线、百分号、加号或减号。@
:匹配字符@
。[a-zA-Z0-9.-]+
:匹配一个或多个字母、数字、点或减号。\.
:匹配字符.
。[a-zA-Z]{2,}
:匹配两个或更多的字母。$
:匹配字符串的结束。
扩展阅读
更多关于正则表达式的教程,请访问正则表达式教程。
Regular Expression