正则表达式(Regular Expression,简称 Regex)是一种用于处理字符串的强大工具,它可以用来匹配、查找、替换字符串中的特定模式。

基本概念

  • 模式(Pattern):正则表达式定义的规则,用于匹配字符串中的特定格式。
  • 文本(Text):要被搜索的字符串。
  • 匹配(Match):模式与文本中的某个部分相匹配。

语法

  • 字符匹配:使用 . 来匹配除换行符以外的任意单个字符。
  • 字符集匹配:使用方括号 [] 来匹配字符集内的任意一个字符。
  • 量词
    • *:匹配前面的子表达式零次或多次。
    • +:匹配前面的子表达式一次或多次。
    • ?:匹配前面的子表达式零次或一次。
    • {n}:匹配前面的子表达式恰好 n 次。
    • {n,}:匹配前面的子表达式至少 n 次。
    • {n,m}:匹配前面的子表达式至少 n 次,但不超过 m 次。

实例

假设我们要匹配一个电子邮件地址,可以使用以下正则表达式:

^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$

这个正则表达式的意思是:

  • ^:匹配字符串的开始。
  • [a-zA-Z0-9._%+-]+:匹配一个或多个字母、数字、点、下划线、百分号、加号或减号。
  • @:匹配字符 @
  • [a-zA-Z0-9.-]+:匹配一个或多个字母、数字、点或减号。
  • \.:匹配字符 .
  • [a-zA-Z]{2,}:匹配两个或更多的字母。
  • $:匹配字符串的结束。

扩展阅读

更多关于正则表达式的教程,请访问正则表达式教程


Regular Expression