Python 标准库提供了丰富的文本处理模块,这些模块可以帮助开发者进行字符串操作、正则表达式匹配、文件读写等任务。以下是一些常用的文本处理模块:
1. str
模块
str
模块是 Python 中最基本的字符串操作模块,它提供了丰富的字符串方法,例如:
str.upper()
:将字符串转换为大写。str.lower()
:将字符串转换为小写。str.strip()
:删除字符串两端的空白字符。str.split()
:按指定的分隔符分割字符串。
示例:
text = "Python is awesome!"
print(text.upper()) # 输出:PYTHON IS AWESOME!
2. re
模块
re
模块是 Python 中处理正则表达式的模块,它提供了强大的字符串匹配功能。以下是一些常用的正则表达式方法:
re.match()
:从字符串的起始位置匹配正则表达式。re.search()
:在字符串中搜索正则表达式。re.findall()
:查找字符串中所有匹配正则表达式的子串。
示例:
import re
text = "Hello, world!"
match = re.match(r"Hello", text)
if match:
print(match.group()) # 输出:Hello
3. fileinput
模块
fileinput
模块提供了读取文件的便捷方式,它允许你一次性读取多个文件,并对每个文件执行相同的操作。
示例:
import fileinput
for line in fileinput.input("*.txt"):
print(line.strip())
更多关于 Python 标准库文本处理模块的详细信息,请访问Python 文档。