自然语言处理(NLP)是人工智能的重要分支,NLTK(Natural Language Toolkit)作为Python中常用的NLP库,为文本分析提供了丰富的工具。以下是快速上手指南:
📦 安装 NLTK
pip install nltk
📌 提示:安装后需下载语料库:
import nltk
nltk.download('punkt')
nltk.download('stopwords')
🧩 基础功能示例
分词:将文本拆分为单词
from nltk.tokenize import word_tokenize text = "NLTK 是一个强大的 NLP 工具包" print(word_tokenize(text))
词性标注:识别单词词性
from nltk import pos_tag words = ["NLTK", "是", "一个", "强大的", "工具包"] print(pos_tag(words))
去除停用词:过滤无意义词汇
from nltk.corpus import stopwords stop_words = set(stopwords.words('chinese')) filtered_text = [word for word in words if word not in stop_words] print(filtered_text)
🚀 实际应用场景
- 情感分析
- 文本分类
- 机器翻译预处理
📌 扩展学习:了解更多NLP基础概念 或尝试 文本分析实战案例