NLTK(Natural Language Toolkit)是Python中处理自然语言的常用库,适合初学者入门。以下是几个经典示例,帮助你快速掌握其核心功能:
1. 安装与初始化
pip install nltk
导入NLTK后,需下载常用数据包:
import nltk
nltk.download('punkt')
nltk.download('averaged_perceptron_tagger')
nltk.download('maxent_ne_chunker')
nltk.download('words')
📌 图片:nltk_setup
2. 基本用法
分词示例
from nltk.tokenize import word_tokenize
text = "NLTK是自然语言处理的利器!"
tokens = word_tokenize(text)
print(tokens)
词性标注
from nltk import pos_tag
tags = pos_tag(tokens)
print(tags)
📌 图片:tokenization_example
3. 实战案例
分析文本结构
from nltk import ne_chunk
tree = ne_chunk(tags)
print(tree)
📌 图片:ner_analysis
4. 扩展阅读
想深入了解NLP基础概念?点击前往:community/tutorials/nlp_basics/overview ✅
📌 图片:nltk_logo