NLTK(Natural Language Toolkit)是Python中处理自然语言的常用库,适合初学者入门。以下是几个经典示例,帮助你快速掌握其核心功能:

1. 安装与初始化

pip install nltk

导入NLTK后,需下载常用数据包:

import nltk
nltk.download('punkt')
nltk.download('averaged_perceptron_tagger')
nltk.download('maxent_ne_chunker')
nltk.download('words')

📌 图片nltk_setup

2. 基本用法

分词示例

from nltk.tokenize import word_tokenize
text = "NLTK是自然语言处理的利器!"
tokens = word_tokenize(text)
print(tokens)

词性标注

from nltk import pos_tag
tags = pos_tag(tokens)
print(tags)

📌 图片tokenization_example

3. 实战案例

分析文本结构

from nltk import ne_chunk
tree = ne_chunk(tags)
print(tree)

📌 图片ner_analysis

4. 扩展阅读

想深入了解NLP基础概念?点击前往:community/tutorials/nlp_basics/overview

📌 图片nltk_logo