Python 自然语言处理库（NLP）

Python 在自然语言处理领域拥有丰富的库，其中最著名的包括 NLTK 和 spaCy。以下是这些库的简要介绍和一些使用示例。

NLTK (Natural Language Toolkit)

NLTK 是一个开源的自然语言处理工具包，它提供了许多用于处理文本数据的模块。

词性标注：NLTK 可以对句子中的每个词进行词性标注，帮助我们理解词在句子中的作用。
分词：NLTK 提供了多种分词方法，可以将文本分割成单词或短语。

示例：

import nltk

sentence = "Natural language processing is fun."
tokens = nltk.word_tokenize(sentence)
tagged = nltk.pos_tag(tokens)

print(tagged)

spaCy

spaCy 是一个快速的自然语言处理库，它提供了许多高级功能，如实体识别、命名实体识别等。

实体识别：spaCy 可以识别文本中的实体，如人名、地点、组织等。
关系抽取：spaCy 可以识别句子中实体之间的关系。

示例：

import spacy

nlp = spacy.load("en_core_web_sm")
doc = nlp("Apple is looking at buying U.K. startup for $1 billion")

# 实体识别
print(doc.ents)

# 关系抽取
print(doc.sentences)

扩展阅读

希望这些信息对您有所帮助！