Spacy 是一个强大的自然语言处理库,用于构建信息提取、文本分类、命名实体识别等任务。它简单易用,支持多种语言,并且具有很高的性能。
快速入门
安装 Spacy: 使用 pip 安装 Spacy:
pip install spacy
加载语言模型: Spacy 支持多种语言模型,以下是一个加载中文模型的例子:
import spacy nlp = spacy.load('zh_core_web_sm')
处理文本: 使用 Spacy 处理文本,可以快速进行分词、词性标注、命名实体识别等操作:
text = "Spacy 是一个开源的自然语言处理库。" doc = nlp(text) for token in doc: print(token.text, token.lemma_, token.pos_, token.dep_, token.ent_type_)
示例
假设我们要识别文本中的命名实体,可以使用以下代码:
for ent in doc.ents:
print(ent.text, ent.start_char, ent.end_char, ent.label_)
输出结果可能是:
Spacy 0 4 ORG
自然语言处理库 6 11 NOUN
扩展阅读
更多关于 Spacy 的信息,可以访问 Spacy 官方文档。

Spacy Logo