安装 Spacy

首先需要安装 Spacy 库,支持多种语言模型。

pip install spacy
python -m spacy download zh_core_web_sm  # 中文模型
spacy_installation

基本用法

import spacy

nlp = spacy.load("zh_core_web_sm")
doc = nlp("Spacy 是一个强大的自然语言处理库。")
for token in doc:
    print(token.text, token.lemma_, token.pos_)
spacy_basic_usage

实体识别示例

from spacy import displacy

text = "马云创立了阿里巴巴集团,总部位于杭州。"
doc = nlp(text)
displacy.render(doc, style="ent", jupyter=True)

输出结果将包含:

  • 人名(PER):马云
  • 组织名(ORG):阿里巴巴集团
  • 地点(LOC):杭州
实体识别

扩展学习

📌 提示:中文处理时需确保已下载对应语言模型,可通过 python -m spacy download zh_core_web_sm 完成。