安装 Spacy
首先需要安装 Spacy 库,支持多种语言模型。
pip install spacy
python -m spacy download zh_core_web_sm # 中文模型
基本用法
import spacy
nlp = spacy.load("zh_core_web_sm")
doc = nlp("Spacy 是一个强大的自然语言处理库。")
for token in doc:
print(token.text, token.lemma_, token.pos_)
实体识别示例
from spacy import displacy
text = "马云创立了阿里巴巴集团,总部位于杭州。"
doc = nlp(text)
displacy.render(doc, style="ent", jupyter=True)
输出结果将包含:
- 人名(PER):马云
- 组织名(ORG):阿里巴巴集团
- 地点(LOC):杭州
扩展学习
📌 提示:中文处理时需确保已下载对应语言模型,可通过
python -m spacy download zh_core_web_sm
完成。