Spacy 是一个强大的自然语言处理库,广泛用于文本分析、分词、命名实体识别等任务。以下是一些 Spacy 的教程和资源,帮助您快速上手。
入门教程
快速安装与配置
- 安装 Spacy:
pip install spacy
- 选择模型:
python -m spacy download en_core_web_sm
(以英文为例)
- 安装 Spacy:
基础使用
- 分词:
nlp = spacy.load('en_core_web_sm')
- 分词示例:
doc = nlp('This is a sample text.')
- 查看分词结果:
[Token(text='This', start=0, end=3, ...), Token(text='is', start=4, end=6, ...), ...]
- 分词:
命名实体识别
- 使用内置的 NER 模型:
ents = doc.ents
- 查看实体类型和文本:
for ent in ents: print(ent.text, ent.label_
- 使用内置的 NER 模型:
高级教程
自定义模型
- 创建自定义词典:
nlp = spacy.load('en_core_web_sm')
- 添加自定义词典:
nlp.add_pipe('custom_entity', before='ner')
- 使用自定义实体识别:
ents = doc.ents
- 创建自定义词典:
情感分析
- 使用情感分析模型:
nlp = spacy.load('en_core_web_sm')
- 查看情感得分:
doc.sentiment
- 使用情感分析模型:
词性标注
- 使用词性标注模型:
nlp = spacy.load('en_core_web_sm')
- 查看词性标注结果:
[Token(text='This', start=0, end=3, tag='DT'), Token(text='is', start=4, end=6, tag='VBZ'), ...]
- 使用词性标注模型:
学习资源
- Spacy 官方文档:https://spacy.io/usage
- Spacy 中文社区:https://spacy.io/zh_cn/
希望这些教程能帮助您更好地了解和使用 Spacy。如果您有任何疑问,欢迎在 Spacy 中文社区 中提问。