spaCy 是一个强大的自然语言处理库,支持多种语言并提供高效的文本分析功能。以下是关于 spaCy 文档的快速入门指南:

📦 安装 spaCy

  1. 使用 pip 安装:
    pip install spacy
    
  2. 下载语言模型(以中文为例):
    python -m spacy download zh_core_web_sm
    

🧠 核心功能

  • 文本标注:支持实体识别、依存句法分析等
  • 管道配置:可自定义处理流程(如添加词性标注)
  • 高效处理:基于 Cython 的优化,速度远超传统 NLP 工具

📖 示例代码

import spacy

# 加载中文模型
nlp = spacy.load("zh_core_web_sm")

# 处理文本
doc = nlp("自然语言处理是人工智能的重要领域!")
for token in doc:
    print(token.text, token.pos_)

🌐 扩展学习

spacy_logo