spaCy 是一个用 Python 编写的高效自然语言处理库,专为生产环境设计,支持多种语言(如中文、英文、法语等)。其核心功能包括:

  • 文本处理 📄
    提供分词、词性标注、命名实体识别、依存句法分析等基础功能。

    文本处理_示例
  • 预训练模型 📦
    内置大量语言模型(如 en_core_web_smzh_core_web_sm),可直接用于任务。

    模型_预训练
  • 扩展性 🔧
    通过插件系统支持自定义管道、模型训练和迁移学习。

    扩展性_插件

快速入门 🚀

安装命令:

pip install spacy
python -m spacy download zh_core_web_sm

示例代码:

import spacy
nlp = spacy.load("zh_core_web_sm")
doc = nlp("自然语言处理是人工智能的重要领域。")
for token in doc:
    print(token.text, token.lemma_, token.pos_)

相关资源 📚

🌟 提示:spaCy 的性能优化和工业级应用案例可参考 spaCy 项目页面