spaCy 是一个用 Python 编写的高效自然语言处理库,专为生产环境设计,支持多种语言(如中文、英文、法语等)。其核心功能包括:
文本处理 📄
提供分词、词性标注、命名实体识别、依存句法分析等基础功能。预训练模型 📦
内置大量语言模型(如en_core_web_sm
、zh_core_web_sm
),可直接用于任务。扩展性 🔧
通过插件系统支持自定义管道、模型训练和迁移学习。
快速入门 🚀
安装命令:
pip install spacy
python -m spacy download zh_core_web_sm
示例代码:
import spacy
nlp = spacy.load("zh_core_web_sm")
doc = nlp("自然语言处理是人工智能的重要领域。")
for token in doc:
print(token.text, token.lemma_, token.pos_)
相关资源 📚
🌟 提示:spaCy 的性能优化和工业级应用案例可参考 spaCy 项目页面。