spaCy 教程：中文自然语言处理入门 🚀

欢迎来到中文自然语言处理（NLP）社区！本教程将带你了解如何使用 spaCy 这个强大的自然语言处理库进行中文文本分析。spaCy 是一个用 Python 编写的工业级 NLP 工具，支持高效的文本处理和机器学习模型。

1. 安装 spaCy

首先需要安装 spaCy，以及中文语言模型：

pip install spacy
python -m spacy download zh_core_web_sm

如果你对安装过程有疑问，可以点击这里查看详细说明。

2. 基础用法

import spacy

nlp = spacy.load("zh_core_web_sm")
doc = nlp("自然语言处理是人工智能的一个重要分支。")
for token in doc:
    print(token.text, token.pos_)

输出示例：

自然 NOUN
语言 NOUN
处理 NOUN
是 AUX
人工 NOUN
智能 NOUN
的 PART
一个 NUM
重要 ADJ
分支 NOUN
。 PUNCT

3. 实体识别

doc = nlp("阿里巴巴集团成立于1999年。")
for ent in doc.ents:
    print(ent.text, ent.label_)

输出示例：

阿里巴巴集团 ORG
1999年 DATE

4. 文本分类

from spacy.textcat import TextCat

# 配置文本分类模型
textcat = TextCat(nlp.vocab)
textcat.model = "textcat_zh_model"  # 假设已训练中文分类模型

doc = nlp("这个产品非常棒，用户体验极佳！")
print(textcat(doc).cats)

输出示例：

{'好评': 0.98, '中评': 0.02, '差评': 0.0}

5. 进阶学习

spaCy 中文教程进阶篇：探索更复杂的 NLP 任务
中文文本处理最佳实践：获取社区推荐的技巧和工具
spaCy 模型训练指南：了解如何自定义中文模型

📌 提示：建议结合 spaCy 官方文档深入学习更多功能。

希望这个教程能帮助你快速上手中文 NLP！如果有任何问题，欢迎在社区论坛提出。🎉