Spacy 是一个强大的自然语言处理库,用于构建信息提取、文本分类、命名实体识别等任务。它简单易用,支持多种语言,并且具有很高的性能。

快速入门

  1. 安装 Spacy: 使用 pip 安装 Spacy:

    pip install spacy
    
  2. 加载语言模型: Spacy 支持多种语言模型,以下是一个加载中文模型的例子:

    import spacy
    
    nlp = spacy.load('zh_core_web_sm')
    
  3. 处理文本: 使用 Spacy 处理文本,可以快速进行分词、词性标注、命名实体识别等操作:

    text = "Spacy 是一个开源的自然语言处理库。"
    doc = nlp(text)
    for token in doc:
        print(token.text, token.lemma_, token.pos_, token.dep_, token.ent_type_)
    

示例

假设我们要识别文本中的命名实体,可以使用以下代码:

for ent in doc.ents:
    print(ent.text, ent.start_char, ent.end_char, ent.label_)

输出结果可能是:

Spacy  0  4  ORG
自然语言处理库  6  11  NOUN

扩展阅读

更多关于 Spacy 的信息,可以访问 Spacy 官方文档

Spacy Logo