NLTK(Natural Language Toolkit)是Python中用于处理人类语言数据的核心库,适合初学者和进阶开发者。以下是基础用法指南:

安装 NLTK

pip install nltk

✅ 安装完成后,可通过以下链接获取完整教程:
NLTK 入门教程

基本功能示例

  • 分词:将文本拆分为单词或子词

    import nltk
    nltk.word_tokenize("Hello, this is a test.")
    
    tokenization
  • 词性标注:识别单词词性

    nltk.pos_tag(["Hello", "world"])
    
    pos_tagging
  • 命名实体识别:提取人名、地点等信息

    nltk.ne_chunk("Barack Obama was born in the United States.")
    
    ner

学习资源