自然语言处理(NLP)是人工智能的重要分支,NLTK(Natural Language Toolkit)作为Python中常用的NLP库,为文本分析提供了丰富的工具。以下是快速上手指南:

📦 安装 NLTK

pip install nltk

📌 提示:安装后需下载语料库:

import nltk
nltk.download('punkt')
nltk.download('stopwords')

🧩 基础功能示例

  • 分词:将文本拆分为单词

    from nltk.tokenize import word_tokenize
    text = "NLTK 是一个强大的 NLP 工具包"
    print(word_tokenize(text))
    
    分词
  • 词性标注:识别单词词性

    from nltk import pos_tag
    words = ["NLTK", "是", "一个", "强大的", "工具包"]
    print(pos_tag(words))
    
    词性标注
  • 去除停用词:过滤无意义词汇

    from nltk.corpus import stopwords
    stop_words = set(stopwords.words('chinese'))
    filtered_text = [word for word in words if word not in stop_words]
    print(filtered_text)
    

🚀 实际应用场景

  1. 情感分析
    情感分析
  2. 文本分类
    文本分类
  3. 机器翻译预处理
    机器翻译预处理

📌 扩展学习了解更多NLP基础概念 或尝试 文本分析实战案例