NLTK(Natural Language Toolkit)是Python中常用的自然语言处理库,以下是安装步骤:

  1. 安装Python
    确保已安装Python 3.x,若未安装请前往Python官网下载。

  2. 安装NLTK库
    打开终端,运行以下命令:

    pip install nltk
    

    📦 安装成功后,可通过import nltk验证。

  3. 下载语料库
    运行代码下载所需资源:

    import nltk
    nltk.download('punkt')  # 基础分词工具
    nltk.download('movie_reviews')  # 示例语料库
    

    🌐 下载进度条可直观显示资源获取状态。


📌 常用语料库推荐

  • Punkt Tokenizer:英文分词必备
    Punkt_Tokenize
  • Corpus of General Web Text (Gutenberg):经典文本语料
    Gutenberg_Corpus
  • Brown语料库:标注清晰的新闻语料
    Brown_Corpus

🔗 拓展学习:NLTK基础教程
✅ 安装完成后可直接进入实战,探索文本分析奥秘!