TextBlob 是一个用于文本处理的 Python 库,提供简单的 API 来进行情感分析、词性标注、名词短语提取等任务。以下是关键内容概要:

核心功能 ✅

  • 情感分析:判断文本情感倾向(正面/负面/中性)
    🔢 示例:blob.sentiment 返回情感极性与主观性评分
  • 文本分类:通过训练模型实现自定义分类任务
    🧠 支持预训练模型(如 sentiment_analysis
  • 文本清洗:去除停用词、标点符号与 HTML 标签
    🧹 使用 blob.words 获取过滤后的词汇列表
  • 语言检测:自动识别文本语言(支持 100+ 种语言)
    🌍 调用 blob.detect_language()

安装指南 📦

pip install textblob

⚠️ 注意:需先安装 NLTK 依赖

import textblob
textblob.download_corpora()  # 下载语言模型

使用示例 💻

from textblob import TextBlob

text = "自然语言处理是人工智能的重要领域!"
blob = TextBlob(text)
print(blob.sentiment)  # 输出情感分析结果
print(blob.noun_phrases)  # 提取名词短语

输出示例:
Sentiment(polarity=0.3, subjectivity=0.6)
noun_phrases: ['自然语言处理', '重要领域']

扩展学习 📚

自然语言处理
文本分析