TextBlob 是一个用于文本处理的 Python 库,提供简单的 API 来进行情感分析、词性标注、名词短语提取等任务。以下是关键内容概要:
核心功能 ✅
- 情感分析:判断文本情感倾向(正面/负面/中性)
🔢 示例:blob.sentiment
返回情感极性与主观性评分 - 文本分类:通过训练模型实现自定义分类任务
🧠 支持预训练模型(如sentiment_analysis
) - 文本清洗:去除停用词、标点符号与 HTML 标签
🧹 使用blob.words
获取过滤后的词汇列表 - 语言检测:自动识别文本语言(支持 100+ 种语言)
🌍 调用blob.detect_language()
安装指南 📦
pip install textblob
⚠️ 注意:需先安装 NLTK 依赖
import textblob
textblob.download_corpora() # 下载语言模型
使用示例 💻
from textblob import TextBlob
text = "自然语言处理是人工智能的重要领域!"
blob = TextBlob(text)
print(blob.sentiment) # 输出情感分析结果
print(blob.noun_phrases) # 提取名词短语
输出示例:
Sentiment(polarity=0.3, subjectivity=0.6)
noun_phrases: ['自然语言处理', '重要领域']