TextBlob 是一个简单的自然语言处理库,用于处理文本数据。它提供了丰富的功能,包括文本分类、情感分析、命名实体识别等。

安装

要使用 TextBlob,首先需要安装它。可以使用 pip 来安装:

pip install textblob

快速开始

以下是一个简单的例子,展示了如何使用 TextBlob 进行文本分类:

from textblob import TextBlob

text = "I love Python!"
blob = TextBlob(text)

print(blob.sentiment)

输出结果将是一个包含极性和主体性的对象。

文本分类

TextBlob 提供了 sentiment 属性,用于获取文本的情感极性和强度。

  • 极性:表示文本的正面或负面倾向,范围在 -1 到 1 之间。
  • 强度:表示情感的强度,范围在 0 到 1 之间。

例如:

text = "I love Python!"
blob = TextBlob(text)

print(blob.sentiment)

输出:

Sentiment(polarity=1.0, subjectivity=1.0)

这意味着文本是正面的,并且情感强度为 1。

情感分析

TextBlob 还提供了情感分析功能,可以用来判断文本的情感倾向。

text = "I hate Python!"
blob = TextBlob(text)

print(blob.sentiment)

输出:

Sentiment(polarity=-1.0, subjectivity=1.0)

这意味着文本是负面的。

命名实体识别

TextBlob 还可以进行命名实体识别,识别文本中的命名实体。

text = "Apple is looking at buying U.K. startup for $1 billion."
blob = TextBlob(text)

print(blob.noun_phrases)

输出:

['Apple', 'U.K.', 'startup', 'U.K.', 'startup']

扩展阅读

更多关于 TextBlob 的信息,请访问 TextBlob 官方文档

Python