Python NLP 实际案例教程

本文将介绍一些Python在自然语言处理（NLP）领域的实际应用案例。通过这些案例，你可以了解如何在Python中实现各种NLP任务。

案例一：文本分类

文本分类是NLP中的一个基础任务，它可以帮助我们自动将文本归类到不同的类别中。以下是一个使用Python进行文本分类的例子：

import jieba
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.linear_model import LogisticRegression

data = [
    "我爱北京天安门",
    "我爱长城",
    "我爱故宫",
    "我爱颐和园",
    "我爱天安门"
]

labels = ["政治", "历史", "文化", "景点", "政治"]

vectorizer = TfidfVectorizer(tokenizer=lambda doc: jieba.cut(doc))
X = vectorizer.fit_transform(data)

model = LogisticRegression()
model.fit(X, labels)

text = "我爱天安门"
vector = vectorizer.transform([text])
prediction = model.predict(vector)
print(prediction)  # 输出：['政治']

情感分析是判断文本情感倾向的任务。以下是一个使用Python进行情感分析的例子：

import jieba
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.naive_bayes import MultinomialNB

data = [
    "这部电影真的很好看！",
    "这部电影真的很烂。",
    "这个商品太好了！",
    "这个商品太差了。",
    "这部电影真的很棒！"
]

labels = ["正面", "负面", "正面", "负面", "正面"]

vectorizer = CountVectorizer(tokenizer=lambda doc: jieba.cut(doc))
X = vectorizer.fit_transform(data)

model = MultinomialNB()
model.fit(X, labels)

text = "这个商品太好了！"
vector = vectorizer.transform([text])
prediction = model.predict(vector)
print(prediction)  # 输出：['正面']

如果你对Python NLP感兴趣，可以阅读以下教程：