朴素贝叶斯分类器是一种简单而有效的概率分类方法,常用于文本分类、垃圾邮件检测等领域。下面将介绍如何使用Python实现朴素贝叶斯分类器。

安装必要的库

在开始之前,请确保你已经安装了以下库:

pip install scikit-learn

数据准备

首先,我们需要一些数据来进行训练。这里我们可以使用著名的鸢尾花数据集。

from sklearn.datasets import load_iris

iris = load_iris()
X, y = iris.data, iris.target

划分训练集和测试集

from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

创建朴素贝叶斯分类器

from sklearn.naive_bayes import GaussianNB

gnb = GaussianNB()
gnb.fit(X_train, y_train)

预测结果

y_pred = gnb.predict(X_test)

评估模型

from sklearn.metrics import accuracy_score

print("Accuracy:", accuracy_score(y_test, y_pred))

扩展阅读

想要更深入地了解朴素贝叶斯分类器?可以阅读以下文章:

鸢尾花数据集