朴素贝叶斯分类器是一种简单而有效的概率分类方法,常用于文本分类、垃圾邮件检测等领域。下面将介绍如何使用Python实现朴素贝叶斯分类器。
安装必要的库
在开始之前,请确保你已经安装了以下库:
pip install scikit-learn
数据准备
首先,我们需要一些数据来进行训练。这里我们可以使用著名的鸢尾花数据集。
from sklearn.datasets import load_iris
iris = load_iris()
X, y = iris.data, iris.target
划分训练集和测试集
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
创建朴素贝叶斯分类器
from sklearn.naive_bayes import GaussianNB
gnb = GaussianNB()
gnb.fit(X_train, y_train)
预测结果
y_pred = gnb.predict(X_test)
评估模型
from sklearn.metrics import accuracy_score
print("Accuracy:", accuracy_score(y_test, y_pred))
扩展阅读
想要更深入地了解朴素贝叶斯分类器?可以阅读以下文章:
鸢尾花数据集