监督学习是机器学习的一个核心领域,它涉及使用标记的训练数据来训练模型,以便它们可以预测或分类新的、未标记的数据。以下是一些监督学习基础概念和常见算法的简要介绍。
监督学习类型
监督学习主要分为以下几类:
- 分类:将数据分为不同的类别。例如,判断一封电子邮件是否为垃圾邮件。
- 回归:预测一个连续值。例如,预测房价。
常见监督学习算法
以下是一些常见的监督学习算法:
- 线性回归:用于回归问题,预测一个连续值。
- 逻辑回归:用于分类问题,预测一个二进制结果。
- 支持向量机(SVM):通过找到一个最佳的超平面来区分不同的类别。
- 决策树:通过一系列的规则来分类或回归数据。
实践示例
以下是一个简单的线性回归示例,用于预测房价:
from sklearn.linear_model import LinearRegression
import pandas as pd
# 加载数据
data = pd.read_csv('/path/to/housing_data.csv')
# 特征和标签
X = data[['area', 'bedrooms']]
y = data['price']
# 创建模型
model = LinearRegression()
# 训练模型
model.fit(X, y)
# 预测房价
predicted_price = model.predict([[2000, 3]])
print("Predicted Price:", predicted_price)
更多资源
想要深入了解监督学习?请访问我们的机器学习教程页面。
机器学习