Python数据分析库教程

Python作为一种广泛使用的编程语言，在数据分析领域有着极高的应用价值。以下是一些常用的Python数据分析库，以及它们的基本使用方法。

1. NumPy

NumPy是Python中用于数值计算的库，也是数据分析的基础库之一。

安装：pip install numpy
使用：

import numpy as np

# 创建一个一维数组
array = np.array([1, 2, 3, 4, 5])
print(array)

# 创建一个二维数组
array2 = np.array([[1, 2], [3, 4]])
print(array2)

更多关于NumPy的信息，可以访问NumPy官方文档。

2. Pandas

Pandas是一个强大的数据分析工具，提供了快速、灵活、直观的数据结构。

安装：pip install pandas
使用：

import pandas as pd

# 创建一个DataFrame
data = {'Name': ['Tom', 'Nick', 'John'], 'Age': [20, 21, 19]}
df = pd.DataFrame(data)
print(df)

更多关于Pandas的信息，可以访问Pandas官方文档。

3. Matplotlib

Matplotlib是一个用于数据可视化的库，可以创建各种图表和图形。

安装：pip install matplotlib
使用：

import matplotlib.pyplot as plt

# 创建一个简单的折线图
x = [1, 2, 3, 4, 5]
y = [1, 4, 9, 16, 25]
plt.plot(x, y)
plt.show()

更多关于Matplotlib的信息，可以访问Matplotlib官方文档。

4. Seaborn

Seaborn是基于Matplotlib的一个高级可视化库，可以轻松创建各种统计图表。

安装：pip install seaborn
使用：

import seaborn as sns

# 创建一个散点图
sns.scatterplot(x='Age', y='Name', data=df)
plt.show()

更多关于Seaborn的信息，可以访问Seaborn官方文档。

5. Scikit-learn

Scikit-learn是一个机器学习库，提供了各种机器学习算法。

安装：pip install scikit-learn
使用：

from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression

# 加载数据集
iris = datasets.load_iris()
X = iris.data
y = iris.target

# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=0)

# 创建逻辑回归模型
model = LogisticRegression()
model.fit(X_train, y_train)

# 评估模型
score = model.score(X_test, y_test)
print(score)

更多关于Scikit-learn的信息，可以访问Scikit-learn官方文档。

希望这些信息能帮助您更好地了解Python数据分析库。如果您还有其他问题，请访问我们的社区论坛进行讨论。