数据分析是 Python 中非常受欢迎的一个应用领域。它可以帮助我们从数据中提取有价值的信息,为决策提供支持。本文将介绍 Python 数据分析的基础知识。
安装必要的库
在进行数据分析之前,我们需要安装一些常用的库,如 NumPy、Pandas 和 Matplotlib。
pip install numpy pandas matplotlib
NumPy
NumPy 是一个用于科学计算的库,它提供了大量的数值计算功能。
数组操作
NumPy 的核心是数组(array)。我们可以使用以下代码创建一个一维数组:
import numpy as np
arr = np.array([1, 2, 3, 4, 5])
print(arr)
输出:
[1 2 3 4 5]
数组切片
我们可以使用切片操作来获取数组的一部分:
print(arr[1:4])
输出:
[2 3 4]
Pandas
Pandas 是一个强大的数据分析库,它提供了数据结构 DataFrame,可以方便地进行数据处理和分析。
创建 DataFrame
import pandas as pd
data = {
'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35],
'City': ['New York', 'Los Angeles', 'Chicago']
}
df = pd.DataFrame(data)
print(df)
输出:
Name Age City
0 Alice 25 New York
1 Bob 30 Los Angeles
2 Charlie 35 Chicago
数据筛选
print(df[df['Age'] > 28])
输出:
Name Age City
1 Bob 30 Los Angeles
2 Charlie 35 Chicago
Matplotlib
Matplotlib 是一个用于数据可视化的库,它可以帮助我们以图表的形式展示数据。
绘制散点图
import matplotlib.pyplot as plt
plt.scatter(df['Age'], df['City'])
plt.xlabel('Age')
plt.ylabel('City')
plt.title('Age vs City')
plt.show()
Age vs City
扩展阅读
如果你对 Python 数据分析感兴趣,可以阅读以下文章:
希望这篇文章能帮助你了解 Python 数据分析的基础知识。如果你有任何问题,欢迎在评论区留言。😊