数据分析是 Python 中非常受欢迎的一个应用领域。它可以帮助我们从数据中提取有价值的信息,为决策提供支持。本文将介绍 Python 数据分析的基础知识。

安装必要的库

在进行数据分析之前,我们需要安装一些常用的库,如 NumPy、Pandas 和 Matplotlib。

pip install numpy pandas matplotlib

NumPy

NumPy 是一个用于科学计算的库,它提供了大量的数值计算功能。

数组操作

NumPy 的核心是数组(array)。我们可以使用以下代码创建一个一维数组:

import numpy as np

arr = np.array([1, 2, 3, 4, 5])
print(arr)

输出:

[1 2 3 4 5]

数组切片

我们可以使用切片操作来获取数组的一部分:

print(arr[1:4])

输出:

[2 3 4]

Pandas

Pandas 是一个强大的数据分析库,它提供了数据结构 DataFrame,可以方便地进行数据处理和分析。

创建 DataFrame

import pandas as pd

data = {
    'Name': ['Alice', 'Bob', 'Charlie'],
    'Age': [25, 30, 35],
    'City': ['New York', 'Los Angeles', 'Chicago']
}

df = pd.DataFrame(data)
print(df)

输出:

  Name  Age         City
0  Alice   25     New York
1    Bob   30  Los Angeles
2  Charlie   35      Chicago

数据筛选

print(df[df['Age'] > 28])

输出:

  Name  Age         City
1    Bob   30  Los Angeles
2  Charlie   35      Chicago

Matplotlib

Matplotlib 是一个用于数据可视化的库,它可以帮助我们以图表的形式展示数据。

绘制散点图

import matplotlib.pyplot as plt

plt.scatter(df['Age'], df['City'])
plt.xlabel('Age')
plt.ylabel('City')
plt.title('Age vs City')
plt.show()

Age vs City

扩展阅读

如果你对 Python 数据分析感兴趣,可以阅读以下文章:

希望这篇文章能帮助你了解 Python 数据分析的基础知识。如果你有任何问题,欢迎在评论区留言。😊