Pandas 是一个强大的数据分析工具,它提供了快速、灵活且直观的数据结构。以下是一些 Pandas 的基本教程。
基础操作
安装 Pandas
- 首先,您需要确保 Pandas 已经安装。如果没有,请访问 Pandas 安装指南。
创建 DataFrame
- DataFrame 是 Pandas 的核心数据结构。以下是如何创建一个简单的 DataFrame:
import pandas as pd data = {'Name': ['Tom', 'Nick', 'John'], 'Age': [20, 21, 19]} df = pd.DataFrame(data)
- DataFrame 是 Pandas 的核心数据结构。以下是如何创建一个简单的 DataFrame:
选择数据
- 您可以使用
.loc
或.iloc
来选择 DataFrame 中的数据。# 使用 .loc print(df.loc[0]) # 使用 .iloc print(df.iloc[1])
- 您可以使用
数据排序
- 您可以使用
.sort_values()
来对 DataFrame 进行排序。print(df.sort_values(by='Age'))
- 您可以使用
高级操作
数据合并
- Pandas 提供了多种数据合并方法,如
merge
,join
,concat
等。df1 = pd.DataFrame({'Key': ['B', 'C', 'D'], 'Value': [1, 3, 4]}) df2 = pd.DataFrame({'Key': ['A', 'B', 'D'], 'Value': [5, 2, 2]}) result = pd.merge(df1, df2, on='Key') print(result)
- Pandas 提供了多种数据合并方法,如
数据分组
- 您可以使用
.groupby()
方法对数据进行分组。print(df.groupby('Name')['Age'].mean())
- 您可以使用
图片示例
DataFrame 的可视化可以通过图表来展示,例如使用 matplotlib:
import matplotlib.pyplot as plt
df.plot(kind='bar')
plt.show()
DataFrame 图表示例
以上是 Pandas 的基础和高级操作教程。希望这些内容能帮助您更好地了解和使用 Pandas。