Pandas 是 Python 中一个强大的数据分析库,它可以快速、灵活、有效地处理和分析数据。以下是一些 Pandas 的基本概念和操作。
快速开始
安装 Pandas: 如果您还没有安装 Pandas,可以使用以下命令进行安装:
pip install pandas
导入 Pandas: 在 Python 脚本中导入 Pandas 库:
import pandas as pd
创建 DataFrame: DataFrame 是 Pandas 的核心数据结构,类似于 Excel 中的表格。
data = {'Name': ['Tom', 'Nick', 'John'], 'Age': [20, 21, 19]} df = pd.DataFrame(data)
数据操作
- 选择列: 使用列名来选择单个列:
df['Name']
- 选择行: 使用
.loc
或.iloc
来选择行:df.loc[0:2, 'Name']
- 条件筛选: 使用布尔索引来筛选数据:
df[df['Age'] > 20]
排序和分组
- 排序: 使用
sort_values
方法对 DataFrame 进行排序:df.sort_values(by='Age', ascending=False)
- 分组: 使用
groupby
方法对 DataFrame 进行分组:df.groupby('Name').mean()
数据可视化
Pandas 可以与 Matplotlib 和 Seaborn 等库结合使用进行数据可视化。
- 基本图表: 使用 Matplotlib 绘制基本图表:
import matplotlib.pyplot as plt df.plot(kind='bar') plt.show()
扩展阅读
更多 Pandas 教程和资源,请访问我们的 Pandas 教程页面。
Pandas Logo