Pandas 是 Python 中一个强大的数据分析库,它提供了快速、灵活且易于使用的数据结构,非常适合进行数据清洗、转换和分析。
快速入门
安装 Pandas
- 首先,确保你已经安装了 Python。然后,使用 pip 安装 Pandas:
pip install pandas
- 首先,确保你已经安装了 Python。然后,使用 pip 安装 Pandas:
基本操作
- Pandas 提供了 DataFrame 和 Series 两种主要的数据结构。DataFrame 类似于 Excel 表格,而 Series 类似于一个一维数组。
- 创建 DataFrame:
import pandas as pd data = {'Name': ['Tom', 'Nick', 'John'], 'Age': [20, 21, 19]} df = pd.DataFrame(data) print(df)
数据处理
- Pandas 提供了丰富的数据处理功能,如筛选、排序、分组等。
- 筛选数据:
filtered_df = df[df['Age'] > 20] print(filtered_df)
数据可视化
- 使用 Pandas 的
matplotlib
或seaborn
库进行数据可视化。 - 示例代码:
import matplotlib.pyplot as plt import seaborn as sns sns.lineplot(data=df, x='Name', y='Age') plt.show()
- 使用 Pandas 的