Pandas 是一个强大的数据分析工具,可以轻松地处理和分析数据。在这个教程中,我们将学习如何使用 Pandas 进行数据处理。
安装 Pandas
在开始之前,确保你已经安装了 Pandas。你可以使用以下命令安装:
pip install pandas
Pandas 简介
Pandas 提供了多种数据结构,其中最常用的是 DataFrame。DataFrame 类似于 Excel 中的表格,可以存储多列数据。
创建 DataFrame
你可以使用以下代码创建一个简单的 DataFrame:
import pandas as pd
data = {'Name': ['Tom', 'Nick', 'John'], 'Age': [20, 21, 19]}
df = pd.DataFrame(data)
print(df)
数据操作
Pandas 提供了丰富的数据操作功能,包括筛选、排序、聚合等。
筛选数据
你可以使用以下代码筛选 DataFrame 中的数据:
filtered_df = df[df['Age'] > 20]
print(filtered_df)
排序数据
你可以使用以下代码对 DataFrame 进行排序:
sorted_df = df.sort_values(by='Age', ascending=False)
print(sorted_df)
高级功能
Pandas 还提供了许多高级功能,例如合并、分组、时间序列分析等。
合并数据
你可以使用以下代码合并两个 DataFrame:
data2 = {'Name': ['Nick', 'John', 'Tom'], 'City': ['New York', 'Los Angeles', 'Chicago']}
df2 = pd.DataFrame(data2)
merged_df = pd.merge(df, df2, on='Name')
print(merged_df)
学习资源
要深入了解 Pandas,可以参考以下资源:
希望这个教程能帮助你入门 Pandas。如果你有任何问题,请随时提问。
图片展示
Pandas 图标