Pandas 是 Python 中一个强大的数据分析库,它提供了数据结构 DataFrames 和丰富的数据分析工具。以下是一个简单的 Pandas 教程。
安装 Pandas
首先,确保你已经安装了 Python。然后,使用以下命令安装 Pandas:
pip install pandas
快速开始
数据结构
Pandas 提供了两种主要的数据结构:Series 和 DataFrame。
- Series 是一个一维数组,类似于 Python 中的列表。
- DataFrame 是一个二维表格,类似于 Excel 或 CSV 文件。
示例
import pandas as pd
# 创建一个 Series
data = pd.Series([1, 2, 3, 4, 5])
# 创建一个 DataFrame
data = {'Name': ['Tom', 'Nick', 'John', 'Alice'],
'Age': [20, 21, 19, 18]}
df = pd.DataFrame(data)
print(df)
数据读取
Pandas 可以轻松地从各种文件格式中读取数据,例如 CSV、Excel、JSON 等。
df = pd.read_csv('data.csv')
数据操作
Pandas 提供了丰富的数据操作功能,例如筛选、排序、聚合等。
# 筛选
df_filtered = df[df['Age'] > 20]
# 排序
df_sorted = df.sort_values(by='Age', ascending=False)
# 聚合
df_grouped = df.groupby('Name').mean()
扩展阅读
想要了解更多关于 Pandas 的内容,可以访问我们的 Pandas 教程。
图片
Pandas Logo