Pandas 是一个 Python 的数据分析库,它提供了高效、灵活的数据结构和数据分析工具。以下是一些关于 Pandas 的基本教程。
安装 Pandas
首先,你需要安装 Pandas 库。你可以通过以下命令进行安装:
pip install pandas
Pandas 基本操作
Pandas 提供了多种数据结构,其中最常用的是 DataFrame。下面是一个简单的 DataFrame 示例:
import pandas as pd
data = {'Name': ['John', 'Anna', 'Peter', 'Linda'],
'Age': [28, 22, 34, 29],
'City': ['New York', 'Paris', 'Berlin', 'London']}
df = pd.DataFrame(data)
print(df)
这将输出以下内容:
Name | Age | City |
---|---|---|
John | 28 | New York |
Anna | 22 | Paris |
Peter | 34 | Berlin |
Linda | 29 | London |
查看数据
你可以使用 head()
、tail()
等方法来查看 DataFrame 的部分数据。
print(df.head()) # 显示前五行
print(df.tail()) # 显示后五行
数据筛选
你可以使用布尔索引来筛选数据。
print(df[df['Age'] > 25]) # 筛选年龄大于 25 的记录
这将输出以下内容:
Name | Age | City |
---|---|---|
Peter | 34 | Berlin |
Linda | 29 | London |
数据排序
你可以使用 sort_values()
方法对数据进行排序。
print(df.sort_values(by='Age', ascending=False)) # 按年龄降序排序
这将输出以下内容:
Name | Age | City |
---|---|---|
Peter | 34 | Berlin |
Linda | 29 | London |
John | 28 | New York |
Anna | 22 | Paris |
数据统计
Pandas 提供了多种统计方法,例如 mean()
、sum()
、median()
等。
print(df['Age'].mean()) # 计算年龄的平均值
这将输出:
28.0
扩展阅读
更多 Pandas 教程,请访问本站 Pandas 教程页面。