Pandas 是一个强大的数据分析工具,在 Python 中非常流行。以下是一些 Pandas 的基本概念和操作。
安装 Pandas
在开始之前,请确保您已经安装了 Pandas。您可以使用以下命令进行安装:
pip install pandas
数据结构
Pandas 主要包含两种数据结构:Series 和 DataFrame。
- Series 是一个一维数组,类似于 Python 中的列表。
- DataFrame 是一个二维表格结构,类似于 Excel 或 CSV 文件。
创建 DataFrame
以下是一个简单的示例,展示如何创建一个 DataFrame:
import pandas as pd
data = {
'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35],
'City': ['New York', 'Los Angeles', 'Chicago']
}
df = pd.DataFrame(data)
选择数据
您可以使用 .loc
和 .iloc
方法来选择 DataFrame 中的数据。
- .loc 使用标签来选择数据。
- .iloc 使用整数位置来选择数据。
以下是一个示例:
# 使用标签选择
print(df.loc['Alice', 'Age'])
# 使用位置选择
print(df.iloc[1, 1])
数据清洗
数据清洗是数据分析的重要步骤。Pandas 提供了多种方法来处理缺失值、重复值等。
以下是一个示例,展示如何处理缺失值:
df.fillna(value=0, inplace=True)
数据分析
Pandas 提供了丰富的数据分析功能,例如排序、分组、聚合等。
以下是一个示例,展示如何对 DataFrame 进行排序:
df.sort_values(by='Age', ascending=False, inplace=True)
图片示例
Pandas 图标
更多信息,请访问我们的 Pandas 教程 页面。