Pandas 是 Python 中一个非常流行的数据分析库,它提供了强大的数据处理功能。本教程将带你入门 Pandas 数据分析。
安装 Pandas
在开始之前,请确保你已经安装了 Pandas。你可以使用以下命令安装:
pip install pandas
基础操作
创建 DataFrame
DataFrame 是 Pandas 中的基本数据结构,类似于表格。
import pandas as pd
data = {
'Name': ['Tom', 'Nick', 'John'],
'Age': [20, 21, 19],
'City': ['New York', 'London', 'Paris']
}
df = pd.DataFrame(data)
查看数据
你可以使用 head()
, tail()
, info()
和 describe()
等方法查看数据。
print(df.head())
print(df.tail())
print(df.info())
print(df.describe())
数据筛选
你可以使用布尔索引来筛选数据。
print(df[df['Age'] > 20])
数据排序
你可以使用 sort_values()
方法来排序数据。
print(df.sort_values(by='Age', ascending=False))
高级操作
数据合并
Pandas 提供了多种数据合并方法,如 merge()
, join()
, concat()
等。
df2 = pd.DataFrame({
'Name': ['Tom', 'Nick'],
'City': ['New York', 'London']
})
print(pd.merge(df, df2, on='Name'))
数据分组
你可以使用 groupby()
方法对数据进行分组。
print(df.groupby('City').mean())
实例
假设你有一个包含用户数据的 DataFrame,你可以使用 Pandas 进行以下操作:
- 统计不同年龄段的用户数量
- 分析用户分布的城市
- 查找年龄最大的用户
总结
Pandas 是一个非常强大的数据分析工具,它可以帮助你快速完成数据处理和分析任务。希望这个教程能帮助你入门 Pandas 数据分析。