Pandas 是一个强大的数据分析工具,它提供了快速、灵活、直观的数据结构,以及高效的数据操作功能。以下是一些 Pandas 的基本概念和使用方法。
快速开始
安装 Pandas
首先,确保你已经安装了 Pandas。可以通过以下命令安装:
pip install pandas
导入 Pandas
在 Python 中,使用以下命令导入 Pandas:
import pandas as pd
创建 DataFrame
DataFrame 是 Pandas 中的主要数据结构,类似于表格。
data = {
'Name': ['Tom', 'Nick', 'John'],
'Age': [20, 21, 19],
'City': ['New York', 'London', 'Paris']
}
df = pd.DataFrame(data)
数据操作
查看数据
使用 head()
方法可以查看 DataFrame 的前几行:
print(df.head())
数据筛选
你可以使用布尔索引来筛选数据。
print(df[df['Age'] > 20])
数据排序
使用 sort_values()
方法可以对数据进行排序:
print(df.sort_values(by='Age', ascending=False))
高级功能
数据合并
Pandas 提供了多种数据合并方法,如 merge()
, join()
和 concat()
。
df2 = pd.DataFrame({'Name': ['Tom', 'Nick'], 'Score': [85, 90]})
print(pd.merge(df, df2, on='Name'))
数据分组
使用 groupby()
方法可以对数据进行分组。
print(df.groupby('City')['Age'].mean())
扩展阅读
想了解更多关于 Pandas 的知识?请访问我们的 Pandas 教程。
Data Science