Pandas 是 Python 中一个强大的数据分析库,它提供了高效、灵活的数据结构和数据分析工具。以下是一些 Pandas 基础教程,帮助您快速入门。
安装 Pandas
在开始之前,请确保您已经安装了 Pandas。您可以使用以下命令进行安装:
pip install pandas
数据结构
Pandas 提供了两种主要的数据结构:Series 和 DataFrame。
- Series 是一个一维数组,类似于 Python 中的列表。
- DataFrame 是一个二维表格,类似于 Excel 或 CSV 文件。
Series 示例
import pandas as pd
# 创建一个 Series
s = pd.Series([1, 2, 3, 4, 5])
# 打印 Series
print(s)
DataFrame 示例
import pandas as pd
# 创建一个 DataFrame
data = {
'Name': ['Tom', 'Nick', 'John'],
'Age': [20, 21, 19]
}
df = pd.DataFrame(data)
# 打印 DataFrame
print(df)
数据操作
Pandas 提供了丰富的数据操作功能,包括数据选择、数据排序、数据过滤等。
数据选择
# 选择 DataFrame 中的某列
print(df['Name'])
# 选择 DataFrame 中的多列
print(df[['Name', 'Age']])
数据排序
# 按年龄排序
print(df.sort_values(by='Age'))
数据过滤
# 过滤年龄大于 20 的数据
print(df[df['Age'] > 20])
高级功能
Pandas 还提供了许多高级功能,例如数据合并、数据分组、数据透视表等。
数据合并
import pandas as pd
# 创建两个 DataFrame
df1 = pd.DataFrame({'Name': ['Tom', 'Nick'], 'Age': [20, 21]})
df2 = pd.DataFrame({'Name': ['Tom', 'John'], 'City': ['New York', 'London']})
# 按名称合并两个 DataFrame
result = pd.merge(df1, df2, on='Name')
print(result)
数据分组
# 按年龄分组
print(df.groupby('Age').mean())
数据透视表
# 创建数据透视表
print(df.pivot_table(values='Age', index='Name', columns='City'))
扩展阅读
如果您想了解更多关于 Pandas 的内容,请访问以下链接:
希望这些教程能帮助您快速入门 Pandas!🎉