Pandas 是 Python 中一个强大的数据分析库,它提供了快速、灵活且易于使用的数据结构,非常适合用于数据清洗、转换和分析。
快速入门
安装 Pandas 首先,确保你已经安装了 Pandas。你可以使用以下命令进行安装:
pip install pandas
导入 Pandas 在你的 Python 脚本中,导入 Pandas 库:
import pandas as pd
创建 DataFrame DataFrame 是 Pandas 中最核心的数据结构,用于存储表格数据。
data = { 'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35], 'City': ['New York', 'Los Angeles', 'Chicago'] } df = pd.DataFrame(data)
查看 DataFrame 使用
df.head()
或df.tail()
可以查看 DataFrame 的前几行或后几行:print(df.head())
高级用法
数据清洗 Pandas 提供了丰富的数据清洗功能,例如删除缺失值、填充缺失值等。
df.dropna() # 删除缺失值 df.fillna(0) # 填充缺失值为 0
数据转换 Pandas 支持多种数据转换操作,例如排序、分组、聚合等。
df.sort_values(by='Age', ascending=False) # 按年龄降序排序 df.groupby('City').mean() # 按城市分组并计算平均值
数据可视化 Pandas 可以与 Matplotlib、Seaborn 等库结合使用,进行数据可视化。
import matplotlib.pyplot as plt df.plot(kind='bar') # 绘制柱状图 plt.show()
扩展阅读
更多 Pandas 教程,请访问本站教程页面:Pandas 教程。
图片展示
下面是一张 Pandas 的图片: