Pandas 是 Python 中最强大的数据处理库之一,以其简洁的 API 和灵活的数据结构(如 DataFrame
和 Series
)成为数据科学领域的核心工具。以下是快速上手的指南:
📚 1. 安装与导入
首先确保已安装 Pandas:
pip install pandas
然后在代码中导入:
import pandas as pd
🧭 2. 核心数据结构
- Series:一维数组,支持自定义索引
✅ 示例:pd.Series([1, 2, 3], index=["a", "b", "c"])
- DataFrame:二维表格,类似 Excel
✅ 示例:pd.DataFrame({"列1": [10, 20], "列2": [30, 40]})
📊 3. 数据处理技巧
- 读取数据:
pd.read_csv()
读取 CSV 文件 - 筛选数据:
df[df["列名"] > 值]
- 合并数据:
pd.merge(df1, df2, on="键")
- 缺失值处理:
df.dropna()
或df.fillna(0)
📌 想更深入了解数据清洗?点击这里 查看详细教程!
📈 4. 数据可视化
使用 Matplotlib 或 Seaborn 可快速生成图表:
import matplotlib.pyplot as plt
df.plot(kind="bar")
plt.show()
🌐 5. 扩展学习
用 📜 Pandas 轻松驾驭数据,让复杂分析变得简单!