Pandas 是一个强大的数据分析工具,它提供了快速、灵活、直观的数据结构,用于数据分析。以下是一些 Pandas 的基本教程。
安装 Pandas
首先,确保你已经安装了 Pandas。你可以使用以下命令来安装:
pip install pandas
基本操作
创建 DataFrame
DataFrame 是 Pandas 的核心数据结构,类似于表格。
import pandas as pd
data = {
'Name': ['Tom', 'Nick', 'John'],
'Age': [20, 21, 19]
}
df = pd.DataFrame(data)
选择数据
你可以使用 .loc
和 .iloc
来选择 DataFrame 中的数据。
# 使用 .loc
print(df.loc[0:2, 'Name'])
# 使用 .iloc
print(df.iloc[0:2, 0])
数据清洗
数据清洗是数据分析的重要步骤。
# 删除缺失值
df.dropna(inplace=True)
# 删除重复值
df.drop_duplicates(inplace=True)
高级操作
合并数据
Pandas 提供了多种合并数据的方法,如 merge
、join
和 concat
。
df1 = pd.DataFrame({'Name': ['Tom', 'Nick', 'John'], 'Age': [20, 21, 19]})
df2 = pd.DataFrame({'Name': ['Tom', 'Nick', 'John'], 'City': ['New York', 'London', 'Paris']})
# 使用 merge
print(pd.merge(df1, df2, on='Name'))
# 使用 join
print(df1.join(df2))
# 使用 concat
print(pd.concat([df1, df2]))
数据可视化
Pandas 可以与 Matplotlib 或 Seaborn 等库结合使用来进行数据可视化。
import matplotlib.pyplot as plt
df.plot(kind='line')
plt.show()
扩展阅读
更多 Pandas 教程,请访问 Pandas 教程。
[center]https://cloud-image.ullrai.com/q/Pandas/[/center]