Pandas 是 Python 中一个非常流行的数据分析库,它提供了强大的数据结构和数据分析工具。以下是一些 Pandas 的基础教程。
安装 Pandas
首先,确保你已经安装了 Python。然后,可以使用 pip 来安装 Pandas:
pip install pandas
基础操作
创建 DataFrame
DataFrame 是 Pandas 的核心数据结构,类似于 R 中的数据框或 SQL 中的表。
import pandas as pd
data = {
'Name': ['Tom', 'Nick', 'John'],
'Age': [20, 21, 19],
'City': ['New York', 'London', 'Paris']
}
df = pd.DataFrame(data)
选择数据
你可以使用 .loc
和 .iloc
来选择 DataFrame 中的数据。
# 通过标签选择
print(df.loc[0, 'Name'])
# 通过整数位置选择
print(df.iloc[1, 1])
数据清洗
在数据分析中,数据清洗是一个非常重要的步骤。
# 删除缺失值
df.dropna(inplace=True)
# 删除重复行
df.drop_duplicates(inplace=True)
数据可视化
Pandas 可以与 Matplotlib 或 Seaborn 等库一起使用来进行数据可视化。
import matplotlib.pyplot as plt
import seaborn as sns
sns.lineplot(data=df, x='Age', y='City')
plt.show()
扩展阅读
想要了解更多关于 Pandas 的内容,可以访问我们的 Pandas 教程页面。