Pandas 是 Python 中一个强大的数据分析库,它提供了快速、灵活、直观的数据结构和数据分析工具。以下是一些 Pandas 的基本教程内容。
安装 Pandas
在开始使用 Pandas 之前,您需要确保已经安装了 Pandas 库。您可以使用以下命令来安装:
pip install pandas
基本数据结构
Pandas 中的主要数据结构是 DataFrame,它类似于 Excel 中的表格,可以存储二维数据。
import pandas as pd
# 创建一个 DataFrame
data = {
'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35],
'City': ['New York', 'Los Angeles', 'Chicago']
}
df = pd.DataFrame(data)
print(df)
选择数据
您可以使用 .loc
和 .iloc
来选择 DataFrame 中的数据。
# 使用 .loc 选择数据
print(df.loc[0:2, 'Name'])
# 使用 .iloc 选择数据
print(df.iloc[1:3, 1])
数据处理
Pandas 提供了丰富的数据处理功能,例如数据清洗、数据转换等。
# 数据清洗
df.dropna(inplace=True) # 删除缺失值
# 数据转换
df['Age'] = df['Age'].apply(lambda x: x + 1) # 年龄加 1
数据可视化
Pandas 与 Matplotlib 或 Seaborn 等库结合,可以方便地进行数据可视化。
import matplotlib.pyplot as plt
df.plot(kind='bar')
plt.show()
扩展阅读
如果您想了解更多关于 Pandas 的内容,可以访问以下链接:
Pandas Logo