Pandas 是 Python 中一个非常强大的数据处理库,它可以帮助我们轻松地处理和分析数据。以下是一些关于 Pandas 的基础教程。
快速入门
安装 Pandas
首先,你需要安装 Pandas 库。你可以通过以下命令来安装:
pip install pandas
创建 DataFrame
DataFrame 是 Pandas 中的一个主要数据结构,它类似于表格。以下是一个简单的示例:
import pandas as pd
data = {'Name': ['Tom', 'Nick', 'John'],
'Age': [20, 21, 19],
'City': ['New York', 'London', 'Paris']}
df = pd.DataFrame(data)
print(df)
这将创建一个包含三个列(Name, Age, City)和三行数据的 DataFrame。
数据筛选
你可以使用 .loc
或 .iloc
来筛选 DataFrame 中的特定数据。
# 使用 .loc
print(df.loc[df['Age'] > 20])
# 使用 .iloc
print(df.iloc[1:3])
高级功能
合并数据
Pandas 提供了多种合并数据的方法,如 merge
、join
和 concat
。
# 使用 merge
df1 = pd.DataFrame({'Key': ['A', 'B', 'C', 'D'],
'Value': [1, 2, 3, 4]})
df2 = pd.DataFrame({'Key': ['B', 'D', 'E', 'F'],
'Value': [5, 6, 7, 8]})
result = pd.merge(df1, df2, on='Key')
print(result)
数据可视化
你可以使用 Pandas 与其他库(如 Matplotlib)来创建数据可视化。
import matplotlib.pyplot as plt
df['Age'].plot(kind='hist')
plt.show()
扩展阅读
更多关于 Pandas 的内容,可以参考我们的 Pandas 进阶教程。
Pandas 图标