Pandas 是一个强大的数据分析工具,它可以帮助你高效地进行数据处理和分析。以下是一些 Pandas 的基础知识,适合初学者入门。
安装与导入
首先,确保你已经安装了 Pandas。如果没有安装,可以通过以下命令进行安装:
pip install pandas
安装完成后,在 Python 中导入 Pandas:
import pandas as pd
基础操作
创建 DataFrame
DataFrame 是 Pandas 的核心数据结构,类似于 Excel 表格。
data = {
'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35],
'City': ['New York', 'Los Angeles', 'Chicago']
}
df = pd.DataFrame(data)
选择数据
你可以使用列名来选择特定的列:
print(df['Name'])
数据筛选
使用布尔索引来筛选数据:
print(df[df['Age'] > 28])
高级操作
合并数据
你可以使用 merge
函数来合并两个 DataFrame:
df1 = pd.DataFrame({'Name': ['Alice', 'Bob'], 'Age': [25, 30]})
df2 = pd.DataFrame({'Name': ['Alice', 'Bob'], 'City': ['New York', 'Los Angeles']})
merged_df = pd.merge(df1, df2, on='Name')
数据透视表
数据透视表可以用来汇总和展示数据:
pivot_table = df.pivot_table(values='Age', index='City', aggfunc='mean')
图片示例
这里是一个 Pandas DataFrame 的示例:
扩展阅读
想要了解更多关于 Pandas 的知识,可以访问我们的 Pandas 进阶教程。