Pandas 是一个强大的数据分析库,常用于数据清洗、数据转换和数据分析。以下是一些 Pandas 高级使用技巧:

1. 数据筛选与排序

使用 lociloc 进行数据筛选和排序。

df.loc[df['年龄'] > 30, '性别'] = '中年'
df.sort_values(by='年龄', ascending=False, inplace=True)

2. 数据合并

使用 mergejoinconcat 进行数据合并。

df1 = pd.DataFrame({'key': ['A', 'B', 'C', 'D'],
                    'value': [1, 2, 3, 4]})
df2 = pd.DataFrame({'key': ['B', 'D', 'E', 'F'],
                    'value': [5, 6, 7, 8]})

result = pd.merge(df1, df2, on='key')

3. 数据分组与聚合

使用 groupbyagg 进行数据分组与聚合。

df.groupby('性别')['年龄'].mean()
df.agg({'年龄': ['mean', 'median', 'max']})

4. 数据可视化

使用 matplotlibseaborn 进行数据可视化。

import matplotlib.pyplot as plt
import seaborn as sns

sns.lineplot(x='日期', y='销售额', data=df)
plt.show()

5. 自定义函数

使用 applylambda 函数进行自定义数据处理。

df['新列'] = df['列1'].apply(lambda x: x * 2)

扩展阅读

更多 Pandas 高级使用技巧,请参考 Pandas 官方文档


Pandas Logo