Pandas 是一个强大的数据分析库,常用于数据清洗、数据转换和数据分析。以下是一些 Pandas 高级使用技巧:
1. 数据筛选与排序
使用 loc
和 iloc
进行数据筛选和排序。
df.loc[df['年龄'] > 30, '性别'] = '中年'
df.sort_values(by='年龄', ascending=False, inplace=True)
2. 数据合并
使用 merge
、join
和 concat
进行数据合并。
df1 = pd.DataFrame({'key': ['A', 'B', 'C', 'D'],
'value': [1, 2, 3, 4]})
df2 = pd.DataFrame({'key': ['B', 'D', 'E', 'F'],
'value': [5, 6, 7, 8]})
result = pd.merge(df1, df2, on='key')
3. 数据分组与聚合
使用 groupby
和 agg
进行数据分组与聚合。
df.groupby('性别')['年龄'].mean()
df.agg({'年龄': ['mean', 'median', 'max']})
4. 数据可视化
使用 matplotlib
和 seaborn
进行数据可视化。
import matplotlib.pyplot as plt
import seaborn as sns
sns.lineplot(x='日期', y='销售额', data=df)
plt.show()
5. 自定义函数
使用 apply
和 lambda
函数进行自定义数据处理。
df['新列'] = df['列1'].apply(lambda x: x * 2)
扩展阅读
更多 Pandas 高级使用技巧,请参考 Pandas 官方文档。
Pandas Logo