Pandas 是 Python 中一个非常流行的数据分析库,它提供了强大的数据处理功能。在这个教程中,我们将学习如何使用 Pandas 导入数据。
常见数据格式导入
以下是一些常见的数据格式及其导入方法:
- CSV 文件导入
import pandas as pd
data = pd.read_csv('data.csv')
- Excel 文件导入
data = pd.read_excel('data.xlsx')
- JSON 文件导入
data = pd.read_json('data.json')
- 数据库导入
import sqlite3
conn = sqlite3.connect('database.db')
data = pd.read_sql_query('SELECT * FROM table_name', conn)
数据预览
导入数据后,可以使用 head()
方法预览数据的前几行:
data.head()
数据清洗
在导入数据后,我们可能需要进行一些数据清洗,例如去除空值、处理缺失值等。
- 去除空值
data.dropna(inplace=True)
- 处理缺失值
data.fillna(method='ffill', inplace=True)
跳转到高级教程
如果你已经掌握了基础的数据导入,可以跳转到 Pandas 高级教程 学习更高级的数据处理技巧。
Pandas 数据分析