Pandas 是 Python 中一个非常流行的数据分析库,它提供了强大的数据处理功能。在这个教程中,我们将学习如何使用 Pandas 导入数据。

常见数据格式导入

以下是一些常见的数据格式及其导入方法:

  • CSV 文件导入
import pandas as pd

data = pd.read_csv('data.csv')
  • Excel 文件导入
data = pd.read_excel('data.xlsx')
  • JSON 文件导入
data = pd.read_json('data.json')
  • 数据库导入
import sqlite3

conn = sqlite3.connect('database.db')
data = pd.read_sql_query('SELECT * FROM table_name', conn)

数据预览

导入数据后,可以使用 head() 方法预览数据的前几行:

data.head()

数据清洗

在导入数据后,我们可能需要进行一些数据清洗,例如去除空值、处理缺失值等。

  • 去除空值
data.dropna(inplace=True)
  • 处理缺失值
data.fillna(method='ffill', inplace=True)

跳转到高级教程

如果你已经掌握了基础的数据导入,可以跳转到 Pandas 高级教程 学习更高级的数据处理技巧。

Pandas 数据分析