DataFrame 是一种用于存储和操作数据的表格结构,在数据分析中非常常见。以下是一些关于 DataFrame 的基本概念和操作方法。

基本概念

DataFrame 通常由行和列组成,每一行代表一条记录,每一列代表一个字段。DataFrame 中的数据类型可以是数值、文本、日期等。

创建 DataFrame

以下是一个使用 Python 的 pandas 库创建 DataFrame 的示例:

import pandas as pd

data = {
    'Name': ['Alice', 'Bob', 'Charlie'],
    'Age': [25, 30, 35],
    'City': ['New York', 'Los Angeles', 'Chicago']
}

df = pd.DataFrame(data)

查看数据

使用 head() 方法可以查看 DataFrame 的前几行数据:

print(df.head())

选择列

可以使用列名来选择 DataFrame 中的列:

print(df['Name'])

选择行

可以使用条件语句来选择满足条件的行:

print(df[df['Age'] > 28])

插入数据

可以使用 lociloc 方法来插入数据:

df.loc[2, 'City'] = 'Houston'

删除数据

可以使用 drop 方法来删除数据:

df.drop(df[df['Age'] > 30].index, inplace=True)

本站链接

更多关于 DataFrame 的内容,请访问DataFrame 教程

图片

DataFrame 的概念可以比作一个表格,下面是一个表格的示例。

Table