DataFrame 是一种用于存储和操作数据的表格结构,在数据分析中非常常见。以下是一些关于 DataFrame 的基本概念和操作方法。
基本概念
DataFrame 通常由行和列组成,每一行代表一条记录,每一列代表一个字段。DataFrame 中的数据类型可以是数值、文本、日期等。
创建 DataFrame
以下是一个使用 Python 的 pandas 库创建 DataFrame 的示例:
import pandas as pd
data = {
'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35],
'City': ['New York', 'Los Angeles', 'Chicago']
}
df = pd.DataFrame(data)
查看数据
使用 head()
方法可以查看 DataFrame 的前几行数据:
print(df.head())
选择列
可以使用列名来选择 DataFrame 中的列:
print(df['Name'])
选择行
可以使用条件语句来选择满足条件的行:
print(df[df['Age'] > 28])
插入数据
可以使用 loc
或 iloc
方法来插入数据:
df.loc[2, 'City'] = 'Houston'
删除数据
可以使用 drop
方法来删除数据:
df.drop(df[df['Age'] > 30].index, inplace=True)
本站链接
更多关于 DataFrame 的内容,请访问DataFrame 教程。
图片
DataFrame 的概念可以比作一个表格,下面是一个表格的示例。