Pandas 是一个强大的数据分析工具,用于 Python 编程。它提供了数据结构化、数据分析以及数据操作的功能。以下是 Pandas 的基本教程。
安装 Pandas
首先,您需要安装 Pandas 库。您可以使用以下命令进行安装:
pip install pandas
Pandas 数据结构
Pandas 主要提供两种数据结构:Series 和 DataFrame。
Series
Series 是一种类似于数组的结构,它是一维的。以下是 Series 的基本使用方法:
import pandas as pd
# 创建一个 Series
s = pd.Series([1, 2, 3, 4, 5])
# 打印 Series
print(s)
DataFrame
DataFrame 是 Pandas 的核心数据结构,它类似于表格,具有行和列。以下是 DataFrame 的基本使用方法:
import pandas as pd
# 创建一个 DataFrame
data = {
'Name': ['Tom', 'Nick', 'John'],
'Age': [20, 21, 19]
}
df = pd.DataFrame(data)
# 打印 DataFrame
print(df)
数据操作
Pandas 提供了丰富的数据操作功能,包括数据选择、数据排序、数据过滤等。
数据选择
# 选择特定列
print(df['Name'])
# 选择特定行
print(df.loc[1])
数据排序
# 按年龄排序
print(df.sort_values(by='Age'))
数据过滤
# 过滤年龄大于 20 的数据
print(df[df['Age'] > 20])
高级功能
Pandas 还提供了许多高级功能,如时间序列分析、文本分析等。
时间序列分析
import pandas as pd
# 创建一个时间序列
date_rng = pd.date_range(start='1/1/2020', end='1/10/2020', freq='D')
time_series = pd.Series(np.random.randn(len(date_rng)), index=date_rng)
# 打印时间序列
print(time_series)
文本分析
import pandas as pd
# 创建一个包含文本的 DataFrame
text_df = pd.DataFrame({'Text': ['This is a sample text.', 'Another text here.']})
# 分词
words = text_df['Text'].str.split()
# 打印分词结果
print(words)
扩展阅读
更多 Pandas 教程和示例,请访问我们的 Pandas 教程页面。