R数据聚合是一个强大的工具,可以帮助我们更好地理解和分析数据。以下是一些关于R数据聚合的基础知识和技巧。

R数据聚合的基础

R语言提供了多种函数来帮助进行数据聚合,以下是一些常用的函数:

  • dplyr包中的summarise()函数
  • data.table包中的summarize()函数

使用summarise()函数

summarise()函数可以将数据框中的多个列聚合为单个值。以下是一个简单的例子:

library(dplyr)


df <- data.frame(
  name = c("Alice", "Bob", "Charlie"),
  age = c(25, 30, 35),
  salary = c(50000, 60000, 70000)
)

# 使用summarise()函数进行数据聚合
summary_df <- df %>%
  summarise(
    average_age = mean(age),
    average_salary = mean(salary)
  )

print(summary_df)

使用data.table

data.table是一个高性能的数据处理包,它提供了summarize()函数,可以更高效地进行数据聚合。

library(data.table)

# 创建一个data.table
dt <- data.table(
  name = c("Alice", "Bob", "Charlie"),
  age = c(25, 30, 35),
  salary = c(50000, 60000, 70000)
)

# 使用summarize()函数进行数据聚合
summary_dt <- dt[, .(average_age = mean(age), average_salary = mean(salary)), by = .(name)]

print(summary_dt)

扩展阅读

想要了解更多关于R数据聚合的知识,可以参考以下链接:

R语言