1.apply()
apply()以數(shù)據(jù)幀或矩陣作為輸入,并以向量、列表或數(shù)組的形式給出輸出。
apply(X, MARGIN, FUN)
? x :數(shù)組或矩陣
? MARGIN:取1到2之間的值或范圍來定義在何處應(yīng)用函數(shù),
? ? 1:在行執(zhí)行的
? ? 2:在列上執(zhí)行的
? ? c(1,2):對行和列都執(zhí)行
? FUN :應(yīng)用哪個函數(shù)。構(gòu)建的函數(shù)如mean, median, sum, min, max,也可使用用戶自己定義的。例子
> data <- matrix(C<-(1:30),nrow=5)
> data
[,1] [,2] [,3] [,4] [,5] [,6]
[1,] 1 6 11 16 21 26
[2,] 2 7 12 17 22 27
[3,] 3 8 13 18 23 28
[4,] 4 9 14 19 24 29
[5,] 5 10 15 20 25 30
> apply(data, 2, sum)
[1] 15 40 65 90 115 140
> apply(data, 1, sum)
[1] 81 87 93 99 105
> apply(data, c(1,2), sum)
[,1] [,2] [,3] [,4] [,5] [,6]
[1,] 1 6 11 16 21 26
[2,] 2 7 12 17 22 27
[3,] 3 8 13 18 23 28
[4,] 4 9 14 19 24 29
[5,] 5 10 15 20 25 30
2.lapply()
? lapply()(代表list apply)與矩陣的apply()函數(shù)的用法類似。其對列表對象執(zhí)行操作,并返回與原始集合長度相同的列表對象。
? lapply()和apply()之間的區(qū)別在于輸出。lapply()的輸出是一個列表。lapply()可以用于其他對象,比如數(shù)據(jù)幀和列表。
- lapply(X, FUN)
? X: 向量或?qū)ο?其余對象將被通過as.list強制轉(zhuǎn)換為list
? FUN: 作用于x中的每個元素的函數(shù)
lapply()函數(shù)不需要參數(shù)MARGIN - 例子
> x <- list(a = 1:10, beta = exp(-3:3), logic = c(TRUE,FALSE,FALSE,TRUE))
> lapply(x, quantile, probs = 1:3/4)
$a
25% 50% 75%
3.25 5.50 7.75
$beta
25% 50% 75%
0.2516074 1.0000000 5.0536690
$logic
25% 50% 75%
0.0 0.5 1.0
3.sapply()
sapply()(代表simplified [l]apply)可以將結(jié)果整理以向量,矩陣,列表 的形式輸出。
- sapply(X,FUN,…, simplify = TRUE, USE.NAMES = TRUE)
? X: 向量或?qū)ο?br> ? FUN: 作用于x中每個元素的函數(shù)
? simplify 邏輯值或者字符串,如果可以,結(jié)果應(yīng)該被簡化為向量、矩陣或者高維數(shù)組。必須是命名的,不能是簡寫。默認值是TRUE,若合適將會返回一個向量或者矩陣。如果simplify=”array”,結(jié)果將返回一個陣列。
? USE.NAMES 邏輯值,如果為TRUE,且x沒有被命名,則對x進行命名。 - 例子
#以向量輸出
> sapply(x, mean)
a beta logic
5.500000 4.535125 0.500000
#以矩陣輸出
> sapply(x, quantile)
a beta logic
0% 1.00 0.04978707 0.0
25% 3.25 0.25160736 0.0
50% 5.50 1.00000000 0.5
75% 7.75 5.05366896 1.0
100% 10.00 20.08553692 1.0
#以列表輸出
> sapply(x, seq)
$a
[1] 1 2 3 4 5 6 7 8 9 10
$beta
[1] 1 2 3 4 5 6 7
$logic
[1] 1 2 3 4
4.vapply()
vapply()與sapply()相似,他可以預(yù)先指定的返回值類型。所以它使用起來會更加安全,有的時候會更快
在vapply函數(shù)中總是會進行簡化,vapply會檢測FUN的所有值是否與FUN.VALUE兼容,以使他們具有相同的長度和類型。
- vapply(X, FUN, FUN.VALUE, …, USE.NAMES = TRUE)
? X: 向量或?qū)ο?br> ? FUN: 作用于x中每個元素的函數(shù)
? FUN.VALUE 一個通用型向量,F(xiàn)UN函數(shù)返回值得模板
? simplify 邏輯值或者字符串,如果可以,結(jié)果應(yīng)該被簡化為向量、矩陣或者高維數(shù)組。必須是命名的,不能是簡寫。默認值是TRUE,若合適將會返回一個向量或者矩陣。如果simplify=”array”,結(jié)果將返回一個陣列。
? USE.NAMES 邏輯值,如果為TRUE,且x沒有被命名,則對x進行命名。 - 例子
> sapply(x, quantile)
a beta logic
0% 1.00 0.04978707 0.0
25% 3.25 0.25160736 0.0
50% 5.50 1.00000000 0.5
75% 7.75 5.05366896 1.0
100% 10.00 20.08553692 1.0
> vapply(x, quantile, c(Min. = 0, "1st Qu." = 0, Median = 0, "3rd Qu." = 0, Max. = 0))
a beta logic
Min. 1.00 0.04978707 0.0
1st Qu. 3.25 0.25160736 0.0
Median 5.50 1.00000000 0.5
3rd Qu. 7.75 5.05366896 1.0
Max. 10.00 20.08553692 1.0
5.tapply()
tapply()為向量中的每個因子變量根據(jù)函數(shù)計算一個度量值。
- tapply(X, INDEX, FUN = NULL, …, simplify = TRUE)
?X: 一個對象,通常是向量,不可以是數(shù)據(jù)框
?INDEX: 一個包含因子的列表
?FUN: 作用于x中每個元素的函數(shù)
?simplify 若為FALSE,tapply將以列表形式返回陣列。若為TRUE,F(xiàn)UN則直接返回數(shù)值 - 例子
> n <- 17
> fac <- factor(rep_len(1:3, n), levels = 1:5)
> table(fac)
fac
1 2 3 4 5
6 6 5 0 0
> tapply(1:n, fac, sum)
1 2 3 4 5
51 57 45 NA NA
6.mapply()
多參數(shù)版本的sapply()。第一次計算傳入各組向量的第一個元素到FUN,進行結(jié)算得到結(jié)果;第二次傳入各組向量的第二個元素,得到結(jié)果;第三次傳入各組向量的第三個元素…以此類推。
mapply(FUN, …, MoreArgs = NULL, SIMPLIFY = TRUE, USE.NAMES = TRUE)
?MoreArgs FUN函數(shù)的其他參數(shù)列表
?SIMPLIFY 邏輯或者字符串,可以減少結(jié)果成為一個向量、矩陣或者更高維陣列,詳見sapply的simplify參數(shù)
?USE.NAMES 邏輯值,如果第一個參數(shù)…已被命名,將使用這個字符向量作為名字例子
> mapply(rep, 1:4, 4:1,SIMPLIFY = FALSE)
[[1]]
[1] 1 1 1 1
[[2]]
[1] 2 2 2
[[3]]
[1] 3 3
[[4]]
[1] 4