如何创建一个包含滚动桶组数据的集合

我有服务器日志价值几个月的流量。下面是部分示例

"UploadDateGMT","UserFileSize","TotalBusinessUnits"
"2012-01-01 00:00:38","1223","1"
"2012-01-01 00:01:16","1302","1"
"2012-01-01 00:08:10","1302","1"

我想将其转换为一个数据集,我可以在滚动基础上计算每个五分钟窗口中提交的字节数。 (即0-5,1-6,2-7等)由此,我可以提取最大负载,95%负载,制作漂亮的负载图等。

0
额外 编辑
意见: 1

2 答案

xts包会做诀窍:

library(xts)
tab <-read.table(text="UploadDateGMT,UserFileSize,TotalBusinessUnits
'2012-01-01 00:00:38',1223,1
'2012-01-01 00:01:16',1302,1
'2012-01-01 00:08:10',1302,1", header=TRUE, as.is=TRUE,sep = ",")

tab2<-xts(tab$UserFileSize,order.by=as.POSIXct(tab$UploadDateGMT) ) #create xts object
endp <-endpoints(tab2, on="mins", k=5) #5 minutes endpoints
fivemin <-period.apply(tab2,endp,sum) #sum per 5-minute period
fivemin

                    [,1]
2012-01-01 00:01:16 2525
2012-01-01 00:08:10 1302

如果您希望时间栏以5分钟为增量:

res<- align.time( fivemin[endpoints(fivemin, on="mins", k=5)], n=60*5)
0
额外
约书亚,你是对的。我误解了这个问题。
额外 作者 Pierre Lapointe,
关闭,但这不会创建滚动窗口。您需要汇总到1分钟,然后使用 rollsum.zoo
额外 作者 Joshua Ulrich,

要扩展@ PLapointe的答案

endp <- endpoints(tab2, on="mins", k=1) # 1 minute endpoints
onemin <- period.apply(tab2,endp,sum)   # sum per 1-minute period
onemin <- align.time(onemin)            # align to end-of-period times
# all one-minute increments from start--end of onemin
allonemin <- seq(start(onemin), end(onemin), by="1 min")
onemin <- merge(onemin, xts(,allonemin))
fivemin <-  rollapplyr(onemin, 5, sum, na.rm=TRUE, fill=NA)
0
额外
感谢你们两位。这工作完美。我敬畏。
额外 作者 Ben Mathews,
那很棒。顺便说一句,你提到了 rollersum.zoo ,我想我记得一次使用它。但?rollersum.zoo 是空的。这个功能是否存在?
额外 作者 Pierre Lapointe,
@PLapointe:我不确定......我认为它确实(正如我对你的回答的评论所暗示的那样),但我没有看到它。
额外 作者 Joshua Ulrich,