创建 RecordBatch
参数
- ...
一个
data.frame
或一组命名的数组或向量。如果给定 data.frame 和向量的混合,则输入将自动拼接在一起(参见示例)。或者,您可以提供单个 Arrow IPCInputStream
、Message
、Buffer
或包含Buffer
的 Rraw
对象。- schema
一个 Schema,或
NULL
(默认值)以从...
中的数据推断 schema。当提供 Arrow IPC 缓冲区时,需要schema
。
示例
batch <- record_batch(name = rownames(mtcars), mtcars)
dim(batch)
#> [1] 32 12
dim(head(batch))
#> [1] 6 12
names(batch)
#> [1] "name" "mpg" "cyl" "disp" "hp" "drat" "wt" "qsec" "vs" "am"
#> [11] "gear" "carb"
batch$mpg
#> Array
#> <double>
#> [
#> 21,
#> 21,
#> 22.8,
#> 21.4,
#> 18.7,
#> 18.1,
#> 14.3,
#> 24.4,
#> 22.8,
#> 19.2,
#> ...
#> 15.2,
#> 13.3,
#> 19.2,
#> 27.3,
#> 26,
#> 30.4,
#> 15.8,
#> 19.7,
#> 15,
#> 21.4
#> ]
batch[["cyl"]]
#> Array
#> <double>
#> [
#> 6,
#> 6,
#> 4,
#> 6,
#> 8,
#> 6,
#> 8,
#> 4,
#> 4,
#> 6,
#> ...
#> 8,
#> 8,
#> 8,
#> 4,
#> 4,
#> 4,
#> 8,
#> 6,
#> 8,
#> 4
#> ]
as.data.frame(batch[4:8, c("gear", "hp", "wt")])
#> gear hp wt
#> 1 3 110 3.215
#> 2 3 175 3.440
#> 3 3 105 3.460
#> 4 3 245 3.570
#> 5 4 62 3.190