在 nanoarrow 中,“数组”指的是 Arrow C 数据接口中的 struct ArrowArray 定义。在 R 层面,我们附加了一个模式,使得 nanoarrow_array 类在功能上可以以类似于 arrow::Array 的方式使用。请注意,在 nanoarrow 中,arrow::RecordBatch 和一个非空 arrow::StructArray 的表示是相同的。
参数
- x
要转换为数组的对象
- ...
传递给 S3 方法
- schema
可选模式,用于强制转换为特定类型。默认为
infer_nanoarrow_schema()。
示例
(array <- as_nanoarrow_array(1:5))
#> <nanoarrow_array int32[5]>
#> $ length : int 5
#> $ null_count: int 0
#> $ offset : int 0
#> $ buffers :List of 2
#> ..$ :<nanoarrow_buffer validity<bool>[null] ``
#> ..$ :<nanoarrow_buffer data<int32>[5][20 b]> `1 2 3 4 5`
#> $ dictionary: NULL
#> $ children : list()
as.vector(array)
#> [1] 1 2 3 4 5
(array <- as_nanoarrow_array(data.frame(x = 1:5)))
#> <nanoarrow_array struct[5]>
#> $ length : int 5
#> $ null_count: int 0
#> $ offset : int 0
#> $ buffers :List of 1
#> ..$ :<nanoarrow_buffer validity<bool>[null] ``
#> $ children :List of 1
#> ..$ x:<nanoarrow_array int32[5]>
#> .. ..$ length : int 5
#> .. ..$ null_count: int 0
#> .. ..$ offset : int 0
#> .. ..$ buffers :List of 2
#> .. .. ..$ :<nanoarrow_buffer validity<bool>[null] ``
#> .. .. ..$ :<nanoarrow_buffer data<int32>[5][20 b]> `1 2 3 4 5`
#> .. ..$ dictionary: NULL
#> .. ..$ children : list()
#> $ dictionary: NULL
as.data.frame(array)
#> x
#> 1 1
#> 2 2
#> 3 3
#> 4 4
#> 5 5