从序列化的 Arrow 数据中读取/写入连接、文件路径、URL 或原始向量。Arrow 文档通常将此格式称为“Arrow IPC”,因为它的起源是作为在进程(例如,多个 R 会话)之间传输表格的一种方式。此格式也可以写入文件或 URL 并从中读取,它本质上是 CSV 文件的高性能等效项,并且在维护类型方面做得更好。
参数
- x
一个
raw()向量、连接或文件路径,从中读取二进制数据。指示压缩的常见扩展名(.gz、.bz2、.zip)会自动解压缩。- ...
当前未使用。
- lazy
默认情况下,
read_nanoarrow()将读取并丢弃读取器模式的副本,以确保尽快发现无效流。使用lazy = TRUE将此检查推迟到实际使用读取器时。- data
一个要作为 Arrow IPC 流写入的对象,使用
as_nanoarrow_array_stream()转换。值得注意的是,这包括一个data.frame()。
详情
nanoarrow 软件包实现了一个 IPC 写入器;但是,您也可以使用 arrow::write_ipc_stream() 从 R 写入数据,或使用 Python、C++、Rust、JavaScript、Julia、C# 等其他 Arrow 实现中的等效写入器。
Arrow 流的媒体类型是 application/vnd.apache.arrow.stream,建议的文件扩展名是 .arrows。
示例
as.data.frame(read_nanoarrow(example_ipc_stream()))
#> some_col
#> 1 0
#> 2 1
#> 3 2