跳至内容

Apache Arrow 定义了两种用于序列化进程间通信 (IPC) 数据的格式:一种是“流”格式,另一种是“文件”格式,称为 Feather。read_ipc_stream()read_feather() 分别读取这些格式。

用法

read_ipc_stream(file, as_data_frame = TRUE, ...)

参数

file

字符文件名或 URI、连接、raw 向量、Arrow 输入流或带有路径的 FileSystem (SubTreeFileSystem)。如果为文件名或 URI,则会打开一个 Arrow InputStream,并在完成后关闭。如果提供了输入流,则该流将保持打开状态。

as_data_frame

函数是否应该返回一个 tibble (默认值) 或一个 Arrow Table

...

传递给 read_feather() 的额外参数。

返回值

如果 as_data_frameTRUE (默认值),则为 tibble,否则为 Arrow Table

另请参阅

write_feather() 用于写入 IPC 文件。 RecordBatchReader 用于更底层的接口。