Apache Arrow 定义了两种用于 序列化数据以进行进程间通信 (IPC) 的格式:一种是“流”格式,另一种是“文件”格式,也称为 Feather。read_ipc_stream()
和 read_feather()
分别读取这些格式。
参数
- file
字符型文件名或 URI、连接、
raw
向量、Arrow 输入流,或带有路径的FileSystem
(SubTreeFileSystem
)。 如果是文件名或 URI,将打开一个 Arrow InputStream 并在完成后关闭。 如果提供输入流,它将保持打开状态。- as_data_frame
该函数应该返回一个
tibble
(默认) 还是一个 Arrow Table?- ...
传递给
read_feather()
的额外参数。
返回值
如果 as_data_frame
为 TRUE
(默认),则返回一个 tibble
,否则返回一个 Arrow Table
参见
write_feather()
用于写入 IPC 文件。 RecordBatchReader 用于更底层的接口。