Apache Arrow 定义了两种用于序列化数据以进行进程间通信 (IPC) 的格式:一种“流”格式和一种“文件”格式,后者被称为 Feather。read_ipc_stream() 和 read_feather() 分别读取这两种格式。
参数
- file
字符文件名或 URI、连接、
raw向量、Arrow 输入流,或带有路径的FileSystem(SubTreeFileSystem)。如果是文件名或 URI,将打开一个 Arrow InputStream 并在完成后关闭。如果提供了输入流,它将保持打开状态。- as_data_frame
函数应该返回一个
tibble(默认)还是一个 Arrow Table?- ...
传递给
read_feather()的额外参数。
返回值
如果 as_data_frame 为 TRUE(默认值),则为 tibble;否则为 Arrow Table。
另请参阅
write_feather() 用于写入 IPC 文件。RecordBatchReader 用于更底层的接口。