流和文件访问#

工厂函数#

这些工厂函数是创建 Arrow 流的推荐方法。它们接受各种类型的来源,例如内存缓冲区或磁盘文件。

input_stream(source[, compression, buffer_size])

创建一个 Arrow 输入流。

output_stream(source[, compression, buffer_size])

创建一个 Arrow 输出流。

memory_map(path[, mode])

在文件路径上打开内存映射。

create_memory_map(path, size)

创建给定大小的文件并对其进行内存映射。

流类#

NativeFile

所有 Arrow 流的基类。

OSFile

由常规文件描述符支持的流。

PythonFile

由 Python 文件对象支持的流。

BufferReader(obj)

从可转换为 Arrow 缓冲区的对象进行零拷贝读取。

BufferOutputStream

一个写入可调整大小缓冲区的输出流。

FixedSizeBufferWriter

一个写入 Arrow 缓冲区的流。

MemoryMappedFile

表示内存映射文件的流。

CompressedInputStream(stream, str compression)

一个即时解压缩数据的输入流包装器。

CompressedOutputStream(stream, str compression)

一个即时压缩数据的输出流包装器。

文件系统#

参见 文件系统