Python#

PyArrow - Apache Arrow Python 绑定#

这是 Apache Arrow 的 Python API 文档。

Apache Arrow 是一种通用的列式格式和多语言工具箱,用于快速数据交换和内存分析。它包含一组技术,使数据系统能够高效地存储、处理和移动数据。

有关 Arrow 项目本身、Arrow 格式和其他语言绑定的更多详细信息,请参阅父文档

Arrow Python 绑定(也称为 “PyArrow”)与 NumPy、pandas 和内置 Python 对象具有一流的集成。它们基于 Arrow 的 C++ 实现。

在这里,我们将详细介绍 Arrow 的 Python API 的用法,以及添加额外功能的叶子库,例如将 Apache Parquet 文件读取到 Arrow 结构中。