什么是 Arrow?

格式

Apache Arrow 定义了一种与语言无关的列式内存格式,用于扁平化和层次化数据,旨在针对现代硬件(如 CPU 和 GPU)进行高效的分析操作。Arrow 内存格式还支持零拷贝读取,从而实现闪电般的快速数据访问,而无需序列化开销。

了解更多 关于设计或 阅读规范.

Arrow 的库实现了该格式,并为一系列 用例 提供构建块,包括高性能分析。 许多流行的项目 使用 Arrow 来高效地传输列式数据或作为分析引擎的基础。

库适用于 CC++C#GoJavaJavaScriptJuliaMATLABPythonRRubyRust。查看 如何安装 并开始使用。

生态系统

Apache Arrow 是由开发人员社区为开发人员社区创建的软件。我们 致力于 开放、友好的沟通和协商一致的决策。我们的 提交者 来自各种组织和背景,我们 欢迎所有人 与我们一起参与。

了解更多 关于如何提出问题并参与 Arrow 项目的信息。