什么是 Arrow?

格式

Apache Arrow 定义了一种与语言无关的列式内存格式,用于扁平化和嵌套数据,其结构专为在 CPU 和 GPU 等现代硬件上进行高效分析操作而优化。Arrow 内存格式还支持零拷贝读取,无需序列化开销即可实现闪电般的数据访问速度。

进一步了解其设计或阅读规范

Arrow 的库实现了该格式,并为一系列用例(包括高性能分析)提供了构建模块。许多热门项目使用 Arrow 高效地传输列式数据,或将其作为分析引擎的基础。

Arrow 提供了适用于 CC++C#GoJavaJavaScriptJuliaMATLABPythonRRubyRustSwift 的库。查看如何安装并开始使用。

生态系统

Apache Arrow 是一个由开发者社区创建并为其服务的软件。我们致力于开放、友善的沟通和共识决策。我们的提交者来自不同的组织和背景,我们欢迎所有人与我们一同参与。

进一步了解如何提问并参与到 Arrow 项目中来。