什么是 Arrow?

格式

Apache Arrow 定义了一种与语言无关的列式内存格式,用于平面和嵌套数据,经过组织以便在现代硬件(如 CPU 和 GPU)上进行高效的分析操作。 Arrow 内存格式还支持零拷贝读取,可实现闪电般的数据访问,而无需序列化开销。

了解更多关于设计的信息,或阅读规范

Arrow 的库实现了该格式,并为各种 使用案例 提供构建块,包括高性能分析。 许多流行的项目使用 Arrow 来高效地传输列式数据,或者作为分析引擎的基础。

库适用于 CC++C#GoJavaJavaScriptJuliaMATLABPythonRRubyRust。 查看如何安装并开始使用。

生态系统

Apache Arrow 是由开发者社区创建并为开发者社区服务的软件。 我们致力于开放、友好的沟通和共识决策。 我们的 提交者 来自不同的组织和背景,并且 我们欢迎所有人参与其中。

了解更多关于您如何提出问题并参与 Arrow 项目的信息。