什么是 Arrow?

格式

Apache Arrow 定义了一种与语言无关的列式内存格式,用于存储扁平数据和层次化数据,并针对现代硬件(如 CPU 和 GPU)上的高效分析操作进行了优化。Arrow 内存格式还支持零拷贝读取,可在没有序列化开销的情况下实现闪电般的快速数据访问。

了解更多关于设计的信息或阅读规范

Arrow 的库实现了该格式,并为一系列用例提供了构建块,包括高性能分析。许多流行的项目使用 Arrow 高效地传输列式数据或作为分析引擎的基础。

库适用于CC++C#GoJavaJavaScriptJuliaMATLABPythonRRubyRust。查看如何安装并开始使用。

生态系统

Apache Arrow 是由开发人员社区为开发人员社区创建的软件。我们致力于开放、友好的沟通和协商一致的决策。我们的贡献者来自各种组织和背景,并且我们欢迎所有人与我们一起参与。

了解更多关于如何提问并在 Arrow 项目中参与的信息。