通用的列式格式和多语言工具箱,用于快速数据交换和内存分析
Apache Arrow 定义了一种与语言无关的列式内存格式,适用于平面和分层数据,旨在在 CPU 和 GPU 等现代硬件上进行高效的分析操作。Arrow 内存格式还支持零拷贝读取,可实现闪电般快速的数据访问,无需序列化开销。
了解更多设计信息或阅读规范。
Arrow 的库实现了该格式,并为一系列用例(包括高性能分析)提供了构建块。许多流行的项目使用 Arrow 来高效地传输列式数据或作为分析引擎的基础。
库可用于 C、C++、C#、Go、Java、JavaScript、Julia、MATLAB、Python、R、Ruby 和 Rust。请参阅如何安装和入门。
Apache Arrow 是由开发者社区创建并为开发者社区服务的软件。我们致力于开放、友好的沟通和共识决策。我们的提交者来自各种组织和背景,我们欢迎所有人参与我们。
了解更多关于如何提问和参与 Arrow 项目的信息。