<!–- 根据一个或多个贡献者许可协议授予 Apache 软件基金会 (ASF) 许可。有关版权所有权的更多信息,请参阅随此作品分发的 NOTICE 文件。ASF 根据 Apache 许可证 2.0 版(“许可证”)向您授予此文件的许可证;除非遵守许可证,否则您不得使用此文件。您可以从以下位置获取许可证的副本:
https://apache.org/licenses/LICENSE-2.0
除非适用法律要求或书面同意,否则根据许可证分发的软件按“原样”分发,不提供任何类型的明示或暗示的保证或条件。有关许可下的权限和限制的特定语言,请参阅许可证。 –>
Arrow.jl
Arrow
— 模块Arrow.jl
Apache Arrow 内存格式规范的纯 Julia 实现。
此实现支持 1.0 版本的规范,包括支持
- 所有基本数据类型
- 所有嵌套数据类型
- 字典编码、嵌套字典编码和消息
- 扩展类型
- 流式传输、文件、记录批处理以及替换和 isdelta 字典消息
- 通过标准 LZ4 帧和 Zstd 格式进行缓冲区压缩/解压缩
它目前不包括对以下内容的支持
- 张量或稀疏张量
- Flight RPC
- C 数据接口
第三方数据格式
- 通过现有的 CSV.jl 和 Parquet.jl 包支持 CSV 和 Parquet
- 其他 Tables.jl 兼容的包自动支持(DataFrames.jl、JSONTables.jl、JuliaDB.jl、SQLite.jl、MySQL.jl、JDBC.jl、ODBC.jl、XLSX.jl 等)
- 目前没有 Julia 包支持 ORC 或 Avro 数据格式
请参阅官方 Arrow.jl API 文档,其中包含用户手册以及Arrow.Table
、Arrow.write
和Arrow.Stream
的参考文档。