Apache Arrow ADBC 18 (库) 版本发布


已发布 2025年5月6日
作者 Apache Arrow PMC (pmc)

Apache Arrow 团队很高兴地宣布 Apache Arrow ADBC 库的 18 版本发布。此版本包括来自 22 位独立贡献者28 个已解决问题

这是一个版本,版本号为 18。API 规范是独立版本化的,版本号为 1.1.0。

子组件独立版本化

  • C/C++/GLib/Go/Python/Ruby: 1.6.0
  • C#: 0.18.0
  • Java: 0.18.0
  • R: 0.18.0
  • Rust: 0.18.0

下面的发布说明并非详尽无遗,仅展示了此版本的部分亮点。还有许多其他错误修复和改进:请参阅完整变更日志

发布亮点

使用 Meson 构建项目得到了改进 (#2735, #2746)。

C# 绑定及其驱动在此版本中进行了大量活动。现在提供了一个 Databricks Spark 驱动 (#2672, #2737, #2743, #2692),支持 CloudFetch 等功能 (#2634, #2678, #2691)。通用 Spark 驱动现在对 503 响应具有更好的重试行为 (#2664),支持在 Arrow IPC 格式之外应用的 LZ4 压缩 (#2669),并支持 OAuth (#2579) 等改进。用于各种基于 Thrift 的系统的“Apache”驱动现在除了 Apache Spark 和 Apache Impala 之外还支持 Apache Hive (#2540) 等改进。BigQuery 驱动增加了更多的身份验证和其他配置设置 (#2655, #2566, #2541, #2698)。

Flight SQL 驱动支持 OAuth (#2651)。

Java 绑定实验性地支持围绕公开 ADBC C API 的驱动的 JNI 包装器 (#2401)。这些目前不通过 Maven 分发,必须手动构建。

Go 绑定现在支持 `database/sql` 包装器中的联合类型 (#2637)。基于 Golang 的 BigQuery 驱动返回更多关于表的元数据 (#2697)。

PostgreSQL 驱动现在避免了虚假的提交/回滚命令 (#2685)。它还更优雅地处理不当使用 (#2653)。

Python 绑定现在可以在各种地方更容易地传递选项 (#2589, #2700)。此外,DB-API 层可以在不安装 PyArrow 的情况下最低限度地使用,这使得像 polars 这样不需要或不想要第二个 Arrow 实现的库用户更容易使用 (#2609)。

Rust 绑定现在避免在每次操作时锁定驱动,从而允许并发使用 (#2736)。

贡献者

$ git shortlog --perl-regexp --author='^((?!dependabot\[bot\]).*)$' -sn apache-arrow-adbc-17..apache-arrow-adbc-18
    20	David Li
     6	William Ayd
     5	Curt Hagenlocher
     5	davidhcoe
     4	Alex Guo
     4	Felipe Oliveira Carvalho
     4	Jade Wang
     4	Matthijs Brobbel
     4	Sutou Kouhei
     4	eric-wang-1990
     3	Bruce Irschick
     2	Milos Gligoric
     2	Sudhir Reddy Emmadi
     2	Todd Meng
     1	Bryce Mecum
     1	Dewey Dunnington
     1	Filip Wojciechowski
     1	Hiroaki Yutani
     1	Hélder Gregório
     1	Marin Nozhchev
     1	amangoyal
     1	qifanzhang-ms

路线图

关于 ADBC 潜在的第二次修订,以包含更多缺失功能和异步 API 支持,正在进行一些讨论。有关更多信息,请参阅里程碑。我们欢迎关于可以添加或扩展的 API 的建议。一些贡献者计划在不久的将来开始起草提案。

参与其中

我们欢迎所有感兴趣的人提出问题和贡献。问题可以在 GitHub 上提出,问题可以发送到 GitHub 或 Arrow 邮件列表