Apache Arrow ADBC 19 (库) 发布
已发布 2025年7月8日
作者 Apache Arrow PMC (pmc)
Apache Arrow 团队很高兴宣布 Apache Arrow ADBC 库的 19 版本发布。此版本包括来自 27 位不同贡献者 的 60 个已解决的问题。
这是 **库** 的发布,版本为 19。 API 规范 独立版本,版本为 1.1.0。
子组件独立版本化
- C/C++/GLib/Go/Python/Ruby: 1.7.0
- C#: 0.19.0
- Java: 0.19.0
- R: 0.19.0
- Rust: 0.19.0
以下发布说明并非详尽无遗,仅列出了本次发布的一些亮点。我们还进行了许多其他错误修复和改进:请参阅完整的更新日志。
发布亮点
- Apache Hive/Impala/Spark, Databricks: 这些驱动程序收到了大量的改进、优化和错误修复。
- DataFusion: arrow crate 版本要求现在独立于 `adbc_core` crate 的版本要求,以便在不使用 DataFusion 驱动程序时更容易使用旧版本的依赖项 (#3017)。
- 驱动管理器:现在可以通过搜索配置目录(或在 Windows 上,注册表)中的“清单”文件来加载驱动程序,这些文件描述了驱动程序的位置 (#2918, #3018, #3021, #3036, #3041)。为 Python 3.13 中的驱动管理器添加了自由线程轮子。这些仍然是实验性的;如有任何反馈,请提交错误报告 (#3063)。使得在 Python 中更容易使用 DB-API 层而无需依赖 PyArrow,从而方便 polars 和其他库的用户 (#2839)。
- Flight SQL (Go): 上次发布无意中更改了入口点符号的名称。现在,旧名称和“新”名称都存在 (#3056)。为 OAuth 使用自定义证书(如果存在)(#2829)。
- PostgreSQL: 将带时区的时间戳作为 `TIMESTAMP WITH TIME ZONE` 摄取 (#2904) 并支持读取 `int2vector` 类型 (#2919)。
- Snowflake: 修复了 COPY 并发选项 (#2805)、日志垃圾信息 (#2807) 和布尔结果列 (#2854) 的问题。添加了一个选项以微秒为单位返回时间戳,以避免极端值溢出 (#2917)。
- Rust: 在一个 API 中将 `&mut self` 更改为 `&mut`,以实现无畏并发,这是一项重大更改 (#2788)。
- 添加了与 OpenTelemetry 集成的实验性支持,从 Snowflake 驱动程序开始。 (#2729, #2825, #2847, #2951)。
- 改进了使用 Meson 时的构建体验 (#2848, #2849)。使得更容易静态链接驱动程序 (#2738)。
贡献者
$ git shortlog --perl-regexp --author='^((?!dependabot\[bot\]).*)$' -sn apache-arrow-adbc-18..apache-arrow-adbc-19
32 David Li
20 Daijiro Fukuda
16 Todd Meng
10 eric-wang-1990
7 eitsupi
6 Matt Topol
6 davidhcoe
5 Bruce Irschick
5 Sutou Kouhei
3 Dewey Dunnington
3 Jacky Hu
2 Alex Guo
2 Bryce Mecum
2 Jade Wang
2 James Thompson
2 William Ayd
2 qifanzhang-ms
1 Arseny Tsypushkin
1 Felipe Oliveira Carvalho
1 Hiroyuki Sato
1 Hélder Gregório
1 Jan-Hendrik Zab
1 Jarro van Ginkel
1 Jolan Rensen
1 Sergei Grebnov
1 Sudhir Reddy Emmadi
1 amangoyal
路线图
我们计划继续扩展对 OpenTelemetry 等已实验性引入的功能的支持。
目前正在讨论 ADBC 的第二次修订,以包含更多缺失的功能和异步 API 支持。更多信息请参见里程碑。我们欢迎就可添加或扩展的 API 提出建议。一些贡献者计划在未来开始着手提案。
参与其中
我们欢迎所有感兴趣的人提出问题和贡献。问题可以在 GitHub 上提出,问题可以发送到 GitHub 或 Arrow 邮件列表。