Apache Arrow ADBC 14(库)版本发布


已发布 2024 年 9 月 5 日
作者 Apache Arrow PMC (pmc)

Apache Arrow 团队很高兴地宣布 Apache Arrow ADBC 库的 14 版本发布。此版本包含来自**12 位不同贡献者****27 个已解决问题**

这是**库**的版本,版本为

  1. **API 规范**版本独立,版本为 1.1.0。

子组件版本独立

  • C/C++/GLib/Go/Python/Ruby: 1.2.0
  • C#: 0.14.0
  • Java: 0.14.0
  • R: 0.14.0
  • Rust: 0.14.0

以下发行说明并非详尽无遗,仅展示了该版本的部分重点内容。 还进行了许多其他错误修复和改进:我们建议您参考完整的变更日志

版本亮点

适用于 Google BigQuery 的新驱动程序现已以源代码形式提供,并将从 conda-forge 获得,但是,Python wheel 将在下一个版本发布之前不可用。 感谢 Cocoa Xu 的重大贡献!

C/C++ 实现现在使用 arrow-adbc/adbc.h 作为其包含路径,以避免污染 include 目录。 目前,为了向后兼容,仍然安装了 adbc.h,但我们建议更新包含路径。

C# ADO.NET 绑定现在支持绑定参数。

Rust 库现在已上传到 crates.io

PostgreSQL 驱动程序现在可以正确处理读取 JSONB 列和列表/大型列表列的引入。 它最终也正确支持预处理语句中的绑定参数,并且可以处理同一字符串中的多个语句。

我们发现最新版本的 Go 在从主线程进行 FFI 调用时存在性能下降。 不幸的是,这会影响 Arrow Flight SQL、BigQuery 和 Snowflake 驱动程序实现。 Python wheel 不受影响,因为我们仍在使用旧版本的 Go 进行构建。 但是,如果您是自己构建驱动程序或使用 conda-forge 包,则可能会遇到此问题。 缓解措施包括尽可能减少 FFI 调用(例如,重用单个连接或游标而不是创建新连接或游标),或使用主线程以外的其他线程。

贡献者

$ git shortlog --perl-regexp --author='^((?!dependabot\[bot\]).*)$' -sn apache-arrow-adbc-13..apache-arrow-adbc-14
    18	David Li
    11	Dewey Dunnington
    11	William Ayd
     4	Joel Lubinitsky
     3	davidhcoe
     2	Matt Topol
     1	Bruce Irschick
     1	Clive Cox
     1	Cocoa
     1	Curt Hagenlocher
     1	Hyunseok Seo
     1	Joris Van den Bossche

路线图

正在讨论 ADBC 的潜在第二个修订版,以包含更多缺失的功能和异步 API 支持。 更多信息,请参阅里程碑异步讨论/提议的 C 数据接口 API

参与其中

我们欢迎所有感兴趣的人提出问题和贡献。 可以在 GitHub 上提交问题,问题可以定向到 GitHub 或 Arrow 邮件列表