Apache Arrow ADBC 14 (库) 发布


已发布 2024 年 9 月 5 日
作者 Apache Arrow PMC (pmc)

Apache Arrow 团队很高兴宣布 Apache Arrow ADBC 库的第 14 次发布。此次发布包括 27 个已解决的问题,由 12 位不同的贡献者完成。

这是的发布,版本为 14。API 规范单独版本化,版本为 1.1.0。

子组件独立版本化

  • C/C++/GLib/Go/Python/Ruby: 1.2.0
  • C#: 0.14.0
  • Java: 0.14.0
  • R: 0.14.0
  • Rust: 0.14.0

下面的发布说明并非详尽无遗,仅列出了本次发布的一些亮点。许多其他错误修复和改进已经完成:请参阅完整的更新日志

发布亮点

Google BigQuery 的新驱动程序现已以源代码形式提供,并将通过 conda-forge 提供,但 Python wheels 将在下次发布时才可用。感谢 Cocoa Xu 所做的巨大努力!

C/C++ 实现现在使用 arrow-adbc/adbc.h 作为其包含路径,以避免污染 include 目录。目前,为了向后兼容,adbc.h 仍然安装,但我们建议更新包含路径。

C# ADO.NET 绑定现在支持绑定参数。

Rust 库现已上传到 crates.io

PostgreSQL 驱动程序现在可以正确处理 JSONB 列的读取和列表/大型列表列的摄取。它还最终正确支持预处理语句中的绑定参数,并可以处理同一字符串中的多个语句。

我们发现,在 Go 的最新版本中,当从主线程进行 FFI 调用时,存在性能退化。不幸的是,这会影响 Arrow Flight SQL、BigQuery 和 Snowflake 驱动程序实现。Python wheels 不受影响,因为我们仍然使用旧版本的 Go 构建。但是,如果您自己构建驱动程序或使用 conda-forge 包,您可能会遇到此问题。缓解措施包括尽可能减少 FFI 调用(例如,重用单个连接或游标而不是创建新的),或使用不同于主线程的线程。

贡献者

$ git shortlog --perl-regexp --author='^((?!dependabot\[bot\]).*)$' -sn apache-arrow-adbc-13..apache-arrow-adbc-14
    18	David Li
    11	Dewey Dunnington
    11	William Ayd
     4	Joel Lubinitsky
     3	davidhcoe
     2	Matt Topol
     1	Bruce Irschick
     1	Clive Cox
     1	Cocoa
     1	Curt Hagenlocher
     1	Hyunseok Seo
     1	Joris Van den Bossche

路线图

目前正在讨论 ADBC 的潜在第二次修订,以包含更多缺失的功能和异步 API 支持。有关更多信息,请参阅里程碑异步讨论/提议的 C 数据接口 API

参与其中

我们欢迎所有感兴趣的人提出问题和贡献。问题可以在 GitHub 上提出,问题可以发送到 GitHub 或 Arrow 邮件列表