Apache Arrow 10.0.0 (2022年10月26日)
这是一个涵盖两个多月开发的主要版本。
下载
贡献者
本次发布包含来自100位贡献者的536次提交。
$ git shortlog -sn apache-arrow-9.0.0..apache-arrow-10.0.0
68 Sutou Kouhei
52 Matt Topol
32 David Li
31 Antoine Pitrou
19 Alenka Frim
19 Jacob Wujciak-Jens
19 Weston Pace
18 Miles Granger
18 Nic Crane
17 Jin Shang
17 Raúl Cumplido
14 Neal Richardson
14 eitsupi
12 Will Jones
12 david dali susanibar arce
11 Dewey Dunnington
10 Vibhatha Lakmal Abeykoon
7 Igor Suhorukov
7 Larry White
7 Rok Mihevc
6 rtpsw
5 Kshiteej K
5 octalene
4 Krisztián Szűcs
4 Yibo Cai
3 Ben Harkins
3 Bryce Mecum
3 Dominik Moritz
3 George Godik
3 Joris Van den Bossche
3 LouisClt
3 Percy Camilo Triveño Aucahuasi
3 Philipp Moritz
3 Todd Farmer
3 Wes McKinney
2 0x26res
2 Anja Kefala
2 Dragoș Moldovan-Grünfeld
2 François Michonneau
2 Gang Wu
2 Hongze Zhang
2 Joost Hoozemans
2 Kae S
2 Nishanth Thimmegowda
2 Pavel Solodovnikov
2 SHIMA Tatsuya
2 Sam Albers
2 Ziheng Wang
1 Aleksei Smirnov
1 Andrea Giudiceandrea
1 Ankit Gehlot
1 Artavazd Balaian
1 Benson Muite
1 Christopher Dunderdale
1 Corey Kosak
1 Dhruv Vats
1 Duncan MacQuarrie
1 Egill Fridgeirsson
1 Eng Zer Jun
1 Felix Yan
1 Gajo Petrovic
1 Gil Forsyth
1 Ivan Chau
1 Jacky Lee
1 James Bourbeau
1 James Duong
1 Jayjeet Chakraborty
1 Jeroen van Straten
1 Jie Zhang
1 Jin Chengcheng
1 Kai Fricke
1 Kevin Gurney
1 Kun Liu
1 Leo Gertsenshteyn
1 Liang-Chi Hsieh
1 Michael Chirico
1 Michał Pogoda
1 Mitch
1 Muthunagappan Muthuraman
1 Otegami
1 Quang Hoang
1 Quanlong Huang
1 Raphael Taylor-Davies
1 Rasmus Johansen
1 Sanjiban Sengupta
1 Theodore Tsirpanis
1 Wilhelm Ågren
1 William Hyun
1 Xianyang Liu
1 ZMZ91
1 andreoss
1 dependabot[bot]
1 emkornfield
1 fatemehp
1 lafiona
1 mgiessing
1 michalursa
1 mopcup
1 patrick
1 serge-sans-paille
补丁提交者
以下 Apache 提交者将贡献的补丁合并到仓库中。
$ git shortlog -sn --group=trailer:signed-off-by apache-arrow-9.0.0..apache-arrow-10.0.0
126 Sutou Kouhei
97 Antoine Pitrou
68 David Li
59 Matt Topol
41 Neal Richardson
26 Joris Van den Bossche
25 Weston Pace
21 Nic Crane
13 Dewey Dunnington
11 Yibo Cai
10 Alenka Frim
9 Krisztián Szűcs
4 Jonathan Keane
4 Rok
2 Eric Erhardt
2 Philipp Moritz
2 Wes McKinney
1 Alessandro Molina
1 Andrew Lamb
1 Benjamin Kietzman
1 Dominik Moritz
1 Ian Cook
1 Rok Mihevc
更新日志
Apache Arrow 10.0.0 (2022-10-26)
新功能和改进
- ARROW-3678 - [Go] 实现联合数组 (Union Arrays) (#13768)
- ARROW-6772 - [C++] 为带有 Equals() 方法的接口添加 operator== (#14038)
- ARROW-6858 - [C++] 简化传递式构建选项依赖 (#14224)
- ARROW-7744 - [Java][FlightRPC] 用于 Arrow Flight SQL 的 JDBC 驱动 (#13800)
- ARROW-8201 - [Python] 添加 FileFragment.open() 方法 (#14301)
- ARROW-8226 - [Go] 添加 64 位偏移量的二进制构建器和字符串构建器 (#13719)
- ARROW-10600 - [Go] 实现 Decimal256 (#13792)
- ARROW-11699 - [R] 为 mutate() 实现 dplyr::across()
- ARROW-11841 - [R][C++] 允许取消长时间运行的命令 (#13635)
- ARROW-12105 - [R] 使用 eval_select、eval_rename 替换 vars_select、vars_rename (#14371)
- ARROW-12590 - [C++][R] 更新 Homebrew 文件的副本以反映最近的更新 (#13769)
- ARROW-12693 - [R] 为 ArrowTabular、datasets 添加 unique() 方法 (#13641)
- ARROW-12778 - [R] 支持 dplyr 动词中的 tidyselect where() 选择助手
- ARROW-12958 - [CI][开发者] 为 PR 分支构建和托管文档 (#13913)
- ARROW-13055 - [文档] 创建权威扩展类型文档 (#14167)
- ARROW-13454 - [C++][文档] 表格 vs 记录批处理 (#14008)
- ARROW-13766 - [R] 添加 slice_*() 方法 (#14361)
- ARROW-14280 - [文档] R 包架构概述 (#14294)
- ARROW-14495 - [Python] 修复 DictionaryArray.from_buffers,不应崩溃 (#13989)
- ARROW-14500 - [C++] 支持从存储类型转换到扩展类型
- ARROW-14958 - [C++][Python][FlightRPC] 实现用于 OpenTelemetry 传播的 Flight 中间件 (#11920)
- ARROW-15011 - [R] 为 dplyr 函数绑定生成文档 (#14014)
- ARROW-15260 - [R] open_dataset - 将 file_name 添加为一列 (#12826)
- ARROW-15277 - [C++][Python] 对 chunked_array 使用 ChunkedArray::Make (#13950)
- ARROW-15479 - [C++] 将固定大小列表转换为兼容的固定大小列表类型 (其他值类型,其他字段名) (#14181)
- ARROW-15481 - [R][CI] 添加一个模仿 CRAN 旧版 macOS 的 crossbow 作业 (#13925)
- ARROW-15540 - [C++] 允许 substrait 消费者接受带有提示和可空字面量的计划 (#14402)
- ARROW-15545 - [Python][C++] 支持转换为扩展类型 (#14106)
- ARROW-15582 - [C++] 添加对注册标准 Substrait 函数的支持 (#13613)
- ARROW-15584 - [C++] 添加对 Substrait 的 RelCommon::Emit 的支持 (#13914)
- ARROW-15678 - [C++] 添加对 -DCMAKE_BUILD_TYPE=MinSizeRel 的支持 (#14342)
- ARROW-15693 - [开发] 更新 crossbow 模板以使用 master 或 main (#13975)
- ARROW-15745 - [Java] 弃用冗余的 ScanTask 可迭代对象 (#14168)
- ARROW-15838 - [R] 在完全外连接中合并连接键 (#14286)
- ARROW-15839 - [C++][Python] 在 ListArray.from_arrays 中接受有效性位图 (#13894)
- ARROW-15927 - [C++][Skyhook] 添加 skyhook 示例 (#12620)
- ARROW-16000 - [C++][Python] 数据集:向 CSV 扫描器添加转码函数选项的替代实现 (#13820)
- ARROW-16190 - [CI][R] 在 Apple M1 上为 R 实现 CI (#14099)
- ARROW-16226 - [C++] 为文件系统 tell 添加更好的覆盖率。(#14064)
- ARROW-16340 - [C++][Python] 将所有 Python 相关代码移动到 PyArrow (#13311)
- ARROW-16356 - [Python] 暴露 RandomAccessFile::GetStream (#13793)
- ARROW-16384 - [文档] 将 Flight SQL 添加到状态页面 (#14053)
- ARROW-16424 - [C++] 使用 Uri 解析 substrait ReadRel 文件路径 (#14071)
- ARROW-16431 - [C++][Python] 改进 AppendRowGroups 在模式不同时的错误信息 (#14029)
- ARROW-16584 - [Java] 支持 S3 的 Java JNI (#13157)
- ARROW-16605 - [CI][R] 修复 revdep docker 作业 (#13483)
- ARROW-16690 - [R][FlightRPC] 在 do_put 方法中增加 max_chunksize 参数 (#13267)
- ARROW-16695 - [R][Python][C++] 连接操作不支持扩展类型 (#13501)
- ARROW-16719 - [Python] 为 parquet.read_metadata 添加路径/URI + 文件系统处理 (#13629)
- ARROW-16740 - [C++] 移除 IR 消费者 (#13301)
- ARROW-16855 - [C++] 添加 Read Relation ToProto (#13401)
- ARROW-16870 - [C++] 修复 flight 示例中 ldd 和 clang 的链接问题 (#14077)
- ARROW-16879 - [R][CI] 使用 testbench 测试 R GCS 绑定 (#13542)
- ARROW-16894 - [C++] 为 Asof Join 节点添加基准测试 (#13426)
- ARROW-16949 - [文档] 将词汇表添加到新的贡献者指南中 (#13951)
- ARROW-16981 - [C++] 暴露 jemalloc 统计信息以用于日志记录 (#13516)
- ARROW-16988 - [C++] 引入 Substrait ToProto/FromProto 转换选项 (#13537)
- ARROW-17004 - [Java] 添加将 Arrow 数据绑定到 JDBC 参数的工具 (#13589)
- ARROW-17016 - [C++][Python] 将 Arrow Python C++ 测试移动到 Cython (#14117)
- ARROW-17017 - [C++][Python] 启用 Arrow Python 的自动重新构建
- ARROW-17021 - [C++][R][CI] 在 crossbow 中启用 sccache (#13556)
- ARROW-17052 - [C++][Python][FlightRPC] 暴露 flight 结构序列化 (#13986)
- ARROW-17079 - 显示未知 S3 错误的 HTTP 状态码 (#14019)
- ARROW-17079 - [C++] 为 S3 错误引发适当的错误消息而不是错误代码 (#14001)
- ARROW-17079 - [C++] 改进 AWS S3 调用的错误消息 (#13979)
- ARROW-17081 - [Java][数据集] 将 JNI 构建配置从 cpp/ 移动到 java/ (#13911)
- ARROW-17088 - [R] 使用 `.arrow` 作为数据集 IPC 文件的扩展名 (#13690)
- ARROW-17089 - [Python] 使用 `.arrow` 作为 IPC 文件数据集的扩展名 (#13677)
- ARROW-17092 - [文档] 在 IPC 文件格式文档中添加关于 "Feather" 的说明 (#13693)
- ARROW-17106 - [Python] 将初始化代码移动到核心并仅暴露 API (#13802)
- ARROW-17113 - [Java] 在静态初始化块中明确地失败 (#13678)
- ARROW-17122 - [Python] 将 Python 相关代码移动到 pyarrow 后进行清理
- ARROW-17131 - [Python] 添加 StructType().field():通过名称或索引返回字段 (#13652)
- ARROW-17154 - [C++] 将 cmake 项目名称从 arrow_python 更改为 pyarrow_cpp
- ARROW-17160 - [C++] 为 PyArrow CPP 头文件创建一个基础目录 (#14275)
- ARROW-17172 - [C++][Python] test_cython_api 在 windows 上失败 (#14133)
- ARROW-17175 - [CI][macOS] macos-10.15 已弃用,macos-latest 是 macos-11 (#13684)
- ARROW-17178 - [R] 在带有用户定义函数的 arrow_dplyr_query 中支持 head() (#13706)
- ARROW-17181 - [文档][Python] 标量 UDF 实验性文档 (#13687)
- ARROW-17205 - [开发][发布] 合并脚本应在创建维护分支时提示下一个版本 (#13708)
- ARROW-17214 - [C++] 为基于列表的类型添加标量转换为字符串类型的功能 (#13737)
- ARROW-17219 - [Go][IPC] 非原生字节序的字节序转换 (#13716)
- ARROW-17222 - [文档][Archery][集成] 记录 archery 覆盖的当前集成测试用例 (#13717)
- ARROW-17240 - [CI][发布] 在 nightly CI 中验证 wheels (#14319)
- ARROW-17243 - [网站] 将 ClickHouse 添加到 "powered by" 列表
- ARROW-17247 - [C++][文档] 在 Acero 文档中包含 ExecPlan API 的可见性 (#13741)
- ARROW-17252 - [R] 间歇性 valgrind 失败 (#13773)
- ARROW-17266 - [文档] Java nightly 文件前缀已更改 (#13755)
- ARROW-17269 - [Java] 在 MapVector 中实现了 TransferPair 方法,以获取正确的 valuevector 作为 mapvector 而非 listvector (#13776)
- ARROW-17270 - [文档] 将 nightly 包说明移动到开发者文档 (#13766)
- ARROW-17273 - [Go][CSV] 为 csv.Writer 添加时间戳、Date32、Date64 格式支持 (#13772)
- ARROW-17274 - [GO] 从 parquet.file.RowGroupReader.Column(index int) 中移除 panic (#13767)
- ARROW-17275 - [Go][集成] 在 IPC 读/写中处理大偏移量类型 (#13770)
- ARROW-17276 - [Go][集成] 实现联合类型的 IPC 处理 (#13806)
- ARROW-17277 - [Go][CSV] 自定义 csv.Writer 用于布尔值的格式化程序 (#13774)
- ARROW-17280 - [C++] 将 vendored 的 flatbuffers 移动到私有命名空间 (#13775)
- ARROW-17282 - [Python] flake8 更新导致 linter CI 失败 (#13778)
- ARROW-17287 - [C++] 创建不依赖于合并生成器的扫描节点 (#13782)
- ARROW-17289 - [C++] 添加类型类别成员检查 (#13783)
- ARROW-17293 - [Java][CI] 裁剪 java nightly 构建 (#13839)
- ARROW-17297 - [Java][文档] 添加通过 C 数据接口实现 C++ 与 Java 交互的文档 (#13788)
- ARROW-17299 - [C++][Python] 暴露 Scanner 的 kDefaultBatchReadahead 和 kDefaultFragmentReadahead 参数 (#13799)
- ARROW-17303 - [Java][数据集] 通过 NativeDatasetFactory 读取 Arrow IPC 文件 (#13760) (#13811)
- ARROW-17304 - [C++][计算] 在聚合测试中,当比较失败时打印实际值 (#13814)
- ARROW-17305 - [C++] 避免在 BitmapAnd 基准测试中花费时间在 popcount 上 (#13794)
- ARROW-17306 - [C++] 为 `LocalFileSystem` 提供一个优化的 `GetFileInfoGenerator` 特化 (#13796)
-
ARROW-17310 - [C++] 从 Iterator 暴露 RBR:Make()
(#13798) - ARROW-17317 - [发布][文档] 规范化先前的文档版本目录 (#14457)
- ARROW-17318 - [C++][数据集] 在数据集中支持异步流式接口获取片段 (#13804)
- ARROW-17320 - [Python] 优化 pyarrow.parquet API 的暴露 (#14096)
- ARROW-17321 - [JS] 更新依赖 (#13758)
- ARROW-17322 - [文档] 记录错误和功能请求的问题生命周期 (#13781)
- ARROW-17323 - [Go] 清理和升级依赖 (#13807)
- ARROW-17324 - [Go][CI] 添加 go1.18 作业和 -asan 标志 (#13867)
- ARROW-17326 - [Go][FlightSQL] 为 Go 添加 FlightSQL 支持 (#13828)
- ARROW-17340 - [Go] 使用 `T.TempDir` 创建临时测试目录 (#13816)
- ARROW-17348 - [C++] 添加对使用 Visual C++ 2019 或更高版本构建捆绑的 LZ4 的支持 (#13817)
- ARROW-17349 - [C++] 允许转换 map 类型 (#14198)
- ARROW-17355 - [R] 重构 handle_* 工具函数以获得更好的开发体验 (#14030)
- ARROW-17357 - [CI][Conan] 启用 JSON (#13823)
- ARROW-17358 - [CI][C++] 为 Alpine Linux 添加一个作业 (#13825)
- ARROW-17359 - [Go][FlightSQL] 使用内存中的 SQLite 创建示例并用于测试 FlightSQL 服务器 (#13868)
- ARROW-17362 - [R] 在 summarise() 中实现 dplyr::across() (#14042)
- ARROW-17364 - [R] 在 across() 中实现 .names 参数
- ARROW-17366 - [R] 在 across() 的 .fns 参数中支持 purrr 风格的 lambda 函数 (#14327)
- ARROW-17367 - [C++] 修复 LZ4 的 CMake 目标名称 (#13831)
- ARROW-17368 - [C++] 添加对安装实用程序的支持 (#13832)
- ARROW-17370 - [C++] 为 SplitString() 添加限制 (#13833)
- ARROW-17371 - [R] 移除 as.factor 到 dictionary_encode 的映射
- ARROW-17377 - [C++][文档] 添加了关于基本 Arrow、文件访问、计算和数据集的教程 (#13859)
- ARROW-17385 - [集成] 重新启用 Rust 集成案例 (#13852) (#13858)
- ARROW-17385 - [集成] 还原“重新启用 Rust 集成案例” (#13856)
- ARROW-17387 - [R] 在 filter() 中实现 dplyr::across() (#14281)
- ARROW-17390 - [Go] 添加联合标量类型 (#13860)
- ARROW-17394 - [C++][Parquet] 修复 parquet_static 依赖 (#13863)
- ARROW-17395 - [CI][Conan] 找不到 grpc-proto/cci.20220627 包 (#13864)
- ARROW-17405 - [文档][Java] C 数据接口库能够使用 mvn 命令编译 (#13881)
- ARROW-17407 - [文档][FlightRPC] Flight/gRPC 最佳实践 (#13873)
- ARROW-17409 - [打包][RPM][GLib] *-glib-libs 应该包含 .typelib,*-glib-devel 应该包含 .gir (#13876)
- ARROW-17412 - [C++] AsofJoin 多键和多类型 (#13880)
- ARROW-17418 - [文档][Java] 数据集库能够使用 mvn 命令编译 (#13889)
- ARROW-17420 - [C++][FlightRPC] 修复 Flight SQL 集成测试中的模式验证 (#13897)
- ARROW-17427 - [Java] 添加可生成 DLL 的 Windows 构建脚本 (#14203)
- ARROW-17430 - [Java] ListBinder 用于将 Arrow List 类型绑定到数据库列 (#13906)
- ARROW-17431 - [Java] MapBinder 用于将 Arrow Map 类型绑定到数据库列 (#13941)
- ARROW-17434 - [Java][CI] 为 Java 添加 Windows 构建支持 (#13918)
- ARROW-17435 - [CI][Python][CUDA] 为 CUDA 互操作测试安装 Numba (#13899)
- ARROW-17436 - [C++] RELEASE 构建使用 -O2 而不是 -O3 (#13661)
- ARROW-17439 - [R] 将 pull 的行为更改为计算而不是收集 (#14330)
- ARROW-17449 - [Python] 为 Buffer、MemoryPool、NativeFile 和 Codec 提供更好的 repr (#13921)
- ARROW-17451 - [CI][Java] 为 JNI 使用 manylinux2014 镜像 (#13920)
- ARROW-17455 - [Go] 函数和内核执行架构 (#13964)
- ARROW-17456 - [Go] 将计算模块标记为独立的子模块 (#13910)
- ARROW-17460 - [R] 如果我注册的新 UDF 与现有的相同,则不发出警告 (#14436)
- ARROW-17463 - [R] 避免不必要的投影 (#13954)
- ARROW-17470 - [CI][GLib] 添加更多系统包以同步上游 PKGBUILD (#13917)
- ARROW-17475 - [Go] 函数接口和注册表实现 (#13924)
- ARROW-17476 - [发布][打包] 使二进制上传器可从 datafusion-c 重用 (#13923)
- ARROW-17479 - [Go] 添加 ArraySpan 和实用工具 (#13929)
- ARROW-17480 - [Java] 将 setNull() 添加到 FieldVector 接口 (#14244)
- ARROW-17482 - [Go] 移除 ValueDescr 类型 (#13930)
- ARROW-17483 - [Python] 在非旧版 ParquetDataset/read_table 中支持表达式过滤器 (#14011)
- ARROW-17485 - [R] 允许 TRUE/FALSE 作为 `write_feather` (`write_ipc_file`) 的压缩选项 (#13935)
- ARROW-17488 - [Python] 添加对 RelWithDebInfo 的支持
- ARROW-17489 - [R] Nightly 构建因测试引用未发布的 stringr 函数而失败 (#13937)
- ARROW-17492 - [C++] 对大变长二进制类型的 Hashing32/64 支持 (#13940)
- ARROW-17499 - [Go] 将 MakeArrayOfNull 移至 array 包 (#13944)
- ARROW-17500 - [Go] Kernel 和 KernelContext 接口 (#13946)
- ARROW-17510 - [CI][C++][Windows][MSVC] 使用 ccache (#13957)
- ARROW-17511 - [C++] 添加对 xsimd 9.0.0 的支持 (#13958)
- ARROW-17512 - [文档] 更新 crossbow 文档以提高清晰度 (#13993)
- ARROW-17519 - [R] RTools35 作业失败 (#14035)
- ARROW-17521 - [Python] 为 Substrait 消费者添加 NamedTableProvider 的 python 绑定 (#14024)
- ARROW-17523 - [C++] 添加对 substrait 函数 is_null、is_not_null 和 count 的支持 (#13969)
- ARROW-17525 - [Java] 使用 NativeDatasetFactory 读取 ORC 文件 (#13973)
- ARROW-17527 - [Go] 实现转换为布尔值的函数 (#13974)
- ARROW-17532 - [Go][计算] 实现数字转换函数 (#13992)
- ARROW-17536 - [打包][RPM][Gandiva] 修复在 CentOS Stream 9 上的构建错误 (#13984)
- ARROW-17545 - [C++][CI] 强制使用 C++17 而不是 C++11 (#13991)
- ARROW-17546 - [C++] 移除 C++17 之前的兼容性措施
- ARROW-17551 - [Go] 实现时间转换函数 (#14006)
- ARROW-17553 - [Go] 允许 flight.Server 注册额外的 grpc 服务 (#13995)
- ARROW-17554 - [Python][打包] 停止生产 macOS Mavericks wheels (#13996)
- ARROW-17555 - [开发][CI] 未使用 "ci/scripts/install_osx_sdk.sh"
- ARROW-17560 - [Java][Gandiva] 将 JNI 构建配置从 cpp/ 移动到 java/ (#14159)
- ARROW-17561 - [Java][ORC] 将 JNI 构建配置从 cpp/ 移动到 java/ (#14162)
- ARROW-17569 - [C++] 将 xsimd 版本升级到 9.0.1 (#14005)
- ARROW-17575 - [文档][C++] 更新构建文档以遵循新的 CMake 包 (#14097)
- ARROW-17585 - [Java] 更新 GenerateSampleData.java (#14289)
- ARROW-17586 - [Go] 字符串到数字的转换函数 (#14015)
- ARROW-17587 - [Go] 从扩展类型转换 (#14016)
- ARROW-17588 - [Go] 转换为类二进制类型 (#14027)
- ARROW-17594 - [R][打包] 在 CentOS 7 上使用 devtoolset 8 构建二进制文件 (#14243)
- ARROW-17600 - [Go] 实现嵌套类型的转换 (#14056)
- ARROW-17603 - [C++][FlightRPC] 在开启 REQUIRE_TLSCREDENTIALSOPTIONS 时详细报告失败信息 (#14034)
- ARROW-17604 - [文档][Java] 使 --add-opens 是必需的这一要求更加明显 (#14066)
- ARROW-17617 - [文档] 从 Flight 中移除实验性限定词 (#14055)
- ARROW-17621 - [CI] 审查工作流 (#14155)
- ARROW-17628 - [CI][打包][Java] 发布带有 SNAPSHOT 版本的最新 nightly (#14135)
- ARROW-17629 - [Java] 在 JdbcToArrowUtils 中将数据库列绑定到 Arrow Map 类型 (#14134)
- ARROW-17630 - [Java] 在 JdbcToArrowTypeConverter 中引入列索引作为 JdbcFieldInfo.column
- ARROW-17631 - [Java] 将表/列注释传播到 Arrow Schema 中 (#14081)
- ARROW-17632 - [Python][C++] 在构建期间添加有关 libarrow 查找位置的详细信息 (#14059)
- ARROW-17638 - [Go] 扩展 C 数据 API 对联合数组和 RecordReader 接口的支持 (#14057)
- ARROW-17646 - [Go][CI] C 数据切换为使用 cgo.Handle (升级到 Go1.17) (#14067)
- ARROW-17647 - [C++] 在使用 Substrait 的 protobuf 时使用更好的命名空间风格 (#14121)
- ARROW-17649 - [Python] 从 <= 1.0.0 版本中移除剩余的已弃用 API (#14401)
- ARROW-17659 - [Java] 当提供了 config.shouldIncludeMetadata 时,填充 JDBC 模式名称元数据 (#14196)
- ARROW-17665 - [R] 记录 dplyr 和计算功能 (#14387)
- ARROW-17666 - [R] 记录 dplyr 动词支持的例外情况
- ARROW-17667 - [R] 记录函数绑定支持的例外情况
- ARROW-17669 - [Go] 获取记录批次、表和分块数组的函数内核 (#14214)
- ARROW-17670 - [Go] 实现原生和固定大小类型的过滤函数 (#14088)
- ARROW-17671 - [Go] 用于二进制/字符串的过滤内核 (#14098)
- ARROW-17673 - [R] `dplyr::arrange` 中的 `desc` 应允许 `dplyr::` 前缀 (#14090)
- ARROW-17674 - [R] 在 arrange() 中实现 dplyr::across() (#14092)
- ARROW-17677 - [Go] 列表和扩展类型的过滤函数 (#14141)
- ARROW-17678 - [Go] 记录批次和表的过滤内核 (#14156)
- ARROW-17688 - [C++][Java][FlightRPC] 为 Flight SQL 实现 Substrait、事务、取消 (#13492)
- ARROW-17689 - [R] 在 group_by() 中实现 dplyr::across() (#14122)
- ARROW-17690 - [R] 在 distinct() 中实现 dplyr::across() (#14154)
- ARROW-17691 - [Go] 实现原生类型的 Take (#14101)
- ARROW-17693 - [C++] 移除 string_view 的向后兼容实现 (#14177)
- ARROW-17694 - [C++] 移除 std::optional 的向后兼容实现 (#14105)
- ARROW-17695 - [C++] 移除 Variant 类 (#14136)
- ARROW-17698 - [R] 实现 `where()` 在 `across()` 中的使用
- ARROW-17701 - [C++][Gandiva] 添加对非类型化节点的支持 (#14110)
- ARROW-17704 - [Java][FlightRPC] 更新到 Junit 5 (#14103)
- ARROW-17716 - [文档] 移除 IR 文档页面 (#14112)
- ARROW-17724 - [R] 在 dplyr::across 的 .fns 参数内允许包名前缀 (#14279)
- ARROW-17730 - [Go] 为 FSB 和 VarBinary 实现 Take 内核 (#14127)
- ARROW-17734 - [Go] 为列表和密集联合实现 Take (#14130)
- ARROW-17736 - [C++] 为 Substrait 生产者添加了后备名称解析机制。(#14143)
- ARROW-17741 - [打包] 在 java-jars 产物中包含 JDBC 驱动 (#14139)
- ARROW-17749 - [Go] 实现 Struct 的 Filter 和 Take (#14145)
-
ARROW-17764 - [CI][C++] 缺少 "#include
" (#14161) - ARROW-17767 - [Java][ORC] 将 JNI 构建配置从 cpp/ 移动到 java/ (#14163)
- ARROW-17778 - [Go][CSV] 简单的 CSV 读取器模式和类型推断 (#14171)
- ARROW-17782 - [C++][R] R 包在 macos 10.13 上使用 C++17 标准库无法构建 (#14178)
- ARROW-17786 - [Java] 使用 org.apache.arrow.dataset.jni.NativeDatasetFactory 读取 CSV 文件 (#14182)
- ARROW-17788 - [R][文档] 添加使用 Scanner 的示例 (#14184)
- ARROW-17789 - [Java][文档] 使用最新更改更新 Java 数据集文档 (#14382)
- ARROW-17792 - [C++] 使用 lambda 捕获移动构造 (#14188)
- ARROW-17794 - [Java] 在 JVM 退出时强制删除 jni lib 文件 (#14189)
- ARROW-17803 - [C++][nodiscard] (#14193)
- ARROW-17804 - [Go][CSV] 添加 Date32 和 Time32 解析器 (#14192)
- ARROW-17810 - [Java] 使用 jacoco-maven-plugin 0.8.8 以支持 Java 18 (#14197)
- ARROW-17811 - [Java][文档] 在 Java 中添加了关于字典编码的高级文档 (#14213)
- ARROW-17814 - [C++] 修复样式 (#14218)
- ARROW-17814 - [C++] 移除 make_unique 的重新实现 (#14204)
- ARROW-17815 - [Python] 当 SetSignalStopSource 失败时发出警告,而不是报错 (#14205)
- ARROW-17817 - [C++] 如果 ORC 被激活,允许在 MSVC 上编译 (#14208)
- ARROW-17823 - [C++] 还原对 CUDA 的 std::make_shared 更改 (#14233)
- ARROW-17823 - [C++] 优先使用 std::make_shared/std::make_unique,而不是带 new 的构造函数 (#14216)
- ARROW-17824 - [C++][Gandiva] 为可变长度输出缓冲区实现预分配 (#14230)
- ARROW-17826 - [Python] 在从计算内核创建表达式时允许标量 (#14360)
- ARROW-17834 - [Python] 允许通过 pa.array(..) 构造函数创建 ExtensionArray (#14253)
- ARROW-17840 - [Java] 禁用不稳定的 JaCoCo 覆盖率检查 (#14231)
- ARROW-17844 - [C++] 移除原子 shared_ptr 兼容性函数 (#14239)
- ARROW-17845 - [CI][Conan] 在 Conan CI 检查中重新启用 Flight (#14240)
- ARROW-17846 - [C++] 在 CSV 子系统中使用 `if constexpr` (#14241)
- ARROW-17847 - [C++] 在 JSON 解析器中支持未加引号的十进制数 (#14242)
- ARROW-17849 - [R][文档] 为 centos-7 用户记录由于 C++17 带来的变化 (#14440)
- ARROW-17854 - [CI][开发者] 在 S3 上托管预览文档 (#14247)
- ARROW-17856 - [CI][Archery] 添加新的 Archery 命令以删除 crossbow 仓库上的旧分支和标签 (#14248)
- ARROW-17857 - [C++] 修复 Table::CombineChunksToBatch 中的段错误 (#14249)
- ARROW-17860 - [Plasma] 弃用 Plasma
- ARROW-17861 - [C++] 弃用 Plasma (#14305)
- ARROW-17862 - [Plasma][GLib] 弃用 Plasma C GLib 绑定 (#14259)
- ARROW-17863 - [Python] 弃用 Plasma Python 绑定 (#14343)
- ARROW-17864 - [Plasma][Ruby] 弃用 Plasma Ruby 绑定 (#14258)
- ARROW-17865 - [Java] 弃用 Java Plasma JNI 绑定 (#14262)
- ARROW-17868 - [C++][Python] 恢复 ARROW_PYTHON CMake 选项 (#14273)
- ARROW-17872 - [C++][CI] 减少 macOS CI 依赖 (#14310)
- ARROW-17875 - [C++] 移除各种 C++17 之前的兼容性措施 (#14263)
- ARROW-17878 - [网站] 从删除列表中排除 Ballista 文档
- ARROW-17880 - [Go] 为 CSV 写入器添加对 Decimal128 和 Decimal256 的支持 (#14278)
- ARROW-17882 - [Java][文档] 为 Windows 用户添加生成 JNI DLL 的构建步骤 (#14379)
- ARROW-17883 - [Java] 实现不可变表 (#14316)
- ARROW-17888 - [文档] 将 cookbook 贡献页面的引用添加到新的贡献者指南 (#14283)
- ARROW-17889 - [CI] 移除 Kartothek 集成测试 (#14274)
- ARROW-17891 - [文档][Python] 更新并同步 developers/python 页面的 Win 部分 (#14350)
- ARROW-17903 - [JS] 更新依赖 (#14285)
- ARROW-17911 - [R] 在 `transmute()` 中实现 `across()` (#14290)
- ARROW-17924 - [文档][格式] 在 C 数据接口中澄清不可变性假设 (#14304)
- ARROW-17929 - [C#] 改进 NuGet 包。(#14312)
- ARROW-17934 - [R] 在数据集测试中使用 tempfile 而不是工作目录 (#14315)
- ARROW-17936 - [R] ExecPlanReader 测试因崩溃而中止
- ARROW-17939 - [文档][Python] 在 PyArrow C++ 测试更改后更新 python 开发者页面 (#14322)
- ARROW-17940 - [Java][Gandiva] 为 JavaBuffer 实现 Reserve (#14323)
- ARROW-17942 - [网站] 一些链接可以从 http 更改为 https
- ARROW-17944 - [Python] substrait.run_query 接受 bytes/Buffer 并且不会段错误 (#14331)
- ARROW-17945 - [网站][发布] 对 search.maven.org 使用 https:// (#14329)
- ARROW-17950 - [文档][Python] 添加更多关于 PyArrow C++ API 变化的信息 (#14333)
- ARROW-17952 - [Archery][CI] 修复运行 ubuntu-cuda-cpp 时的 archery 错误 (#14335)
- ARROW-17954 - [R] 更新 10.0 的新闻 (#14337)
- ARROW-17955 - [文档][Java] Table 的教程文档 (#14344)
- ARROW-17962 - [Java] 从 try-with-resources 中移除未使用的模式创建 (#14346)
- ARROW-17965 - [C++] ExecBatch 对 ChunkedArray 值的支持 (#14348)
- ARROW-17969 - [CI][C++] 不要在 Ubuntu 18.04 上使用 LLVM 14 或更高版本 (#14356)
- ARROW-17971 - [格式][文档] 添加 ADBC (#14079)
- ARROW-17972 - [CI] 更新 CUDA docker 作业
- ARROW-17976 - [C++] 在 arrow/compare.cc 中使用通用 lambda (#14363)
- ARROW-17982 - [C++][Java] 更新 ORC 至 1.8.0 (#14367)
- ARROW-17988 - [C++] 移除 index_sequence_for 和 aligned_union 的向后兼容实现 (#14372)
- ARROW-17992 - [CI][C++][Conda] 移除不必要的 clangdev/llvmdev 固定版本 (#14376)
- ARROW-17993 - [CI][发布] 为 verify-rc-source-*-conda-* 使用 Node.js 16 LTS (#14377)
- ARROW-17997 - [Ruby] 添加支持从原始嵌套 Ruby 数组构建 Arrow::Tensor (#14381)
- ARROW-18010 - [Go] 为类型转换添加 ARM64 Neon 实现 (#14388)
- ARROW-18017 - [Go] 简化计算模块依赖并发布 (#14391)
- ARROW-18019 - [C++][Gandiva] 提高 Projector 评估性能 (#14394)
- ARROW-18026 - [C++][Gandiva] 为无符号整数添加 div 和 mod 函数 (#14397)
- ARROW-18027 - [开发][Archery][Crossbow] 重用 GitHub Token (#14398)
- ARROW-18028 - [开发][Archery][Crossbow] 在 PR 评论中始终使用 GitHub Action 的运行页面 URL (#14399)
- ARROW-18030 - [C++] 升级 LZ4 版本 (#14405)
- ARROW-18044 - [Java] 将 error-prone 库版本升级到 2.16 (#14423)
- ARROW-18047 - [开发][Archery][Crossbow] Queue.put() 应使用 Job.queue 设置器 (#14410)
- ARROW-18048 - [开发][Archery][Crossbow] 评论机器人在生成报告前等待一段时间 (#14412)
- ARROW-18053 - [开发] 修复 merge_arrow_pr.py 无法检测 Co-authored-by: 的错误 (#14416)
- ARROW-18056 - [Ruby] 添加支持从 {name: Arrow::Tensor} 构建 Arrow::Table (#14417)
- ARROW-18057 - [R] slice 函数的测试在没有 Datasets 功能的构建上失败 (#14418)
- ARROW-18058 - [开发][Archery] 移除已删除的 ARROW_JNI 相关代码 (#14419)
- ARROW-18061 - [CI][R] 减少每次提交的作业数量 (#14420)
- ARROW-18069 - [文档] 建议最初使用 force with lease (#14430)
- ARROW-18072 - [C++] 无法在 CMake 3.10 上使用捆绑的 ORC (#14432)
- ARROW-18074 - [CI] 不再需要为 PyArrow C++ 运行 ctest (#14435)
- ARROW-18083 - [C++] 升级 vendored zlib 版本 (#14446)
- PARQUET-2172 - [C++] 将字段返回类型更改为 const NodePtr& (#13865)
Bug 修复
- ARROW-12175 - [C++] 修复 CMake 包 (#13892)
- ARROW-13763 - [Python] 在 ParquetFile 和 ParquetDatasetPiece 中关闭文件 (#13821)
- ARROW-14363 - [C++][Gandiva] LLVM 13 已弃用未明确指定元素类型的 CreateGEP 和 CreateLoad 方法
- ARROW-15602 - [R][文档] 更新文档以解释如何读取带时区的时间戳列 (#13877)
- ARROW-15733 - array.String offsets int32 溢出
- ARROW-16141 - [R] 为上游更改更新 rhub/fedora-clang-devel (#12824)
- ARROW-16174 - [Python] 修复切片输入上的 FixedSizeListArray.flatten() (#14000)
- ARROW-16521 - [C++][Python] 为 S3 配置 curl 超时策略 (#13385)
- ARROW-16651 - [Python] 将 Table 转换为新模式时忽略字段的可空性 (#14048)
- ARROW-16652 - [Python] 当使用 Table 调用时,Cast 计算内核会段错误 (#14044)
- ARROW-16674 - [Java] C 数据接口:从导入的缓冲区读取为 nioBuffer 导致错误 (#13249)
- ARROW-16754 - [Java] StructVector 的子向量在添加重复字段后意外重新排序 (#13321)
- ARROW-16838 - [Python] 改进对带有扩展 dtypes 的 pandas 索引的模式推断 (#14080)
- ARROW-16897 - [R][C++] 对 Arrow 对象的完全连接不正确
- ARROW-16942 - 在 MacOS 上构建 JNI 库时出错:找不到 "xsimd" 提供的包配置文件
- ARROW-16993 - [C++] 如果不需要,则不查找 Boost 组件 (#13846)
- ARROW-17057 - [Python] S3FileSystem 没有用于重试策略的参数 (#13633)
- ARROW-17069 - [文档][Python] 描述 GCS 公共和私有存储的身份验证 (#14392)
- ARROW-17084 - [R] 在 linting 之前安装包 (#13620)
- ARROW-17099 - [Python] pyarrow 构建不支持 RELWITHDEBINFO 构建类型 (#14324)
- ARROW-17104 - [CI][Python] 在 CI 作业 AMD64 MacOS 10.15 Python 3 上无法导入 Pyarrow
- ARROW-17166 - [R][CI] force_tests() 无法返回 TRUE (#13680)
- ARROW-17169 - [Go][Parquet] 在位图写入器中使用可空 Struct 列表时出现 Panic (#14183)
- ARROW-17193 - [C++] 添加对查找系统 Abseil 的支持 (#13731)
- ARROW-17199 - [Java][FlightRPC] 清理 Flight SQL 示例服务器 (#13710)
- ARROW-17217 - [文档][Python] 将 pandas 添加为必需的依赖项 (#13714)
- ARROW-17223 - [C#] DecimalArray 不正确地附加大于 Decimal.MaxValue / 2 且小于 Decimal.MinValue / 2 的值 (#13732)
- ARROW-17228 - [Python] 当传递带有投影列的扫描器时,dataset.write_data 应使用 Scanner.projected_schema (#13756)
- ARROW-17230 - [C++] 修复 DeserializePlan,添加额外的选项验证 (#13728)
- ARROW-17233 - [打包][Linux] 更新产物模式 (#13740)
- ARROW-17248 - [CI][Conan] 启用 Zstandard (#13742)
- ARROW-17249 - [CI][Conan] 启用 bzip2 (#13743)
- ARROW-17250 - [CI][Conan] 自动启用 utf8proc (#13744)
- ARROW-17251 - [CI][Conan] 启用 Flight (#13761)
- ARROW-17253 - [Python] 检测迭代器异常而不是崩溃 (#13764)
- ARROW-17254 - [C++][Go][Java][FlightRPC] 实现并测试 Flight SQL GetSchema (#13898)
- ARROW-17256 - [Python] 无法在空的 ChunkedArray 上调用 combine_chunks (#13757)
- ARROW-17272 - [开发] 在集成测试中传递 --add-opens (#13765)
- ARROW-17281 - [C++] 修复 Windows 上的缓存大小报告 (#13813)
- ARROW-17296 - [Python] 更新 pyarrow.parquet.read_metadata doctest 中的序列化元数据大小 (#13790)
- ARROW-17315 - [发布][文档] 在版本升级后更新 versions.json (#13805)
- ARROW-17338 - [Java] BaseVariableWidthVector 的最大请求内存应限制为 Integer.MAX_VALUE (#13815)
- ARROW-17341 - [C++] 修复 musl libc 上的 cpu_info.cc 构建错误 (#13819)
- ARROW-17350 - [C++] 创建一个用于异步工作的调度器 (#13912)
- ARROW-17353 - [发布][R] 验证二进制文件版本 (#14396)
- ARROW-17372 - [Go][Parquet] 修复 ppc64le 上的故障 (#13840)
- ARROW-17382 - [C++] open_dataset 在带引号的标题时不会忽略 csv 文件中的 BOM (#13838)
- ARROW-17386 - [R] strptime 测试在不同平台上不够健壮 (#13854)
- ARROW-17389 - [Python] 在 PYARROW_INSTALL_TESTS=0 时正确排除测试 (#13904)
- ARROW-17410 - [JS][集成] 为集成降级 zlib (#13885)
- ARROW-17421 - [C++] Windows 上的 CUDA 构建失败 (#13883)
- ARROW-17422 - [C++][CI] Linux 构建缺少依赖 (#13886)
- ARROW-17423 - [CI][C++] 修复 CUDA docker 镜像的构建 (#13896)
- ARROW-17426 - [C++] Substrait 消费者在旧版 Ubuntu 上编译失败 (#13888)
- ARROW-17433 - [CI][C++] 在 AppVeyor 上使用 Visual Studio 2019 (#13903)
- ARROW-17438 - [R] 如果存在 UDF,glimpse() 会报错
- ARROW-17440 - [C++] 支持 RISC-V 架构 (#13902)
- ARROW-17448 - [R] 修复一些文档中的云存储路径 (#14070)
- ARROW-17450 - [C++][Parquet] 除 bool 数组外,增加对 uint8 布尔解码的支持 (#14359)
- ARROW-17450 - [C++][Parquet] 支持布尔数据类型的 RLE 解码 (#14147)
- ARROW-17453 - [Go][C++][Parquet] 数据与重复级别不一致 (#13982)
- ARROW-17467 - [Go] 对齐的位图操作在没有 t… 的情况下会弄乱最后一个字节 (#13915)
- ARROW-17478 - [C++][Java] 更新 ORC 至 1.7.6 (#13926)
- ARROW-17494 - [C++] 修复静态构建上 substrait 测试的链接问题 (#13939)
- ARROW-17496 - [Go] 修复 Nightly 构建 (#13943)
- ARROW-17501 - [Python][wheel] 使用旧版 AWS SDK C++ (#14157)
- ARROW-17507 - [开发][CI][R] GHA "autotune" 不起作用 (#14060)
- ARROW-17517 - [C++] 在公共 API 测试中测试引擎 API (#13965)
- ARROW-17517 - [C++] 从 substrait API 中移除内部头文件 (#14131)
- ARROW-17518 - [CI][文档][Python] 更新 glob 以从 git 检测 arrow 开发版本 (#13966)
- ARROW-17524 - [C++] 修正读取 ORC 表时包含的字段 (#13962)
- ARROW-17543 - [R] 修复创建数组时 NULL 类型 0 长度向量的错误
- ARROW-17550 - [C++][CI][MinGW] 为 GCS testbench 使用系统 Python (#14272)
- ARROW-17556 - [C++] 未绑定的扫描投影表达式导致所有字段被加载 (#14264)
- ARROW-17559 - [R][C++] 回归:移除模式绑定后性能大幅下降
- ARROW-17565 - [C++] 未提供向后兼容的 ${PACKAGE}_shared CMake 目标 (#14003)
- ARROW-17567 - [C++] 避免 gcc 7 和 c++17 的内部编译器错误 (#14004)
- ARROW-17571 - [基准测试] PyArrow 的默认构建似乎是 debug (#14010)
- ARROW-17573 - [Go][Parquet] ByteArray 统计信息可能导致内存泄漏 (#14013)
- ARROW-17577 - [C++][Python] 构建 PyArrow 时 CMake 找不到 Arrow/Arrow Python
- ARROW-17578 - [CI][R] 修复在 Ubuntu 22.04 和 GCC 12 上 R 的构建 (#14022)
- ARROW-17579 - [Python] PYARROW_CXXFLAGS 被忽略?(#14074)
- ARROW-17583 - [C++][Python] 将 WrittenFile.size 的数据宽度更改为 int64 以匹配 C++ 代码 (#14032)
- ARROW-17598 - [C++] 如果 SIMD 级别是 NEON,则跳过 memory_benchmark (#14036)
- ARROW-17611 - [Rust] 使用 V2 保存的 arrow-rs 布尔列数据无法被 pyarrow 读取
- ARROW-17612 - [基准测试] 在 macos-arm 上基准测试失败
- ARROW-17614 - [CI][Python] test_write_dataset_max_rows_per_file 测试导致多个 nightly 构建失败 (#14199)
- ARROW-17616 - [CI][Java] 解决正则表达式以支持最新的 Arrow Java 版本 >= 10.0.0 (#14076)
- ARROW-17620 - [R] as_arrow_array() 忽略 StructArrays 的类型 (#14047)
- ARROW-17627 - [Go][Parquet] 在没有 StoreSchema 的情况下将模式元数据转发到文件 (#14087)
- ARROW-17639 - [R] 当第一个元素为 NULL 时,infer_type() 对列表失败 (#14062)
- ARROW-17641 - [python] 修复 ParseOptions 对 invalid_row_handler 的反序列化问题 (#14061)
- ARROW-17643 - [R] 最新的 duckdb 版本导致测试失败 (#14149)
- ARROW-17645 - [CI] 让 conda-integration 再次构建成功 (#14069)
- ARROW-17675 - [C++] 修改了 FileSource::Equals 方法以处理 buffer_ 为 null 的情况 (#14085)
- ARROW-17681 - [CI][打包] 使用 glib 更新 brew 依赖 glib-utils (#14095)
- ARROW-17682 - [CI][C++] Nightly test-ubuntu-20.04-cpp-thread-sanitizer 在 AsyncTaskScheduler 附近失败 arrow-utility-test
- ARROW-17684 - [CI][deb] 为 arm64 禁用 Flight (#14300)
- ARROW-17686 - [C++] 为 AsofJoinBasicTest 添加自定义 ToPrint (#14172)
- ARROW-17687 - ScanningStress 测试在 CI 中不稳定 (#14314)
- ARROW-17696 - [C++] arrow-compute-asof-join-node-test 速度异常缓慢 (#14190)
- ARROW-17697 - [Python] 修复 types.pxi 中的 Cython 警告 (#14280)
- ARROW-17699 - [R] 为传递给 open_dataset() 的非模式对象添加更好的错误消息 (#14108)
- ARROW-17702 - [R][CI] CentOS 7 上测试失败
- ARROW-17703 - [C++][Gandiva] 修复 Gandiva OpenSSL 依赖 (#14109)
- ARROW-17717 - [R] CI 上的 Lintr 错误 (#14113)
- ARROW-17725 - [CI][Python] 修复在没有 parquet 的 Arrow 构建情况下测试的收集问题 (#14119)
- ARROW-17728 - [C++][Gandiva] 接受 LLVM 15.0 (#14125)
- ARROW-17733 - [C++] 在填充索引缓冲区中的空值时考虑 index_width (#14129)
- ARROW-17737 - [R] 转换为 Table 之前的分组在 `collect()` 之后不能被恢复 (#14175)
- ARROW-17738 - [R] dplyr::compute 应将分组的 arrow_dplyr_query 转换为 arrow Table (#14160)
- ARROW-17742 - [C++][Gandiva] 修复 CMake 预设中的 Gandiva utf8proc 依赖 (#14140)
- ARROW-17753 - [Python][文档] 记录用于修复构建环境问题的清理操作 (#14260)
- ARROW-17770 - [C++][Gandiva] 修复 Gandiva projector Evaluate 的 const 正确性 (#14165)
- ARROW-17771 - [文档][Python] 将 CONDA_DLL_SEARCH_MODIFICATION_ENABLE 的使用添加到文档中 (#14302)
- ARROW-17773 - [CI][C++] 修复 Travis-CI Arm64 构建上的 sccache 错误 (#14201)
- ARROW-17785 - [Java] 抑制 JDBC 驱动测试中来自 gRPC 的不稳定性 (#14210)
- ARROW-17787 - [Java] 修复 Javadoc 构建 (#14212)
- ARROW-17790 - [C++][Gandiva] 适应 LLVM 不透明指针 (#14187)
- ARROW-17791 - [Python][CI] 一些 nightly 作业因对 S3 存储桶的 ACCESS_DENIED 而失败
- ARROW-17795 - [C++][R] 添加缺失的 PKG_CONFIG_PATH 以使用系统 zstd (#14202)
- ARROW-17800 - [C++] 修复 jemalloc 统计测试中的失败 (#14194)
- ARROW-17805 - [C++][CI] 为 MacOS 使用 Brew 安装的 clang
- ARROW-17813 - [Python] 嵌套 ExtensionArray 与 pandas/numpy 之间的转换 (#14238)
- ARROW-17818 - [R] 跳过失败的 duckdb 测试,直到问题解决 (#14209)
- ARROW-17822 - [C++][FlightRPC] 修复无效传输方案下的崩溃 (#14267)
- ARROW-17829 - [Python] 避免 pandas groupby 弃用警告 write_to_dataset (#14306)
- ARROW-17830 - [C++][Gandiva] 临时固定 AppVeyor 上的 LLVM 版本 (#14228)
- ARROW-17831 - [Python][文档] PyArrow 架构页面在移动 pyarrow C++ 代码后已过时 (#14311)
- ARROW-17842 - [C++][CI] 为 MacOS verify-rc 使用 Brew 安装的 clang (#14236)
- ARROW-17848 - [R] 跳过 lubridate::format_ISO8601 测试,直到下一个版本 (#14282)
- ARROW-17850 - [Java] 升级 netty + grpc + protobuf + jackson BOM 版本 (#14265)
- ARROW-17853 - [Python][CI] test_dataset.py::test_write_dataset_s3_put_only 超时 (#14257)
- ARROW-17853 - 临时还原对 test_write_dataset_max_rows_per_file 的修复 (#14246)
- ARROW-17885 - [R] 将 BLOB 数据作为原始列表返回,而不是整数列表 (#14277)
- ARROW-17915 - [C++] 使用 Substrait ProjectRel 时出错 (#14295)
- ARROW-17927 - [C++] 更改 SleepABitAsync 以使用线程池,从而减少正在运行的线程数 (#14339)
- ARROW-17930 - [CI][C++] PrintValuearrow::dataset::ScannerTestParams 中出现 Valgrind 故障 (#14317)
- ARROW-17931 - [C++][CI] CI 中数据集“new scanner”周围出现线程清理器故障
- ARROW-17938 - [Python] 修复 python_test.cc 的编译错误 (#14321)
- ARROW-17973 - [C++] 无参数函数调用的 Expression::ToString 错误 (#14370)
- ARROW-17977 - [CI][C++] 不要在 Debian i386 上使用 LLVM 14 或更高版本 (#14368)
- ARROW-17990 - [C++] 恢复 -mbmi2 标志 (#14375)
- ARROW-17995 - [C++] 修复 JSON 小数未根据显式 schema 进行重新调整的问题 (#14380)
- ARROW-17999 - [C++] 使 Minio 服务器启动更稳健 (#14383)
- ARROW-18004 - [C++] ExecBatch 转换为 RecordBatch 时可能越界 (#14386)
- ARROW-18018 - [C++] 单元测试中因使用 AllComplete 而非 AllFinished 导致的潜在分段错误 (#14393)
- ARROW-18031 - [C++][Parquet] 布尔 RLE 解码器中存在未定义行为 (#14407)
- ARROW-18041 - [Python] wheel 测试中与 Substrait 相关的测试失败 (#14408)
- ARROW-18055 - [C++] arrow-dataset-dataset-writer-test 仍偶尔超时 (#14428)
- ARROW-18062 - [R] R 3.5 和 3.6 的 CI 作业在安装 R 包时出错 (#14424)
- ARROW-18079 - [R] 提高 schema 创建效率以防止性能回归 (#14447)
- ARROW-18088 - [Python][CI] 使用 pandas master/nightly 构建时出现与 timedelta64 解析相关的故障
- ARROW-18103 - [Packaging][deb][RPM] 修复上传工件的模式 (#14462)