Apache Arrow 20.0.0 (2025年4月27日)
这是一个涵盖两个多月开发的主要版本。
下载
贡献者
本次发布包含来自 63 位不同贡献者的 327 次提交。
$ git shortlog -sn apache-arrow-19.0.1..apache-arrow-20.0.0
57 Sutou Kouhei
31 dependabot[bot]
26 Raúl Cumplido
24 Antoine Pitrou
19 Hiroyuki Sato
18 Bryce Mecum
18 Rossi Sun
15 William Ayd
12 Jacob Wujciak-Jens
9 takuya kodama
8 mwish
7 Alenka Frim
6 Gang Wu
5 Jonathan Keane
5 Joris Van den Bossche
4 Krisztián Szűcs
3 Arash Andishgar
3 Enrico Minack
3 mroz45
2 Adam Reeve
2 ChiLin Chiu
2 Christoph
2 Dewey Dunnington
2 Kevin Gurney
2 Matthew Roeschke
2 Neal Richardson
2 Nic Crane
2 eitsupi
2 lriggs
1 Adam Binford
1 Antony Peacock
1 Colin
1 Crystal Zhou
1 Curt Hagenlocher
1 Dan King
1 David Li
1 Gibby Free
1 Ian Cook
1 Jonas Dedden
1 Kent Yao
1 Lester Fan
1 Lysandros Nikolaou
1 Makito
1 Matt Topol
1 Mike
1 Mike Barry
1 Nick Crews
1 Nuno Veloso
1 Nuo Xu
1 Parth Chonkar
1 Paul Taylor
1 Piong1997
1 Rob Van Mieghem
1 Robert Cao
1 Sarah Gilmore
1 Shawn
1 Tien Nguyen
1 Xuchen Pan
1 Yunpei Zhou
1 anubhav
1 gitmodimo
1 ivin
1 panbingkun
补丁提交者
以下 Apache 提交者将贡献的补丁合并到仓库中。
$ git shortlog -sn --group=trailer:signed-off-by apache-arrow-19.0.1..apache-arrow-20.0.0
118 Sutou Kouhei
50 Antoine Pitrou
34 Raúl Cumplido
22 Rossi Sun
20 Curt Hagenlocher
16 Jacob Wujciak-Jens
12 Bryce Mecum
9 mwish
8 AlenkaF
7 Gang Wu
2 Dewey Dunnington
2 Jonathan Keane
2 Kevin Gurney
2 Krisztian Szucs
2 Nic Crane
2 Will Ayd
1 Joris Van den Bossche
1 Sarah Gilmore
1 dependabot[bot]
更新日志
Bug 修复
- GH-30302 - [C++][Parquet] 在往返 Parquet 格式时保留整型字典索引的位宽 (#45685)
- GH-31992 - [C++][Parquet] 处理 DataPageV2 值缓冲区为空的特殊情况 (#45252)
- GH-36628 - [Python][Parquet] 在实例化内部 Parquet 元数据类时应失败 (#45549)
- GH-37630 - [C++][Python][Dataset] 允许禁用分片元数据缓存 (#45330)
- GH-39023 - [C++][CMake] 为 ExternalPackage 添加缺失的启动器路径转换 (#45349)
- GH-41166 - [CI][Packaging] 移除未维护的 conda-recipes (#45944)
- GH-43057 - [C++] 线程安全的 AesEncryptor / AesDecryptor (#44990)
- GH-44188 - [Python] 修复使用字节类型列名的 pandas 往返转换 (#44171)
- GH-44363 - [C#] 处理无批次的 Flight 数据 (#45315)
- GH-45048 - [C++][Parquet] 弃用 `parquet::arrow::FileWriter::NewRowGroup()` 中未使用的 `chunk_size` 参数 (#45088)
- GH-45129 - [Python][C++] 修复 pyarrow 中对已弃用的 C++ 功能的使用 (#45189)
- GH-45132 - [C++][Gandiva] 将 LLVM 更新至 18.1 (#45114)
- GH-45155 - [Python][CI] 修复科学计算 nightly windows wheel 上传的路径 (#45222)
- GH-45159 - [CI][Integration] 移除 substrait consumer-testing 集成任务 (#45463)
- GH-45169 - [Python] 适应修改后的 pytest ignore collect hook api (#45170)
- GH-45185 - [C++][Parquet] 在划分记录时,对无效的重复级别抛出错误 (#45186)
- GH-45254 - [C++][Acero] 修复行表合并中的行偏移截断问题 (#45255)
- GH-45266 - [C++][Acero] 修复在多线程中获取错误任务时调度器运行任务计数的问题 (#45268)
- GH-45270 - [C++][CI] 在 Valgrind 构建中禁用 mimalloc (#45271)
- GH-45293 - [CI] 在 bundled ORC 的情况下,将 patch 命令安装到 base conda.dockerfile 中 (#45294)
- GH-45301 - [C++] 将 PrimitiveArray 构造函数改为 protected (#45444)
- GH-45334 - [C++][Acero] 修复 Swiss join 在计算定长和空值掩码的行偏移时出现的溢出问题 (#45336)
- GH-45347 - [Packaging][Linux] 使用 cpp/CMakeLists.txt 而不是 java/pom.xml 来检测版本 (#45348)
- GH-45354 - [GLib] 修复 garrow_record_batch_validate() 定义的位置 (#45355)
- GH-45362 - [C++] 修复时间类型和列表类型标量的恒等转换 (#45370)
- GH-45371 - [C++] 修复 `SimpleRecordBatch::columns` 中的数据竞争问题 (#45372)
- GH-45377 - [CI][R] 确保在 ubuntu-24.04 runner 上为 R nightly 构建任务安装 R (#45464)
- GH-45378 - [CI][R] 增加 test-ubuntu-r-sanitizer 任务的超时时间 (#45379)
- GH-45380 - [Python] 向 Python 暴露 RankQuantileOptions (#45392)
- GH-45381 - [CI][Packaging][Conan] 使用最新支持的镜像 (#45387)
- GH-45390 - [GLib] 错误标签使用连字符分隔的单词 (#45391)
- GH-45393 - [C++][Compute] 修复行表中 32 位列的错误解码 (#45473)
- GH-45396 - [C++] 在 ARROW_FUZZING 中使用 Boost (#45397)
- GH-45423 - [C++] 在 ARROW_TESTING=ON/ARROW_BUILD_SHARED=OFF 时不要求 Boost 库 (#45424)
- GH-45436 - [Docs][Packaging][Linux] 更新如何构建 .deb/.rpm 的文档 (#45481)
- GH-45455 - [GLib] 修复返回正值的内存池利用率 (#45456)
- GH-45497 - [C++][CSV] 避免当一行包含过多列时发生缓冲区溢出 (#45498)
- GH-45499 - [CI] 在 GHA 上升级 actions/cache 版本 (#45500)
- GH-45510 - [CI][C++] 修复 Debian 上 LLVM APT 仓库的准备工作 (#45511)
- GH-45512 - [C++] 清理不含 IPC 的 libarrow 中的未定义符号 (#45513)
- GH-45514 - [CI][C++][Docs] 在 debian-docs 中明确设置 CUDAToolkit_ROOT (#45520)
- GH-45521 - [CI][Dev][R] 安装与 R lintr 一起使用的必需包 cyclocomp (#45524)
- GH-45530 - [Python][Packaging] 将 pyarrow.libs 目录添加到 get_library_dirs (#45766)
- GH-45536 - [Dev][R] 更新代码以匹配 lintr=3.2.0 上的新 linter (#45556)
- GH-45537 - [CI][C++] 为 file_skyhook.cc 添加缺失的头文件 (iwyu) (#45538)
- GH-45541 - [Doc][C++] 按原样渲染 ASCII 艺术 (#45542)
- GH-45543 - [Release][C#] 从脚本中移除 NuGet 引用 (#45544)
- GH-45545 - [C++][Parquet] 添加缺失的头文件 (#45554)
- GH-45560 - [Docs] 修复 Statistics schema 的 "column" 示例 (#45561)
- GH-45564 - [C++][Acero] 在 ProjectNode 中为名称和表达式向量添加大小验证 (#45565)
- GH-45568 - [C++][Parquet][CMake] 当需要 Thrift 时自动启用 zlib (#45569)
- GH-45578 - [C++] 在 MakeStatisticsArrayMaxApproximate 测试中使用 max 而不是 min (#45579)
- GH-45582 - [Python] 在 Schema.metadata 中保留 decimal32/64/256 的元数据 (#45583)
- GH-45587 - [C++][Docs] 修复 `arrow::RecordBatch::MakeStatisticsArray()` 文档字符串中 statistics schema 的链接 (#45588)
- GH-45614 - [C++] 在 CMake 中使用 Boost 的 CMake 包代替 FindBoost.cmake (#45623)
- GH-45628 - [C++] 确保为 bundled Thrift 指定 Boost include 目录 (#45637)
- GH-45656 - [C#] 修复失败的 MacOS 构建 (#45734)
- GH-45659 - [GLib][Ruby] 修复 Ruby lint 违规(在逗号后添加空格) (#45660)
- GH-45669 - [C++][Parquet] 添加缺失的 `ParquetFileReader::GetReadRanges()` 定义 (#45684)
- GH-45693 - [C++][Gandiva] 修复 aes_encrypt/decrypt 算法选择 (#45695)
- GH-45700 - [C++][Compute] 在 Equals 方法中添加 nullptr 检查以处理 null impl_ 指针 (#45701)
- GH-45714 - [CI][R] 不要在 CRAN 上运行使用 reticulate 的测试 (#46026)
- GH-45718 - [R][CI] 修复 opensuse155 上的编译错误 (#45874)
- GH-45724 - [Docs] 将文档镜像名称从 ubuntu-docs 修复为 debian-docs (#45726)
- GH-45733 - [C++][Python] 为偏度和峰度函数添加有偏/无偏切换 (#45762)
- GH-45739 - [C++][Python] 修复在不带选项调用 hash_pivot_wider 时发生的崩溃 (#45740)
- GH-45758 - [Python] 添加 AzureFileSystem 文档 (#45759)
- GH-45782 - [GLib] 仅检查第一行以进行验证错误 (#45783)
- GH-45787 - [Integration][CI] 移除 conda 集成测试中对 Rust 1.77 的固定版本 (#45790)
- GH-45788 - [C++][Acero] 修复聚合节点中的数据竞争 (#45789)
- GH-45850 - 修复 r-devel 关于 .a 库中符号的说明 (#45870)
- GH-45862 - [JS] 修复 FixedSizeListBuilder 对 null slot 的行为 (#45889)
- GH-45868 - [C++][CI] 修复 C++ 20 中有歧义的初始化测试 (#45871)
- GH-45879 - [CI][Release][Ruby] 在 x86_64 macOS 上忽略 Flight 相关测试 (#45898)
- GH-45905 - [C++][Acero] 增大 ConcurrentQueue 测试的超时时间以减少偶发失败 (#45923)
- GH-45915 - [JS] 确保 UnionBuilder 生成具有正确长度的块 (#45916)
- GH-45924 - [CI] 将 emscripten 任务的 chrome_version 更新到最新的稳定版 (v134) (#45925)
- GH-45926 - [Python] 在无偏偏度和峰度测试中对浮点值使用 pytest.approx (#45929)
- GH-45930 - [C++] 不在 Azure SDK C++ 中使用 ICU C++ API (#45952)
- GH-45939 - [C++][Benchmarking] 修复编译失败 (#45942)
- GH-45959 - [C++][CMake] 修复 Arrow::arrow_static 中的 Protobuf 依赖关系 (#45960)
- GH-45967 - [Benchmarking][CI] 基准测试因构建失败而停止工作
- GH-45980 - [C++] 将 Bundled Snappy 版本升级至 1.2.2 (#45981)
- GH-45994 - [CI][GLib] 修复 Windows 任务的 vcpkg 配置 (#46006)
- GH-45995 - [Benchmarking][CI] Benchmarking buildkite 运行未能构建 PyArrow
- GH-45999 - [C++][Gandiva] 修复在 LLVM 20.1.1 上的崩溃 (#46000)
- GH-46022 - [C++] 修复使用 g++ 7.5.0 时的构建错误 (#46028)
- GH-46023 - [CI][MATLAB] libmexclass 与 CMake 4.0.0 不兼容 (#46033)
- GH-46041 - [Python][Packaging] 在自由线程 Windows wheel 测试中暂时移除 pandas 的安装 (#46042)
- GH-46050 - [R] 将 windows 添加到 Makevars.in 的路径集中 (#46055)
- GH-46067 - [CI][C++] 从 macOS 中移除系统 Flatbuffers (#46105)
- GH-46072 - [Release] 在 05-binary-upload.sh 中禁用同步 (#46074)
- GH-46075 - [Release][CI] 修复二进制验证 (#46076)
- GH-46077 - [CI][C++] 在 macos-13 上禁用 -Werror (#46106)
- GH-46081 - [Release] 不为 Maven 仓库生成不必要的 `uploaded-files.txt` (#46082)
- GH-46083 - [Release][Packages] 再次为 APT/Yum 仓库使用 Artifactory (#46108)
- GH-46111 - [C++][CI] 修复 MinGW 上的 boost 1.88 (#46113)
- GH-46123 - [C++] `compare_internal.cc` 和 `light_array_internal.cc` 中的未定义行为 (#46124)
- GH-46134 - [CI][C++] 在 protobuf 方法中将可能的 `absl::string_view` 显式转换为 `std::string` (#46136)
- GH-46159 - [CI][C++] 在 boost 1.88 上停止使用可能缺失的 boost/process/v2.hpp,改用单独的头文件 (#46160)
- GH-46167 - [R][CI] 更新 task.yml 中 R 4.5 的 Artifacts (#46168)
- GH-46169 - [CI][R] 将 R 版本更新到 4.5,因为 4.4 不再在 APT 仓库中 (#46171)
- GH-46195 - [Release][C++] verify-rc-source-cpp-macos-amd64 未能构建 googlemock
新功能和改进
- GH-14932 - [Python] 为 JSON 流式读取器添加 Python 绑定 (#45084)
- GH-18036 - [Packaging] 为 musllinux 构建 Python wheel (#45470)
- GH-26648 - [C++] 优化联合类型的相等性比较 (#45384)
- GH-33592 - [C++] 支持在没有空值的情况下将可为空的字段转换为不可为空 (#43782)
- GH-35289 - [Python] 在 numpy 转换中支持大型可变宽度类型 (#36701)
- GH-36412 - [Python][CI] 修复 pandas nightly 构建中的弃用警告
- GH-37563 - [Ruby] 统一 `raw_records` 和 `each_raw_record` 关于基本数组的测试 (#45861)
- GH-38694 - [Release][C#] 发布 Apache.Arrow.Flight.Sql (#45309)
- GH-39010 - [Python] 为 `to_pylist`、`to_pydict`、`as_py` 引入 `maps_as_pydicts` 参数 (#45471)
- GH-40760 - [Release] 使用 repository.apache.org (#45903)
- GH-41002 - [Python] 移除对 pytest-cython 和 conda-docs pytest 的版本固定 (#45240)
- GH-41764 - [Parquet][C++] 在 Parquet 读取器中支持未来的逻辑类型 (#41765)
- GH-41816 - [C++] 添加 libarrow 的最小化 Meson 构建 (#45441)
- GH-41985 - [Python][Docs] 阐明 pyarrow.compute.scalar() 的文档字符串 (#45668)
- GH-43118 - [JS] 为 MONTH_DAY_NANO 单位添加 interval 类型 (#43117) (#45712)
- GH-43135 - [R] 将二进制类型映射更改为 `blob::blob` (#45595)
- GH-43296 - [C++][FlightRPC] 移除 Flight UCX 传输 (#43297)
- GH-43573 - [C++] 从 string-view 转换为带偏移的字符串和二进制类型时复制位图 (#44822)
- GH-43587 - [Python] 移除不再使用的 serialize/deserialize PyArrow C++ 代码 (#45743)
- GH-43876 - [Swift] 使用 apache/arrow-go (#45781)
- GH-44042 - [C++][Parquet] 在为加密文件构建 parquet 时限制行组数量 (# 44043)
- GH-44393 - [C++][Compute] 向量选择函数 `inverse_permutation` 和 `scatter` (#44394)
- GH-44421 - [Python] 添加在 Windows 上构建和测试自由线程 wheel 的配置 (#44804)
- GH-44615 - [C++][Compute] 添加 extract_regex_span 函数 (#45577)
- GH-44629 - [C++][Acero] 为 `asof_join` 使用 `implicit_ordering` 而不是 `require_sequenced_output` (#44616)
- GH-44757 - [GLib] 添加 garrow_array_validate() (#45328)
- GH-44758 - [GLib] 添加 garrow_array_validate_full() (#45342)
- GH-44759 - [GLib] 添加 garrow_record_batch_validate() (#45353)
- GH-44760 - [GLib] 添加 garrow_record_batch_validate_full() (#45386)
- GH-44761 - [GLib] 添加 garrow_table_validate() (#45414)
- GH-44762 - [GLib] 添加 garrow_table_validate_full() (#45468)
- GH-44790 - [Python] 从代码库中移除 use_legacy_dataset (#45742)
- GH-44905 - [Dev] 移除仅包含头文件的未使用文件 (#45526)
- GH-44924 - [R] 移除对 cpp11 的 HAS_UNWIND_PROTECT 的使用 (#45261)
- GH-44950 - [C++] 将最低 CMake 版本提升至 3.25 (#44989)
- GH-45045 - [C++][Parquet] 为 size_statistics_level 添加基准测试 (#45085)
- GH-45156 - [Python][Packaging] 重构 Python Windows wheel 镜像以使用更新的基础镜像 (#45442)
- GH-45190 - [C++][Compute] 添加 rank_quantile 函数 (#45259)
- GH-45196 - [C++][Acero] 对 hash join 的小改进 (#45197)
- GH-45204 - [Integration][Archery] 移除对 nanoarrow IPC 压缩 ZSTD/不可压缩黄金文件的跳过 (#45205)
- GH-45206 - [C++][CMake] 添加 sanitizer 预设 (#45207)
- GH-45209 - [C++][CMake] 修复 sanitizer cmake 预设未禁用分配器的问题 (#45210)
- GH-45215 - [C++][Acero] 导出 SequencingQueue 和 SerialSequencingQueue (#45221)
- GH-45216 - [C++][Compute] 重构 Rank 实现 (#45217)
- GH-45219 - [C++][Examples] 更新示例以禁用 mimalloc (#45220)
- GH-45225 - [C++] 将 ORC 升级到 2.1.0 (#45226)
- GH-45227 - [C++][Parquet] 默认启用 Size Stats 和 Page Index (#45249)
- GH-45237 - [Python] 将支持的最低 cython 版本提升至 >=3 (#45238)
- GH-45263 - [MATLAB] 添加从 `uint8` 数组构建 `RecordBatchStreamReader` 的功能 (#45274)
- GH-45269 - [C++][Compute] 添加 "pivot_wider" 和 "hash_pivot_wider" 函数 (#45562)
- GH-45278 - [Python][Packaging] 更新了 delvewheel 安装命令和与 delvewheel repair 一起使用的标志 (#45323)
- GH-45279 - [C++][Compute] 将所有 Grouper 测试移动到 grouper_test.cc (#45280)
- GH-45282 - [Python][Parquet] 移除 ParquetWriter 未使用的只读属性 (#45281)
- GH-45288 - [Python][Packaging][Docs] 更新 PyArrow nightly wheels 的文档 (#45289)
- GH-45307 - [CI] 使用 GitHub 托管的 arm runner (#45308)
- GH-45344 - [C++][Testing] 通用 `StepGenerator` (#45345)
- GH-45356 - [CI][R] 将 MACOSX_DEPLOYMENT_TARGET 更新到 11.6 (#45363)
- GH-45358 - [C++][Python] 添加 MemoryPool 方法以打印统计信息 (#45359)
- GH-45361 - [CI][C++] 整理 `ci/vcpkg/vcpkg.json` (#45081)
- GH-45366 - [C++][Parquet] 当数据页 v2 未压缩时,将 is_compressed 设置为 false (#45367)
- GH-45388 - [CI][MATLAB] 我们可以为 Ubuntu CI 使用 Ubuntu 22.04 或 24.04 吗 (#45395)
- GH-45389 - [CI][R] 为 test-r-versions 使用 Ubuntu 22.04 (#45475)
- GH-45398 - [CI][Dev][Ruby] 添加 Ruby lint (#45417)
- GH-45402 - [CI][Dev][Ruby] 在应用 lint 之前重新格式化代码 (#45403)
- GH-45416 - [CI][C++][Homebrew] 向后移植最新的 formula 更改 (#45460)
- GH-45433 - [Python] 移除 Cython 的变通方法 (#45437)
- GH-45447 - [CI][GLib] 对 Meson 配置文件使用 `meson format` (#45448)
- GH-45451 - [C#] 与 Grpc.Net.ClientFactory 集成 (#45458)
- GH-45457 - [Python] 添加 `pyarrow.ArrayStatistics` (#45550)
- GH-45476 - [Packaging][Linux] 放弃对 Ubuntu 20.04 的支持 (#45477)
- GH-45478 - [CI][C++] 放弃对 Ubuntu 20.04 的支持 (#45519)
- GH-45479 - [CI][Release] 使用 Ubuntu 24.04 代替 20.04 (#45480)
- GH-45482 - [CI][Python] 不为 wheel 测试使用 Ubuntu 20.04 (#45483)
- GH-45485 - [Dev] 简化 pull request 模板 (#45599)
- GH-45486 - [GLib] 添加 `GArrowArrayStatistics` (#45490)
- GH-45491 - [GLib] 要求 Meson 0.61.2 或更高版本 (#45492)
- GH-45505 - [CI][R] nightly 任务尽可能使用 Ubuntu 22.04 代替 20.04 (#45507)
- GH-45506 - [C++][Acero] 更安全的防溢出 Swiss table (#45515)
- GH-45508 - [CI][R] 从 sanitizer 任务中移除 Ubuntu 版本 (#45509)
- GH-45517 - [GLib] garrow_data_type_new_raw() 返回 GARROW_TYPE_STRING_VIEW_DATA_TYPE (#45518)
- GH-45528 - [GLib] garrow_data_type_new_raw() 返回 GARROW_TYPE_BINARY_VIEW_DATA_TYPE (#45529)
- GH-45548 - [Release][Dev][Packaging] 在 RC 验证脚本中本地省略 APT/Yum 仓库检查 (#45738)
- GH-45551 - [C++][Acero] 释放构建哈希表时的 Swiss join 临时状态以减少内存消耗 (#45552)
- GH-45563 - [C++][Compute] 拆分 hash_aggregate.cc (#45725)
- GH-45566 - [C++][Parquet][CMake] 在 FindThriftAlt.cmake 中移除一个针对 Windows 的变通方法 (#45567)
- GH-45570 - [Python] 允许 Decimal32/64Array.to_pandas (#45571)
- GH-45572 - [C++][Compute] 添加 rank_normal 函数 (#45573)
- GH-45584 - [C++][Thirdparty] 将 zstd 升级到 v1.5.7 (#45585)
- GH-45589 - [C++] 在 Meson 配置中启用 singular 测试 (#45596)
- GH-45591 - [C++][Acero] 优化 hash join 基准测试并从项目中移除 openmp (#45593)
- GH-45605 - [R][C++] 修复标识符 ... 前有空格的警告 (#45606)
- GH-45611 - [C++][Acero] 通过提前对批次进行分区来提高 Swiss join 构建性能以减少竞争 (#45612)
- GH-45620 - [CI][C++] 使用 Visual Studio 2022 而不是 2019 (#45621)
- GH-45626 - [CI][Docs] 从 `ci/docker/linux-apt-docs.dockerfile` 中移除 Java 相关配置 (#45627)
- GH-45631 - [CI] 移除未使用的 `java-jni-manylinux-201x.dockerfile` (#45632)
- GH-45649 - [GLib] 添加 GArrowBinaryViewArray (#45650)
- GH-45652 - [C++][Acero] 统一 ConcurrentQueue 和 BackpressureConcurrentQueue 的 API (#45421)
- GH-45661 - [GLib][Ruby][Dev] 添加 Ruby lint 规则(在逗号后添加空格) (#45662)
- GH-45665 - [Docs] 在文档中添加 kapa AI 机器人 (#45667)
- GH-45670 - [Release][Archery] Crossbow bot 接受 `--prefix` (#45671)
- GH-45675 - [Release] 在 apache/arrow 中运行二进制 RC 验证任务 (#45699)
- GH-45676 - [C++][Python][Compute] 添加偏度和峰度函数 (#45677)
- GH-45680 - [C++][Python] 移除 20.0 版本中已弃用的函数
- GH-45689 - [C++][Thirdparty] 将 Apache ORC 升级到 2.1.1 (#45600)
- GH-45691 - [R][Packaging] 更新 R 打包清单以反映最新流程 (#45692)
- GH-45694 - [C++] 将 vendored flatbuffers 升级到 24.3.6 (#45687)
- GH-45696 - [C++][Gandiva] 接受 LLVM 20.1 (#45697)
- GH-45705 - [Python] 在 AzureFileSystem 中添加对 SAS 令牌的支持 (#45706)
- GH-45708 - [Release] 在我们上传二进制文件后重新运行二进制验证任务 (#45736)
- GH-45710 - [GLib] 添加 GArrowStringViewArray (#45711)
- GH-45732 - [C++][Compute] 接受更多透视键类型 (#45945)
- GH-45744 - [C++] 移除已弃用的 GetNextSegment (#45745)
- GH-45746 - [C++] 移除 20.0 版本中已弃用的函数 (C++ 子集) (#45748)
- GH-45752 - [C#] 更新 FlightInfo.cs 以包含缺失的字段 (#45753)
- GH-45755 - [C++][Python][Compute] 添加 winsorize 函数 (#45763)
- GH-45769 - [C#][flight] 添加 FlightInfo ByteString 序列化 (#45770)
- GH-45771 - [C++] 将测试添加到顶层 Meson 配置 (#45773)
- GH-45772 - [C++] 从 Meson 配置中将 Arrow 作为依赖项导出 (#45774)
- GH-45775 - [C++] 在 Meson 配置中使用 dict.get() (#45776)
- GH-45779 - [C++] 将 testing 目录添加到 Meson 配置 (#45780)
- GH-45784 - [C++] 在 Brewfile 中取消固定 LLVM 和 OpenSSL 的版本 (#45785)
- GH-45792 - [C++] 将基准测试添加到 Meson 配置 (#45793)
- GH-45813 - [Docs] 启用讨论区 (#45811)
- GH-45816 - [C++] 使 `VisitType()` 的回退分支不可达 (#45815)
- GH-45820 - [C++] 为返回 Buffer 的 CopyBitmap 函数添加可选的 out_offset (#45852)
- GH-45821 - [C++][Compute] Grouper 改进 (#45822)
- GH-45825 - [C++] 将 c 目录添加到 Meson 配置 (#45826)
- GH-45827 - [C++] 将 io 目录添加到 Meson 配置 (#45828)
- GH-45831 - [C++] 将 CSV 目录添加到 Meson 配置 (#45832)
- GH-45848 - [C++][Python][R] 移除已弃用的 PARQUET_2_0 (#45849)
- GH-45877 - [C++][Acero] 通过使用 32 位清理 Swiss join 的 64 位临时状态 (#45878)
- GH-45883 - [Docs] 更新 GitHub Issue 模板以用于 GitHub Discussions (#45884)
- GH-45890 - [Ruby] 统一 raw_records 和 each_raw_record 中密集联合数组的测试 (#45904)
- GH-45891 - [Ruby] 统一 raw_records 和 each_raw_record 中字典数组的测试 (#45927)
- GH-45892 - [Ruby] 统一 raw_records 和 each_raw_record 中列表数组的测试 (#45940)
- GH-45893 - [Ruby] 统一 raw_records 和 each_raw_record 中 map 数组的测试 (#45955)
- GH-45894 - [Ruby] 统一 raw_records 和 each_raw_record 中多列的测试 (#45965)
- GH-45895 - [Ruby] 统一 raw_records 和 each_raw_record 中稀疏联合数组的测试 (#45970)
- GH-45896 - [Ruby] 统一 raw_records 和 each_raw_record 中结构体数组的测试 (#45974)
- GH-45897 - [Ruby] 统一 raw_records 和 each_raw_record 中表的测试 (#45977)
- GH-45906 - [Docs] 在开发者指南中记录 GitHub Discussions (#45907)
- GH-45917 - [C++][Acero] 添加 flush taskgroup 以启用并行化 (#45918)
- GH-45920 - [Release][Python] 将 sdist 和 wheels 上传到 GitHub Releases 而不是 apache.jfrog.io (#45962)
- GH-45922 - [C++][Flight] 移除已弃用的 Authenticate 和 StartCall (#45932)
- GH-45949 - [R] 修复 19.0.1 版本关于已编译代码的 CRAN 警告 (#45951)
- GH-45953 - [C++] 使用锁修复 ReadaheadGenerator 中的原子性错误 (#45954)
- GH-45961 - [Release][Docs] 将生成的文档上传到 GitHub Releases 而不是 apache.jfrog.io (#45963)
- GH-45975 - [Ruby] 添加对 rubygems-requirements-system 的支持 (#45976)
- GH-45986 - [C++] 更新 bundled GoogleTest (#45996)
- GH-45987 - [C++] 为 bundled 依赖项设置 CMAKE_POLICY_VERSION_MINIMUM=3.5 (#45997)
- GH-46051 - [R] 向后移植 19.0.1.1 的 NEWS.md 更改 (#46056)