Apache Arrow 20.0.0 (2025 年 4 月 27 日)
这是一个涵盖超过 2 个月开发的主要版本。
下载
贡献者
此版本包含来自 63 位不同贡献者的 327 个提交。
$ git shortlog -sn apache-arrow-19.0.1..apache-arrow-20.0.0
57 Sutou Kouhei
31 dependabot[bot]
26 Raúl Cumplido
24 Antoine Pitrou
19 Hiroyuki Sato
18 Bryce Mecum
18 Rossi Sun
15 William Ayd
12 Jacob Wujciak-Jens
9 takuya kodama
8 mwish
7 Alenka Frim
6 Gang Wu
5 Jonathan Keane
5 Joris Van den Bossche
4 Krisztián Szűcs
3 Arash Andishgar
3 Enrico Minack
3 mroz45
2 Adam Reeve
2 ChiLin Chiu
2 Christoph
2 Dewey Dunnington
2 Kevin Gurney
2 Matthew Roeschke
2 Neal Richardson
2 Nic Crane
2 eitsupi
2 lriggs
1 Adam Binford
1 Antony Peacock
1 Colin
1 Crystal Zhou
1 Curt Hagenlocher
1 Dan King
1 David Li
1 Gibby Free
1 Ian Cook
1 Jonas Dedden
1 Kent Yao
1 Lester Fan
1 Lysandros Nikolaou
1 Makito
1 Matt Topol
1 Mike
1 Mike Barry
1 Nick Crews
1 Nuno Veloso
1 Nuo Xu
1 Parth Chonkar
1 Paul Taylor
1 Piong1997
1 Rob Van Mieghem
1 Robert Cao
1 Sarah Gilmore
1 Shawn
1 Tien Nguyen
1 Xuchen Pan
1 Yunpei Zhou
1 anubhav
1 gitmodimo
1 ivin
1 panbingkun
补丁提交者
以下 Apache 提交者将贡献的补丁合并到存储库中。
$ git shortlog -sn --group=trailer:signed-off-by apache-arrow-19.0.1..apache-arrow-20.0.0
118 Sutou Kouhei
50 Antoine Pitrou
34 Raúl Cumplido
22 Rossi Sun
20 Curt Hagenlocher
16 Jacob Wujciak-Jens
12 Bryce Mecum
9 mwish
8 AlenkaF
7 Gang Wu
2 Dewey Dunnington
2 Jonathan Keane
2 Kevin Gurney
2 Krisztian Szucs
2 Nic Crane
2 Will Ayd
1 Joris Van den Bossche
1 Sarah Gilmore
1 dependabot[bot]
变更日志
Bug 修复
- GH-30302 - [C++][Parquet] 在往返 Parquet 时保留整数字典索引的位宽 (#45685)
- GH-31992 - [C++][Parquet] 处理 DataPageV2 值缓冲区为空的特殊情况 (#45252)
- GH-36628 - [Python][Parquet] 实例化内部 Parquet 元数据类时失败 (#45549)
- GH-37630 - [C++][Python][Dataset] 允许禁用片段元数据缓存 (#45330)
- GH-39023 - [C++][CMake] 为 ExternalPackage 添加缺失的启动器路径转换 (#45349)
- GH-41166 - [CI][Packaging] 删除未维护的 conda-recipes (#45944)
- GH-43057 - [C++] 线程安全的 AesEncryptor / AesDecryptor (#44990)
- GH-44188 - [Python] 修复带有字节列名的 pandas 往返 (#44171)
- GH-44363 - [C#] 处理具有零批次的 Flight 数据 (#45315)
- GH-45048 - [C++][Parquet] 弃用
parquet::arrow::FileWriter::NewRowGroup()
中未使用的chunk_size
参数 (#45088) - GH-45129 - [Python][C++] 修复 pyarrow 上已弃用的 C++ 功能的使用 (#45189)
- GH-45132 - [C++][Gandiva] 将 LLVM 更新到 18.1 (#45114)
- GH-45155 - [Python][CI] 修复科学之夜 windows wheel 上传的路径 (#45222)
- GH-45159 - [CI][Integration] 删除 substrait consumer-testing 集成作业 (#45463)
- GH-45169 - [Python] 适应修改后的 pytest ignore collect hook api (#45170)
- GH-45185 - [C++][Parquet] 分隔记录时,为无效的重复级别引发错误 (#45186)
- GH-45254 - [C++][Acero] 修复行表合并中的行偏移截断 (#45255)
- GH-45266 - [C++][Acero] 修复多线程中获取错误任务时 Scheduler 的正在运行的任务计数 (#45268)
- GH-45270 - [C++][CI] 在 Valgrind 构建上禁用 mimalloc (#45271)
- GH-45293 - [CI] 安装补丁命令到捆绑 ORC 时所需的 base conda.dockerfile 中 (#45294)
- GH-45301 - [C++] 将 PrimitiveArray ctor 更改为受保护的 (#45444)
- GH-45334 - [C++][Acero] 修复定长和空掩码的行偏移计算中的 swiss join 溢出问题 (#45336)
- GH-45347 - [Packaging][Linux] 使用 cpp/CMakeLists.txt 代替 java/pom.xml 来检测版本 (#45348)
- GH-45354 - [GLib] 修复 garrow_record_batch_validate() 定义的位置 (#45355)
- GH-45362 - [C++] 修复时间和列表标量的 identity cast (#45370)
- GH-45371 - [C++] 修复
SimpleRecordBatch::columns
中的数据竞争 (#45372) - GH-45377 - [CI][R] 确保在 ubuntu-24.04 运行器上安装 R,用于 R nightly build jobs (#45464)
- GH-45378 - [CI][R] 增加 test-ubuntu-r-sanitizer 作业的超时时间 (#45379)
- GH-45380 - [Python] 将 RankQuantileOptions 暴露给 Python (#45392)
- GH-45381 - [CI][Packaging][Conan] 使用最新支持的镜像 (#45387)
- GH-45390 - [GLib] 对错误标签使用连字符分隔的单词 (#45391)
- GH-45393 - [C++][Compute] 修复行表中 32 位列的错误解码 (#45473)
- GH-45396 - [C++] 将 Boost 与 ARROW_FUZZING 一起使用 (#45397)
- GH-45423 - [C++] 不要将 Boost 库与 ARROW_TESTING=ON/ARROW_BUILD_SHARED=OFF 一起使用 (#45424)
- GH-45436 - [Docs][Packaging][Linux] 更新如何构建 .deb/.rpm (#45481)
- GH-45455 - [GLib] 修复返回正内存池利用率 (#45456)
- GH-45497 - [C++][CSV] 避免行有太多列时缓冲区溢出 (#45498)
- GH-45499 - [CI] 提升 GHA 上的 actions/cache 版本 (#45500)
- GH-45510 - [CI][C++] 修复 Debian 上的 LLVM APT 存储库准备 (#45511)
- GH-45512 - [C++] 清除没有 IPC 的 libarrow 中未定义的符号 (#45513)
- GH-45514 - [CI][C++][Docs] 在 debian-docs 中显式设置 CUDAToolkit_ROOT (#45520)
- GH-45521 - [CI][Dev][R] 安装所需的 cyclocomp 包,以便与 R lintr 一起使用 (#45524)
- GH-45530 - [Python][Packaging] 将 pyarrow.libs 目录添加到 get_library_dirs (#45766)
- GH-45536 - [Dev][R] 更新代码以匹配 lintr=3.2.0 上的新 linters (#45556)
- GH-45537 - [CI][C++] 向 file_skyhook.cc 添加缺失的 includes (iwyu) (#45538)
- GH-45541 - [Doc][C++] 按原样呈现 ASCII art (#45542)
- GH-45543 - [Release][C#] 删除脚本中的 NuGet 引用 (#45544)
- GH-45545 - [C++][Parquet] 添加缺失的 includes (#45554)
- GH-45560 - [Docs] 修复 Statistics schema 的 “column” 示例 (#45561)
- GH-45564 - [C++][Acero] 在 ProjectNode 中添加名称和表达式向量的大小验证 (#45565)
- GH-45568 - [C++][Parquet][CMake] 需要 Thrift 时自动启用 zlib (#45569)
- GH-45578 - [C++] 在 MakeStatisticsArrayMaxApproximate 测试中使用 max 而不是 min (#45579)
- GH-45582 - [Python] 在 Schema.metadata 中保留 decimal32/64/256 元数据 (#45583)
- GH-45587 - [C++][Docs] 修复
arrow::RecordBatch::MakeStatisticsArray()
的文档字符串中的 statistics schema 链接 (#45588) - GH-45614 - [C++] 在 CMake 中使用 Boost 的 CMake 包而不是 FindBoost.cmake (#45623)
- GH-45628 - [C++] 确保为捆绑的 Thrift 指定 Boost include 目录 (#45637)
- GH-45656 - [C#] 修复失败的 MacOS 构建 (#45734)
- GH-45659 - [GLib][Ruby] 修复 Ruby lint 违规(在逗号后添加空格) (#45660)
- GH-45669 - [C++][Parquet] 添加缺失的
ParquetFileReader::GetReadRanges()
定义 (#45684) - GH-45693 - [C++][Gandiva] 修复 aes_encrypt/decrypt 算法选择 (#45695)
- GH-45700 - [C++][Compute] 在 Equals 方法中添加了 nullptr 检查以处理空 impl_ 指针 (#45701)
- GH-45714 - [CI][R] 不要在 CRAN 上运行使用 reticulate 的测试 (#46026)
- GH-45718 - [R][CI] 修复 opensuse155 上的编译错误 (#45874)
- GH-45724 - [Docs] 将 docs 镜像名称从 ubuntu-docs 修复为 debian-docs (#45726)
- GH-45733 - [C++][Python] 将 biased/unbiased 开关添加到偏度和峰度函数 (#45762)
- GH-45739 - [C++][Python] 修复在没有选项的情况下调用 hash_pivot_wider 时崩溃 (#45740)
- GH-45758 - [Python] 添加 AzureFileSystem 文档 (#45759)
- GH-45782 - [GLib] 仅检查第一行以进行验证错误 (#45783)
- GH-45787 - [Integration][CI] 删除 conda 集成测试中 Rust 1.77 的 pin (#45790)
- GH-45788 - [C++][Acero] 修复聚合节点中的数据竞争 (#45789)
- GH-45850 - 修复 r-devel 关于 .a libs 中符号的 note (#45870)
- GH-45862 - [JS] 修复空槽的 FixedSizeListBuilder 行为 (#45889)
- GH-45868 - [C++][CI] 修复 C++ 20 上模糊初始化测试 (#45871)
- GH-45879 - [CI][Release][Ruby] 在 x86_64 macOS 上省略 Flight 相关测试 (#45898)
- GH-45905 - [C++][Acero] 增大 ConcurrentQueue 测试中的超时时间以减少偶发性失败 (#45923)
- GH-45915 - [JS] 确保 UnionBuilder 生成具有正确长度的块 (#45916)
- GH-45924 - [CI] 更新 emscripten 任务的 chrome_version 到最新稳定版本 (v134) (#45925)
- GH-45926 - [Python] 在无偏斜度和峰度测试中,对浮点值使用 pytest.approx (#45929)
- GH-45930 - [C++] 不在 Azure SDK C++ 中使用 ICU C++ API (#45952)
- GH-45939 - [C++][Benchmarking] 修复编译失败 (#45942)
- GH-45959 - [C++][CMake] 修复 Arrow::arrow_static 中的 Protobuf 依赖 (#45960)
- GH-45967 - [Benchmarking][CI] 由于构建失败,基准测试已停止工作
- GH-45980 - [C++] 将捆绑的 Snappy 版本提升到 1.2.2 (#45981)
- GH-45994 - [CI][GLib] 修复 Windows 任务的 vcpkg 配置 (#46006)
- GH-45995 - [Benchmarking][CI] Benchmarking buildkite 运行构建 PyArrow 失败
- GH-45999 - [C++][Gandiva] 修复 LLVM 20.1.1 上的崩溃 (#46000)
- GH-46022 - [C++] 修复 g++ 7.5.0 的构建错误 (#46028)
- GH-46023 - [CI][MATLAB] libmexclass 不适用于 CMake 4.0.0 (#46033)
- GH-46041 - [Python][Packaging] 暂时从自由线程 Windows wheel 测试中移除 pandas 的安装 (#46042)
- GH-46050 - [R] 将 Windows 添加到 Makevars.in 的路径集合中 (#46055)
- GH-46067 - [CI][C++] 从 macOS 中移除系统 Flatbuffers (#46105)
- GH-46072 - [Release] 在 05-binary-upload.sh 中禁用同步 (#46074)
- GH-46075 - [Release][CI] 修复二进制验证 (#46076)
- GH-46077 - [CI][C++] 在 macos-13 上禁用 -Werror (#46106)
- GH-46081 - [Release] 不要为 Maven 存储库生成不必要的
uploaded-files.txt
(#46082) - GH-46083 - [Release][Packages] 再次对 APT/Yum 存储库使用 Artifactory (#46108)
- GH-46111 - [C++][CI] 修复 MinGW 上的 boost 1.88 (#46113)
- GH-46123 - [C++]
compare_internal.cc
和light_array_internal.cc
中的未定义行为 (#46124) - GH-46134 - [CI][C++] 将 protobuf 方法上可能的
absl::string_view
显式转换为std::string
(#46136) - GH-46159 - [CI][C++] 停止在 boost 1.88 上使用可能缺失的 boost/process/v2.hpp 并使用单独的包含 (#46160)
- GH-46167 - [R][CI] 在 task.yml 中更新 R 4.5 的 Artifacts (#46168)
- GH-46169 - [CI][R] 由于 4.4 不再位于 APT 存储库中,因此将 R 版本更新到 4.5 (#46171)
- GH-46195 - [Release][C++] verify-rc-source-cpp-macos-amd64 构建 googlemock 失败
新特性和改进
- GH-14932 - [Python] 为 JSON 流式读取器添加 Python 绑定 (#45084)
- GH-18036 - [Packaging] 为 musllinux 构建 Python wheel (#45470)
- GH-26648 - [C++] 优化 union 相等性比较 (#45384)
- GH-33592 - [C++] 如果没有空值,则支持将可空字段转换为不可空字段 (#43782)
- GH-35289 - [Python] 在 numpy 转换中支持大型可变宽度类型 (#36701)
- GH-36412 - [Python][CI] 修复 pandas nightly build 中的弃用警告
- GH-37563 - [Ruby] 统一关于
raw_records
和each_raw_record
的基本数组的测试 (#45861) - GH-38694 - [Release][C#] 发布 Apache.Arrow.Flight.Sql (#45309)
- GH-39010 - [Python] 为
to_pylist
、to_pydict
、as_py
引入maps_as_pydicts
参数 (#45471) - GH-40760 - [Release] 使用 repository.apache.org (#45903)
- GH-41002 - [Python] 移除 pytest-cython 和 conda-docs pytest 的 pins (#45240)
- GH-41764 - [Parquet][C++] 支持 Parquet 读取器中的未来逻辑类型 (#41765)
- GH-41816 - [C++] 添加 libarrow 的最小 Meson 构建 (#45441)
- GH-41985 - [Python][Docs] 澄清 pyarrow.compute.scalar() 的文档字符串 (#45668)
- GH-43118 - [JS] 为 unit MONTH_DAY_NANO 添加间隔 (#43117) (#45712)
- GH-43135 - [R] 将二进制类型映射更改为
blob::blob
(#45595) - GH-43296 - [C++][FlightRPC] 移除 Flight UCX 传输 (#43297)
- GH-43573 - [C++] 从字符串视图转换为偏移字符串和二进制类型时复制位图 (#44822)
- GH-43587 - [Python] 移除不再使用的序列化/反序列化 PyArrow C++ 代码 (#45743)
- GH-43876 - [Swift] 使用 apache/arrow-go (#45781)
- GH-44042 - [C++][Parquet] 在为加密文件构建 parquet 时限制行组数量 (# 44043)
- GH-44393 - [C++][Compute] 向量选择函数
inverse_permutation
和scatter
(#44394) - GH-44421 - [Python] 添加用于在 Windows 上构建和测试自由线程 wheels 的配置 (#44804)
- GH-44615 - [C++][Compute] 添加 extract_regex_span 函数 (#45577)
- GH-44629 - [C++][Acero] 对
asof_join
使用implicit_ordering
而不是require_sequenced_output
(#44616) - GH-44757 - [GLib] 添加 garrow_array_validate() (#45328)
- GH-44758 - [GLib] 添加 garrow_array_validate_full() (#45342)
- GH-44759 - [GLib] 添加 garrow_record_batch_validate() (#45353)
- GH-44760 - [GLib] 添加 garrow_record_batch_validate_full() (#45386)
- GH-44761 - [GLib] 添加 garrow_table_validate() (#45414)
- GH-44762 - [GLib] 添加 garrow_table_validate_full() (#45468)
- GH-44790 - [Python] 从代码库中移除 use_legacy_dataset (#45742)
- GH-44905 - [Dev] 移除仅包含标题的未使用文件 (#45526)
- GH-44924 - [R] 移除 cpp11 的 HAS_UNWIND_PROTECT 的用法 (#45261)
- GH-44950 - [C++] 将最低 CMake 版本提升到 3.25 (#44989)
- GH-45045 - [C++][Parquet] 为 size_statistics_level 添加基准测试 (#45085)
- GH-45156 - [Python][Packaging] 重构 Python Windows wheel 镜像以使用更新的基础镜像 (#45442)
- GH-45190 - [C++][Compute] 添加 rank_quantile 函数 (#45259)
- GH-45196 - [C++][Acero] 对哈希连接的小改进 (#45197)
- GH-45204 - [Integration][Archery] 移除 nanoarrow IPC 压缩 ZSTD/不可压缩黄金文件的跳过 (#45205)
- GH-45206 - [C++][CMake] 添加 sanitizer 预设 (#45207)
- GH-45209 - [C++][CMake] 修复 sanitizer cmake 预设未禁用分配器的问题 (#45210)
- GH-45215 - [C++][Acero] 导出 SequencingQueue 和 SerialSequencingQueue (#45221)
- GH-45216 - [C++][Compute] 重构 Rank 实现 (#45217)
- GH-45219 - [C++][Examples] 更新示例以禁用 mimalloc (#45220)
- GH-45225 - [C++] 将 ORC 升级到 2.1.0 (#45226)
- GH-45227 - [C++][Parquet] 默认启用大小统计信息和页面索引 (#45249)
- GH-45237 - [Python] 将最低支持的 cython 版本提高到 >=3 (#45238)
- GH-45263 - [MATLAB] 添加从
uint8
数组构造RecordBatchStreamReader
的能力 (#45274) - GH-45269 - [C++][Compute] 添加 “pivot_wider” 和 “hash_pivot_wider” 函数 (#45562)
- GH-45278 - [Python][Packaging] 更新了 delvewheel 安装命令并更新了与 delvewheel repair 一起使用的标志 (#45323)
- GH-45279 - [C++][Compute] 将所有 Grouper 测试移动到 grouper_test.cc (#45280)
- GH-45282 - [Python][Parquet] 移除 ParquetWriter 未使用的只读属性 (#45281)
- GH-45288 - [Python][Packaging][Docs] 更新 PyArrow nightly wheels 的文档 (#45289)
- GH-45307 - [CI] 使用 GitHub 托管的 arm runner (#45308)
- GH-45344 - [C++][测试] 通用
StepGenerator
(#45345) - GH-45356 - [CI][R] 更新 MACOSX_DEPLOYMENT_TARGET 到 11.6 (#45363)
- GH-45358 - [C++][Python] 添加 MemoryPool 方法来打印统计信息 (#45359)
- GH-45361 - [CI][C++] 管理
ci/vcpkg/vcpkg.json
(#45081) - GH-45366 - [C++][Parquet] 当数据页 V2 未压缩时,设置 is_compressed 为 false (#45367)
- GH-45388 - [CI][MATLAB] 我们可以使用 Ubuntu 22.04 或 24.04 用于 Ubuntu CI 吗? (#45395)
- GH-45389 - [CI][R] 使用 Ubuntu 22.04 用于 test-r-versions (#45475)
- GH-45398 - [CI][Dev][Ruby] 添加 Ruby lint (#45417)
- GH-45402 - [CI][Dev][Ruby] 在应用 lint 之前重新格式化代码 (#45403)
- GH-45416 - [CI][C++][Homebrew] 反向移植最新的公式更改 (#45460)
- GH-45433 - [Python] 移除 Cython 解决方法 (#45437)
- GH-45447 - [CI][GLib] 使用
meson format
处理 Meson 配置文件 (#45448) - GH-45451 - [C#] 与 Grpc.Net.ClientFactory 集成 (#45458)
- GH-45457 - [Python] 添加
pyarrow.ArrayStatistics
(#45550) - GH-45476 - [打包][Linux] 放弃支持 Ubuntu 20.04 (#45477)
- GH-45478 - [CI][C++] 放弃支持 Ubuntu 20.04 (#45519)
- GH-45479 - [CI][发布] 使用 Ubuntu 24.04 代替 20.04 (#45480)
- GH-45482 - [CI][Python] 不要使用 Ubuntu 20.04 进行 wheel 测试 (#45483)
- GH-45485 - [开发] 简化 pull request 模板 (#45599)
- GH-45486 - [GLib] 添加
GArrowArrayStatistics
(#45490) - GH-45491 - [GLib] 要求 Meson 0.61.2 或更高版本 (#45492)
- GH-45505 - [CI][R] 对于 nightly jobs,尽可能使用 Ubuntu 22.04 代替 20.04 (#45507)
- GH-45506 - [C++][Acero] 更安全的溢出 Swiss table (#45515)
- GH-45508 - [CI][R] 从 sanitizer jobs 中移除 Ubuntu 版本 (#45509)
- GH-45517 - [GLib] garrow_data_type_new_raw() 返回 GARROW_TYPE_STRING_VIEW_DATA_TYPE (#45518)
- GH-45528 - [GLib] garrow_data_type_new_raw() 返回 GARROW_TYPE_BINARY_VIEW_DATA_TYPE (#45529)
- GH-45548 - [发布][开发][打包] 在 RC 验证脚本中忽略本地 APT/Yum 存储库检查 (#45738)
- GH-45551 - [C++][Acero] 释放 Swiss join 构建哈希表的临时状态以减少内存消耗 (#45552)
- GH-45563 - [C++][Compute] 分割 hash_aggregate.cc (#45725)
- GH-45566 - [C++][Parquet][CMake] 移除 FindThriftAlt.cmake 中针对 Windows 的解决方法 (#45567)
- GH-45570 - [Python] 允许 Decimal32/64Array.to_pandas (#45571)
- GH-45572 - [C++][Compute] 添加 rank_normal 函数 (#45573)
- GH-45584 - [C++][第三方] 将 zstd 升级到 v1.5.7 (#45585)
- GH-45589 - [C++] 在 Meson 配置中启用 singular 测试 (#45596)
- GH-45591 - [C++][Acero] 优化哈希连接基准测试,并从项目中删除 openmp (#45593)
- GH-45605 - [R][C++] 修复标识符 … 前面有空格的警告 (#45606)
- GH-45611 - [C++][Acero] 通过提前分区批处理以减少争用,提高 Swiss 连接构建性能 (#45612)
- GH-45620 - [CI][C++] 使用 Visual Studio 2022 而不是 2019 (#45621)
- GH-45626 - [CI][文档] 从
ci/docker/linux-apt-docs.dockerfile
中移除 Java 相关配置 (#45627) - GH-45631 - [CI] 移除未使用的
java-jni-manylinux-201x.dockerfile
(#45632) - GH-45649 - [GLib] 添加 GArrowBinaryViewArray (#45650)
- GH-45652 - [C++][Acero] 统一 ConcurrentQueue 和 BackpressureConcurrentQueue API (#45421)
- GH-45661 - [GLib][Ruby][开发] 添加 Ruby lint 规则(在逗号后添加空格) (#45662)
- GH-45665 - [文档] 将 kapa AI 机器人添加到文档中 (#45667)
- GH-45670 - [发布][Archery] Crossbow bot 接受
--prefix
(#45671) - GH-45675 - [发布] 在 apache/arrow 中运行二进制 RC 验证 jobs (#45699)
- GH-45676 - [C++][Python][Compute] 添加 skew 和 kurtosis 函数 (#45677)
- GH-45680 - [C++][Python] 移除 20.0 中的已弃用函数
- GH-45689 - [C++][第三方] 将 Apache ORC 升级到 2.1.1 (#45600)
- GH-45691 - [R][打包] 使用最新的流程更新 R 打包清单 (#45692)
- GH-45694 - [C++] 将 vendored flatbuffers 升级到 24.3.6 (#45687)
- GH-45696 - [C++][Gandiva] 接受 LLVM 20.1 (#45697)
- GH-45705 - [Python] 在 AzureFileSystem 中添加对 SAS 令牌的支持 (#45706)
- GH-45708 - [发布] 在我们上传二进制文件后重新运行二进制验证 jobs (#45736)
- GH-45710 - [GLib] 添加 GArrowStringViewArray (#45711)
- GH-45732 - [C++][Compute] 接受更多 pivot key 类型 (#45945)
- GH-45744 - [C++] 移除已弃用的 GetNextSegment (#45745)
- GH-45746 - [C++] 移除 20.0 中的已弃用函数(C++ 子集) (#45748)
- GH-45752 - [C#] 使用缺失的字段更新 FlightInfo.cs (#45753)
- GH-45755 - [C++][Python][Compute] 添加 winsorize 函数 (#45763)
- GH-45769 - [C#][flight] 添加 FlightInfo ByteString 序列化 (#45770)
- GH-45771 - [C++] 将测试添加到顶层 Meson 配置 (#45773)
- GH-45772 - [C++] 从 Meson 配置中导出 Arrow 作为依赖项 (#45774)
- GH-45775 - [C++] 在 Meson 配置中使用 dict.get() (#45776)
- GH-45779 - [C++] 将 testing 目录添加到 Meson 配置 (#45780)
- GH-45784 - [C++] 在 Brewfile 中取消固定 LLVM 和 OpenSSL (#45785)
- GH-45792 - [C++] 将 benchmarks 添加到 Meson 配置 (#45793)
- GH-45813 - [文档] 启用讨论 (#45811)
- GH-45816 - [C++] 使
VisitType()
回退分支不可达 (#45815) - GH-45820 - [C++] 为 Buffer 返回的 CopyBitmap 函数添加可选的 out_offset (#45852)
- GH-45821 - [C++][Compute] Grouper 改进 (#45822)
- GH-45825 - [C++] 将 c 目录添加到 Meson 配置 (#45826)
- GH-45827 - [C++] 将 io 目录添加到 Meson 配置 (#45828)
- GH-45831 - [C++] 将 CSV 目录添加到 Meson 配置 (#45832)
- GH-45848 - [C++][Python][R] 移除已弃用的 PARQUET_2_0 (#45849)
- GH-45877 - [C++][Acero] 通过使用 32 位清理 Swiss join 的 64 位临时状态 (#45878)
- GH-45883 - [文档] 更新 GitHub Issue 模板,用于 GitHub Discussions (#45884)
- GH-45890 - [Ruby] 统一 raw_records 和 each_raw_record 中对 dense union array 的测试 (#45904)
- GH-45891 - [Ruby] 统一 raw_records 和 each_raw_record 中对 dictionary array 的测试 (#45927)
- GH-45892 - [Ruby] 统一 raw_records 和 each_raw_record 中对 list array 的测试 (#45940)
- GH-45893 - [Ruby] 统一 raw_records 和 each_raw_record 中对 map array 的测试 (#45955)
- GH-45894 - [Ruby] 统一 raw_records 和 each_raw_record 中对多个列的测试 (#45965)
- GH-45895 - [Ruby] 统一 raw_records 和 each_raw_record 中对 sparse union array 的测试 (#45970)
- GH-45896 - [Ruby] 统一 raw_records 和 each_raw_record 中对 struct array 的测试 (#45974)
- GH-45897 - [Ruby] 统一 raw_records 和 each_raw_record 中对 table 的测试 (#45977)
- GH-45906 - [文档] 在开发者指南中记录 GitHub Discussions (#45907)
- GH-45917 - [C++][Acero] 添加 flush taskgroup 以启用并行化 (#45918)
- GH-45920 - [发布][Python] 上传 sdist 和 wheels 到 GitHub Releases 而不是 apache.jfrog.io (#45962)
- GH-45922 - [C++][Flight] 移除已弃用的 Authenticate 和 StartCall (#45932)
- GH-45949 - [R] 修复 19.0.1 关于编译代码的 CRAN 警告 (#45951)
- GH-45953 - [C++] 使用锁来修复 ReadaheadGenerator 中的原子 bug (#45954)
- GH-45961 - [发布][文档] 上传生成的文档到 GitHub Releases 而不是 apache.jfrog.io (#45963)
- GH-45975 - [Ruby] 添加对 rubygems-requirements-system 的支持 (#45976)
- GH-45986 - [C++] 更新捆绑的 GoogleTest (#45996)
- GH-45987 - [C++] 为捆绑的依赖项设置 CMAKE_POLICY_VERSION_MINIMUM=3.5 (#45997)
- GH-46051 - [R] 从 19.0.1.1 反向移植 NEWS.md 更改 (#46056)