Apache Arrow 13.0.0 (2023年8月23日)
这是一个涵盖超过 2 个月开发的重大版本。
下载
贡献者
此版本包含来自 108 位不同贡献者的 608 个提交。
$ git shortlog -sn apache-arrow-12.0.1..apache-arrow-13.0.0
83 Sutou Kouhei
47 Raúl Cumplido
35 Nic Crane
26 Joris Van den Bossche
25 mwish
24 Weston Pace
20 sgilmore10
19 Felipe Oliveira Carvalho
17 Antoine Pitrou
16 Alenka Frim
15 Matt Topol
15 rtpsw
13 Igor Izvekov
13 Jin Shang
12 Dane Pitkin
12 Kevin Gurney
11 Alex Shcherbakov
11 David Li
11 Dewey Dunnington
9 Gang Wu
9 Jacob Wujciak-Jens
8 Ben Harkins
8 Herman Schaaf
7 david dali susanibar arce
6 Dominik Moritz
6 Will Jones
6 abandy
5 Curt Hagenlocher
5 Yevgeny Pats
5 dependabot[bot]
4 Li Jin
4 Matthias Loibl
4 Neal Richardson
3 Bryce Mecum
3 Jinpeng
3 eitsupi
2 Abe Tomoaki
2 Aleksei Smirnov
2 Benjamin Kietzman
2 Chunchun Ye
2 David Greiss
2 Davide Pasetto
2 Julien Jerphanion
2 Junming Chen
2 Laurent Goujon
2 Michael Lui
2 Simon Perkins
2 Spencer Nelson
2 henrymai
2 liujiacheng777
2 rtadepalli
2 zhjwpku
1 0x26res
1 Adam Reeve
1 Alexey Ozeritskiy
1 Aljaž Mur Eržen
1 Andrew Lamb
1 Anja Kefala
1 Arnaud Feldmann
1 Austin Dickey
1 Benson Muite
1 Bryan Cutler
1 Carlos O'Ryan
1 Chenxi LI
1 Chris Hoff
1 Diana Sulmone
1 Diogo Teles Sant'Anna
1 Dirk Eddelbuettel
1 Dongjoon Hyun
1 Dr. Jan-Philip Gehrcke
1 Elliott Brossard
1 Erez Rokah
1 Fokko Driesprong
1 Francis
1 Ian Cook
1 Ivan Chesnov
1 James Henderson
1 June Liu
1 Lei Hou
1 Mark Wolfe
1 Martin Traverse
1 Mats Kindahl
1 Matthew Roeschke
1 Nick Byrne
1 NoahFournier
1 Parth Chonkar
1 Philip
1 Rok Mihevc
1 Romain François
1 Rong Ma
1 Sergey Fedorov
1 Sven Rebhan
1 The Alchemist
1 Theodore Tsirpanis
1 Thor
1 Toby Dylan Hocking
1 Wenbo Hu
1 candiduslynx
1 clickingbuttons
1 jeremyosterhoudt
1 lord
1 lriggs
1 micah-white
1 panbingkun
1 ruoxi
1 sunpeng
1 takuya kodama
1 wenxlan
补丁提交者
以下 Apache 提交者将贡献的补丁合并到代码库中。
$ git shortlog -sn --group=trailer:signed-off-by apache-arrow-12.0.1..apache-arrow-13.0.0
155 Sutou Kouhei
96 Antoine Pitrou
62 Matt Topol
44 Joris Van den Bossche
44 Nic Crane
34 David Li
29 Raúl Cumplido
27 Weston Pace
16 Jacob Wujciak-Jens
16 Will Jones
13 Li Jin
8 Dewey Dunnington
7 Eric Erhardt
6 Alenka Frim
5 AlenkaF
5 Dominik Moritz
4 Benjamin Kietzman
2 Andrew Lamb
2 Kevin Gurney
2 Matthew Topol
1 Gang Wu
1 Neal Richardson
变更日志
Apache Arrow 13.0.0 (2023-08-23 07:00:00)
错误修复
- GH-14969 - [R][文档] 启用 pkgdown 内置搜索 (#36374)
- GH-20385 - [C++][Parquet] 拒绝部分加载扩展类型 (#33634)
- GH-23870 - [Python] 确保 parquet.write_to_dataset 不会为未观察到的字典(类别)值创建空文件 (#36465)
- GH-32832 - [Go] 支持使用 tinygo 构建 (#35723)
- GH-34017 - [Python][FlightRPC][文档] 修复 FlightStreamReader.read_chunk 的文档字符串 (#35583)
- GH-34293 - [Java] 在 Windows 上加载原生库时出错 (#34312)
- GH-34338 - [Java] 删除在 -ea 上自动启用 BaseAllocator.DEBUG 的功能 (#36042)
- GH-34351 - [C++][Parquet] 统计信息:添加详细文档和微小优化 (#35989)
- GH-34363 - [C++] 在 S3 上传中使用大小相等的部分以兼容 R2 (#35808)
- GH-34391 - [C++] 未来 as-of-join-node 在远期时间挂起 (#34392)
- GH-34523 - [C++] 避免混合捆绑的 Abseil 和系统 Abseil (#35387)
- GH-34656 - [CI][Python] 使用 gemfury 工具上传 wheel 文件而不是 curl 来修复 Windows wheel 上传问题 (#35032)
- GH-34723 - [Java] 为 Netty 分配器内存使用情况启用日志跟踪 (#35314)
- GH-34752 - [C++] 添加对 LoongArch 的支持 (#34740)
- GH-34775 - [R] arrow_table: as.data.frame() 有时返回 tbl,有时返回 data.frame (#35173)
- GH-34884 - [Python]:支持对 pyarrow.dataset PartitioningFactory 对象进行酸洗 (#36550)
- GH-34884 - [Python]:支持对 pyarrow.dataset Partitioning 子类进行酸洗 (#36462)
- GH-34886 - [Python] 为 Table 和 RecordBatch 添加正确的 __array__ numpy 转换 (#36242)
- GH-34897 - [R] 确保 RStringViewer 帮助器类不拥有任何数组引用 (#35812)
- GH-34907 - [文档][R] 版本选择器报告发布版本为 dev (#35103)
- GH-35007 - [C++] 修复读取标准输入的问题 (#35006)
- GH-35015 - [Go] 修复 parquet 内存泄漏 (#35973)
- GH-35027 - [Go]:在 FixedSizeBinaryBuilder Unmarshal 中使用 base64.StdEncoding (#35028)
- GH-35053 - [Java] 修复 MemoryUtil 以支持 Java 21 (#36370)
- GH-35059 - [C++] 修复运行结束编码输入的“hash_count” (#35129)
- GH-35101 - [C++] 更新 ArrowConfig.cmake.in 中已弃用的 LOCATION 目标属性 (#35109)
- GH-35107 - [FlightSQL]:使用
uint8
来引用 8 位无符号整数,而不是uint1
(#35108) - GH-35118 - [格式][FlightSQL] 更多地使用
int32
来引用 32 位整数,而不是int
(#35213) - GH-35118 - [FlightSQL] 使用
int32
来引用 32 位整数,而不是int
(#35120) - GH-35140 - [R] 重写 configure 脚本并确保我们不使用不匹配的 libarrow (#35147)
- GH-35144 - [C++] 修复聚合节点输出顺序更改时损坏的单元测试 (#35145)
- GH-35177 - [文档][Python] 禁止显示“警告:autosummary:无法导入序列化” (#35182)
- GH-35179 - [C++] 修复 Arrow::bundled_dependencies 的 IMPORTED_LOCATION 属性 (#35196)
- GH-35188 - [Go] 在 CSV 读取器中对扩展类型使用 AppendValueFromString (#35189)
- GH-35190 - [Go] 在 CSV 读取器中正确处理空值 (#35191)
- GH-35193 - [Python][打包] 在 Windows wheel 文件上启用 GCS (#35255)
- GH-35202 - [Go][Parquet] 修复读取嵌套空列表时的恐慌 (#35276)
- GH-35234 - [Go] 修复 Callers 的 skip 参数 (#35231)
- GH-35240 - [Go][FlightRPC] 修复客户端中间件中的崩溃 (#35241)
- GH-35266 - [GLib][Parquet] 修复子元数据中缺少父元数据引用的 GC 错误 (#35286)
- GH-35266 - [CI][GLib][Parquet] 省略 gparquet_column_chunk_metadata_equal() 测试 (#35278)
- GH-35267 - [C#] 在 FlightInfo 中序列化 TotalBytes 和 TotalRecords (#35222)
- GH-35270 - [C++] 在哈希连接内部使用 Buffer 而不是原始缓冲区 (#35347)
- GH-35297 - [C++][IPC] 修复映射字段的架构反序列化 (#35298)
- GH-35306 - 修复 Schema.Fields() 以返回字段的副本 (#35307)
- GH-35310 - [Go] 字符串的 decimal128 值不正确 (#35311)
- GH-35316 - [C++][FlightSQL] 在 SQLite 示例服务器中使用 RowsToBatches() 而不是 ArrayFromJSON() (#35322)
- GH-35326 - [Go] 修复
*array.List
和*array.LargeList
ValueOffsets
实现 (#35327) - GH-35346 - [CI][Python] 将 gdb 从 env-file 移动到 dockerfile (#35348)
- GH-35352 - [Java] 修复“半复杂”类型的问题。 (#35353)
- GH-35359 - [C++] 如果所有元素都为空,FixedSizeListArray.flatten() 会出错 (#35674)
- GH-35360 - [C++] 在 ScalarHashImpl::ArrayHash() 中考虑偏移量 (#35814)
- GH-35363 - [C++] 修复 Substrait 架构名称和分段聚合 (#35364)
- GH-35379 - [C++][FlightRPC] 添加必要的拆卸检查以避免错误时崩溃 (#35380)
- GH-35383 - [C++] 首选 max_concurrency 而不是执行器容量以避免段错误 (#35384)
- GH-35406 - [网站][文档] Arrow 文档页面缺少徽标
- GH-35413 - [Python] 将具体的浮点数组类型添加到 pyarrow 公共 API (#35414)
- GH-35421 - [Go] 确保
array.X.ValueStr
和array.XBuilder.AppendValueFromString
之间的接口约定 (#35457) - GH-35425 - [R] 由于 data.frame 转换,在 R < 4.0 上测试失败 (#35432)
- GH-35438 - [文档] 对源文档进行更正 (#35549)
-
GH-35445 - [R] 类似于 group_by(foo) 的行为 > across(everything()) 与 dplyr 不同 (#35473) - GH-35448 - [C++] 修复 strptime 格式中 %z 的检测 (#35449)
- GH-35468 - [C++] 修复 Acero var/std 用于多个批次的问题 (#35469)
- GH-35483 - [CI][C++] 为 Windows 添加 snprintf 的头文件 (#35484)
- GH-35490 - [Python] 交换协议:更新字符串和 large_string 的测试 (#35504)
- GH-35501 - [C++] 修复 MSVC 中的错误 C2280 (#35683)
- GH-35503 - [CI][打包][C++] Snappy 补丁无法应用于 arm64 windows wheel 构建 (#35509)
- GH-35521 - [C++] 仅当空计数为 0 时才对空位图进行哈希 (#35522)
- GH-35526 - [CI][C++] 修复 arrow::internal::IsNullRunEndEncoded 重新声明的问题 (#35527)
- GH-35528 - [Java] 修复 RangeEqualsVisitor 比较具有不同起始索引的 BitVector 的问题 (#35525)
- GH-35534 - [R] 确保将缺少的分组变量添加到变量列表的开头 (#36305)
- GH-35539 - [C++] 从公共头文件中删除内部头文件的使用 (#35592)
- GH-35553 - [JAVA] 修复 NettyArrowBuf 中的 unwrap() (#35554)
- GH-35571 - [C++][CI][Parquet] 在解密测试中将
EQ
更改为FLOAT_EQ
(#35605) - GH-35573 - [Python] pa.FixedShapeTensorArray.to_numpy_ndarray 在切片数组上失败 (#36164)
- GH-35576 - [C++] 提高 Decimal{128,256}::FromReal 的准确性 (#35997)
- GH-35588 - [Java] 为空值返回常量 hashCode,解决了 #35588 (#35590)
- GH-35593 - [R] 使用 `[[` 和 `$` 尝试从数据集中提取列时出现令人困惑的 (NULL) 结果
- GH-35596 - [C++][CI] 使用 PCG 改进编译缓存 (#35597)
- GH-35599 - [Python] 规范的固定形状张量扩展数组/类型不可酸洗。 (#35933)
- GH-35606 - [CI][C++][MinGW32] 为十进制测试使用更精确的浮点输入 (#35680)
- GH-35617 - [文档] C API 示例中当前的 n_buffers 使用 (#35626)
- GH-35618 - [C++][文档] 改进 Datum 的文档 (#35794)
- GH-35633 - [R] R 构建失败,错误:‘无效:时间戳已有时区:‘UTC’。无法本地化为‘UTC’’ (#35671)
- GH-35635 - [C++][CI] 在 PathFromUriHelper 上忽略主机时保留根目录以修复 HDFS 测试 (#36063)
- GH-35636 - [C++] 从 compute-vector-test 中提取两个耗时的测试套件 (#36401)
- GH-35649 - [R] 始终从 R 主线程调用 DuckDB 的
RecordBatchReader::ReadNext()
(#36307) - GH-35651 - [C++] 抑制 gcc 13 中引入的自身移动警告 (#36328)
- GH-35651 - [C++] 不要在 MinGW 中使用自身移动 (#35653)
- GH-35662 - [CI][C++][MinGW] 避免在发布版本中 FormatTwoDigits() 崩溃 (#35663)
- GH-35665 - [C++][Parquet] DeltaLengthByteArrayEncoder::Put 保留了过多的空间 (#35670)
- GH-35675 - [C++] 不要将 ArraySpan 复制到 REE ArraySpan 中 (#35677)
- GH-35681 - [Ruby] 为空表添加对 #select_columns 的支持 (#35682)
- GH-35684 - [Go][Parquet] 修复空列表数组的空指针解引用问题 (#35690)
- GH-35710 - [R] 对新的配置脚本进行后续改进 (#36435)
- GH-35712 - [C++][CI] MacOS 在 arrow-array-test 中禁用 ASSERT_DEATH (#35724)
- GH-35728 - [CI][Python] 将 test_total_bytes_allocated 移动到子进程以提高可靠性 (#36355)
- GH-35733 - [Java] 修复 IntervalMonthDayNanoVector 构造函数中的次要类型错误 (#35734)
- GH-35736 - [C++] 修复编译 key_map_avx2.cc (#35737)
- GH-35760 - [C++] C 数据接口助手也应在非调试模式下运行检查 (#36215)
- GH-35761 - [Go] 修复 TypeEqual 中的映射比较 (#35762)
- GH-35763 - [Go] 为列表修复 TypeEqual (#35764)
- GH-35789 - [C++] 从 CumulativeSumOptions 中删除 check_overflow (#35790)
- GH-35809 - [C#] 对 C 数据接口的改进 (#35810)
- GH-35819 - [GLib][Ruby] 引用 GArrowExecutePlan 的依赖对象 (#35963)
- GH-35833 - [C++] 添加对 Abseil 20230125 的支持 (#35881)
- GH-35837 - [C++] 如果在源节点上应用背压时调用 StopProducing,Acero 将挂起 (#35902)
- GH-35838 - [C++] 为 asof 连接节点添加背压测试 (#35874)
- GH-35838 - [C++] 修复 asof 连接背压 (#35878)
- GH-35853 - [Python] 修复 NumPy NEP50 的弃用警告 (#35854)
- GH-35858 - [Python] 修复 PR GH-36011 中的代码风格问题 (#36046)
- GH-35858 - [Python] 禁止空 Schema 的 Parquet 写入器 (#36011)
- GH-35859 - [Python] 将默认行组大小实际更改为 1Mi (#36012)
- GH-35866 - [Go] 在
arrow.NestedType.Fields()
实现中提供副本 (#35867) - GH-35868 - [C++] asof-join-node-test 中偶尔出现的 TSAN 故障 (#35904)
- GH-35869 - [R][Release] 12.0.1 维护分支上的 test-r-devdocs 上出现未定义符号 _ZN5arrow6Status14AddContextLineEPKciS2_
- GH-35870 - [C++] 添加使用 CMAKE_CXX_FLAGS_DEBUG 更改优化标志的支持 (#35924)
- GH-35891 - [文档][Python] 更新 Parquet C++ 仓库的链接 (#35892)
- GH-35911 - [Go] 修复 decimal256Traits 的 CastToBytes 方法 (#35912)
- GH-35943 - [开发] 确保 PR 正文为空时链接问题正常工作 (#36460)
- GH-35948 - [Go] 仅在 JSON 编组数组时将
int8
和uint8
转换为float64
(#35950) - GH-35952 - [R] 确保可以将架构元数据设置为命名字符向量 (#35954)
- GH-35960 - [Java] 检测分配中的溢出 (#36185)
- GH-35965 - [Go] 修复
Decimal256DictionaryBuilder
(#35966) - GH-35982 - [Go] 修复 go1.18 构建失败的问题 (#35983)
- GH-35988 - [C#] C 数据接口实现在导入时可能泄漏 (#35996)
- GH-36003 - [打包][RPM] RPM 作业具有重复的工件模式 (#36004)
- GH-36013 - [C++] 使用 Protobuf 3.22+ 禁用捆绑的 OpenTelemetry (#36016)
- GH-36052 - [Go][Parquet] 386 的交叉构建失败 (#36066)
- GH-36053 - [C++] 汇总变量时随机导致 NA,而数据子集中没有 NA (#36368)
- GH-36076 - [C++] 删除已弃用的命令行标志 (#36077)
- GH-36082 - [发布] 在主分支上,post-11-bump-versions.sh 对次要/补丁版本不做 deb 递增 (#36083)
- GH-36090 - [C++] 为 Acero 和 Datasets 添加测试库 (#36206)
- GH-36117 - [C++] 确保创建 BUILD_OUTPUT_ROOT_DIRECTORY (#36160)
- GH-36121 - [R] 当
num_threads
< 2 时,对set_io_thread_count()
发出警告 (#36304) - GH-36168 - [C++][Python] 支持将 Arrow 列表转换为 pandas 的半精度浮点数 (#35944)
- GH-36172 - [R] Windows devdocs 构建失败,因为它使用了没有 JSON 功能的 libarrow (#36174)
- GH-36176 - [C++] 修复单键表排序的回归问题 (#36179)
- GH-36182 - [Gandiva][C++] 修复索引为负数时 substring_index 函数的问题。 (#36184)
- GH-36200 - [CI][文档] 避免“设备上没有剩余空间” (#36230)
- GH-36201 - [Python][CI] test_total_bytes_allocated 在 manylinux 的 arm64 wheel 上失败
- GH-36209 - [Java] 由于安全漏洞升级 Netty (#36211)
- GH-36214 - [C++] 尽可能将
FieldPath::Hash
指定为模板参数 (#36222) - GH-36224 - [CI] 更新 GitHub 脚本中的 rest api 调用 (#36225)
- GH-36239 - [CI][C++] 为 ARROW__FLAGS_ 添加对多个标志的支持 (#36281)
- GH-36245 - [C++] 使用 gcc 13 编译错误
- GH-36257 - [CI][开发][Archery] 机器人需要 pygithub 1.59.0 或更高版本 (#36467)
- GH-36259 - [R] as_schema 描述文档不正确 (#36260)
- GH-36311 - [C++] 修复
utf8_slice_codeunits
中的整数溢出 (#36575) - GH-36327 - [C++][CI] 修复 Valgrind 故障 (#36461)
- GH-36329 - [C++][CI] 在 macOS 上使用 OpenSSL 3 (#36336)
- GH-36331 - [C++][CI] AsofJoinTest 中的偶发错误 (#36356)
- GH-36340 - [Java] 解决分配器记录器线程中的竞争条件 (#36341)
- GH-36346 - [C++] 安全的 S3 终结 (#36442)
- GH-36349 - [Python][CI] 避免在 hypothesis 测试中使用“build/etc/localtime”时区 (#36391)
- GH-36352 - [Python] 将 project_id 添加到 GcsFileSystem 选项 (#36376)
- GH-36353 - [R] 修复包版本引用,使其仅为文本且永不为数字 (#36364)
- GH-36369 - [C++][FlightRPC] 修复 FlightClient::Authenticate*() 中的挂起错误 (#36372)
- GH-36396 - [R] 数组测试中调用了不存在的函数 (#36397)
- GH-36404 - [CI][C++][Gandiva] arm64 macOS 上 JNI 构建的崩溃测试
- GH-36446 - [C++] ConcatenateImpl 中的次要样式改进 (#36463)
- GH-36447 - [C++][CI] arrow-s3fs-test 在某些夜间作业中失败
- GH-36448 - [C++][CI] vcpkg 夜间作业无法构建 scalar_test.cc
- GH-36449 - [C++][CI] 不要在 Python 作业中使用 -g1 (#36453)
- GH-36451 - [CI][C++] 修复 Fedora 35 上的编译失败 (#36457)
- GH-36452 - [CI][C++] 使用兼容的编译器测试 C++20 支持 (#36454)
- GH-36456 - [R] 使用 autobrew 时链接到正确版本的 OpenSSL (#36551)
- GH-36475 - [C++][CI] 修复 Flight 功能验证 (#36473)
- GH-36476 - [C++][FlightRPC] 修复 FlightInfo 中未初始化的字段 (#36484)
- GH-36477 - [CI][macOS] 忽略 crossbow 任务中的 brew 更新失败 (#36478)
- GH-36482 - [C++][CI] 修复 AsofJoinBasicTest 中偶发的测试失败 (#36499)
- GH-36498 - [Python][CI] Hypothesis 夜间测试失败,并显示 pytz.exceptions.UnknownTimeZoneError: ‘Factory’ (#36508)
- GH-36500 - [CI][Java][JAR] 删除 Homebrew 的 protobuf (#36515)
- GH-36501 - [CI][Java][JAR] 确保删除 Homebrew 的 gRPC 包 (#36516)
- GH-36523 - [C++] 修复 S3 中 TSan 检测到的锁排序问题 (#36536)
- GH-36524 - [GLib] 抑制 pessimizing-move 警告 (#36531)
- GH-36537 - [Python] 确保数据集写入器遵循默认的 Parquet 版本 2.6 (#36538)
- GH-36543 - [CI][文档] 使用 -g1 而不是 -g 来构建文档 (#36576)
- GH-36598 - [C++][MinGW] 修复使用 Protobuf 23.4 时的构建失败 (#36606)
- GH-36629 - [CI][Python] 由于我们在 arrow->pandas 转换中进行的非纳秒级更改,跳过 dask 测试 (#36630)
- GH-36641 - [C++] 从非 acero 文件中删除对 acero 的引用 (#36650)
- GH-36659 - [Python] 修复与其他类型比较时 pyarrow.dataset.Partitioning.eq 的问题 (#36661)
- GH-36669 - [Go] 防止 C 数据结构中的垃圾数据 (#36670)
- GH-36686 - [C++] 将 CMAKE_OSX_SYSROOT 传递给外部项目 (#36706)
- GH-36687 - [R] 将正确的分支名称添加到 autobrew 公式以方便本地测试 (#36689)
- GH-36707 - [C++] OPENSSL_ROOT_DIR 也使用 ARROW_PACKAGE_PREFIX (#36710)
- GH-36812 - [C#] 修复 C API 支持以使其与 .NET 桌面框架兼容 (#36813)
- GH-36832 - [打包][RPM] 删除不必要的 Requires (#36833)
- GH-36892 - [C++] 修复
FieldPath::Get
中的性能下降问题 (#37032) - GH-36913 - [C++] 跳过空缓冲区连接以修复 UBSan 错误 (#36914)
- GH-36928 - [Java] 使其与最新版本 4.1.96 的 Netty 兼容 (#36926)
- GH-36969 - [R] 在 gcc-13 上进行捆绑构建时默认禁用 GCS (#37147)
- GH-37019 - [R] read_parquet() 等的文档需要更新 (#37020)
- GH-37197 - [Java][CI][打包] 在 java-jars GitHub 作业上释放一些磁盘空间 (#37198)
- GH-37201 - [CI][打包][Java] java-jars 作业在 macOS aarch_64 上失败
新功能和改进
- GH-14790 - [开发] 避免在 PR 上使用 Closes 问题 ID 的额外注释 (#35811)
- GH-14946 - [C++] 添加扁平化 FieldPath/FieldRef::Get 方法 (#35197)
- GH-15187 - [Java] 使
reader
初始化延迟加载,并添加了新的getTransferPair()
函数,该函数接受Field
类型 (#34424) - GH-18547 - [Java] 支持在 ArrowStreamWriter 中重新发射字典 (#35920)
- GH-20047 - [MATLAB] 在 Windows 上为 MATLAB 接口启用 GitHub Actions CI (#35792)
- GH-21761 - [Python] 在数组构造函数中接受 PyArrow 标量 (#36162)
- GH-26153 - [C++] 为 RecordBatchStreamReader 和 StreamDecoder 共享通用代码 (#36344)
- GH-29781 - [C++][Parquet] 默认情况下切换到使用兼容的嵌套类型 (#35146)
- GH-29887 - [C++] 实现字典数组排序 (#35280)
- GH-31521 - [C++][Flight] 将 Flight SQL 客户端迁移到 Result (#36559)
- GH-32190 - [C++][计算] 实现累积乘积、最大值和最小值函数 (#36020)
- GH-32282 - [R] 更新 case_when() 绑定以匹配 dplyr 中的更改 (#35502)
- GH-32335 - [C++][文档] 为 Acero 添加设计文档 (#35320)
- GH-32605 - [C#] 扩展有效性缓冲区 API (#35342)
- GH-32605 - [C#] 扩展 ArrowBuffer.BitmapBuilder 以提高数组连接性能 (#13810)
- GH-32739 - [CI][文档] 记录文档 PR 预览 (#35614)
- GH-32763 - [C++] 为 fetch 和 sort 添加 FromProto (#34651)
- GH-33206 - [C++] 添加对 StructArray 排序和嵌套排序键的支持 (#35727)
- GH-33321 - [Python] 支持转换为 pandas >= 2.0 的非纳秒 datetime64 (#35656)
- GH-33517 - [C++][Flight] 在 CI 上测试 UCX (#14667)
- GH-33804 - [Python] 添加对 manylinux_2_28 wheel 的支持 (#34818)
- GH-33854 - [MATLAB] 将基本的 libmexclass 集成代码添加到 MATLAB 接口 (#34563)
- GH-33856 - [C#] 为 C# 实现 C 数据接口 (#35496)
- GH-33980 - [文档][Python] 记录 DataFrame 交换协议的实现和用法 (#35835)
- GH-33987 - [R] 支持新的 dplyr .by/by 参数 (#35667)
- GH-34216 - [Python] 支持使用 Python 读取 JSON 数据集 (#34586)
- GH-34223 - [Java] Java Substrait Consumer JNI 调用 ACERO C++ (#34227)
- GH-34375 - [C++][Parquet] 在启用页面索引时忽略页面标头统计信息 (#35455)
- GH-34386 - [C++] 添加 PathFromUriOrPath 方法 (#34420)
- GH-34436 - [R] JSON 数据集的绑定 (#35055)
- GH-34509 - [C++][Parquet] 改进 ArrowReaderProperties::batch_size 的文档字符串 (#36486)
- GH-34722 - [C++][Parquet] 次要:更新 Parquet NextPage 的措辞 (#35368)
- GH-34729 - [C++][Python] 增强 Arrow<->Pandas map/pydict 支持 (#34730)
- GH-34749 - [Java] 使 Zstd 压缩级别可配置 (#34873)
- GH-34787 - [Python] 为 ChunkedArray.to_numpy 接受 zero_copy_only=False (#35582)
- GH-34788 - [Python][打包][CI] 放弃 Python 3.7 支持 (#36061)
- GH-34852 - [C++][Go][Java][FlightRPC] 添加对有序数据的支持 (#35178)
- GH-34858 - [Swift] 初始读取器实现 (#34842)
- GH-34868 - [Python] 在类之间共享文档字符串 (#34894)
- GH-34911 - [C++] 添加 first 和 last 聚合器 (#34912)
- GH-34918 - [C++] 更新 vendored double-conversion 3.2.1 (#34919)
- GH-34921 - [C++][Python][Java] 要求 CMake 3.16 或更高版本 (#35921)
- GH-34949 - [C++][Parquet] 按列启用页面索引 (#35230)
- GH-34971 - [格式] 添加 C 数据接口的非 CPU 版本 (#34972)
- GH-34979 - [Python] 为 Table 和 RecordBatch 创建一个基类 (#34980)
- GH-35004 - [C++] 删除 RelationInfo (#35005)
- GH-35033 - [Java][数据集] 添加对来自 Java 的多文件数据集的支持 (#35034)
- GH-35035 - [R] 为 Schemas 实现 names<- (#35172)
- GH-35067 - [JavaScript] 带符号
BigNum
的 toString 方法(#35067) - GH-35084 - [文档][格式] 添加如何更改格式规范 (#35174)
- GH-35099 - [CI][打包] 将 vcpkg 升级到 2023.04.15 版本 (#35430)
- GH-35112 - [Python] 在 Python MapType 中公开 keys_sorted (#35113)
- GH-35124 - [C++] 避免在输出连接结果时进行不必要的复制 (#35114)
- GH-35125 - [C++][Acero] 在 QueryOptions 中添加自定义 io-executor (#35464)
- GH-35130 - [文档] 记录如何成为协作者以获得分类角色 (#36445)
- GH-35134 - [C++] 在 double-conversion 库周围添加
arrow_vendored
命名空间 (#35135) - GH-35136 - [Go][FlightSQL] 支持未实现
CreatePreparedStatement
的后端 (#35137) - GH-35162 - [Go] Float16 算术 (#35163)
- GH-35164 - [Go] 十进制数据类型的其他方法 (#35165)
- GH-35168 - [CI][打包][Conan] 合并上游更改 (#35169)
- GH-35171 - [C++][Parquet] 为数据页 v2 实现 CRC (#35242)
- GH-35180 - [R] 为 cumsum 函数实现绑定 (#35339)
- GH-35212 - [Go] 使用 ARROW_CHECKED_MAX_RETAINED_FRAMES 显示完整的调用堆栈 (#35215)
- GH-35228 - [C++][Parquet] 次要:修复 Parquet Reader 中的注释拼写错误 (#35229)
- GH-35245 - [Java][数据集][Linux] 启用 GCS (#35246)
- GH-35247 - [C++] 为 stddev/variance 添加 Arrow Substrait 支持 (#35249)
- GH-35250 - [Python] 为日期时间列转换为 pandas 添加测试 (#35546)
- GH-35256 - [Go] 向元数据添加 ToMap (#35257)
- GH-35264 - [Python] 交换协议:测试清理 (#35530)
- GH-35275 - [Java] 确保 VectorSchemaRoot 切片返回一个新的 root (#35476)
- GH-35279 - [C++][Parquet] 工具:增强 Parquet 打印统计信息 (#35262)
- GH-35282 - [C++] 在启用模糊测试时自动启用 brotli (#35283)
- GH-35290 - [JS] 更新依赖项 (#35291)
- GH-35302 - [Go] 改进 pqarrow 中不支持的类型错误消息 (#35303)
- GH-35304 - [C++][ORC] 支持属性转换 (#35499)
- GH-35315 - [C++][CMake] 为 Flight SQL 添加预设 (#35317)
- GH-35335 - [Python][文档] 修复
map_
的文档字符串 (#35336) - GH-35361 - [C++] 从 cpp/build-support/run-test.sh 中删除 Perl 依赖项 (#35362)
- GH-35375 - [C++][FlightRPC] 添加
arrow::flight::ServerCallContext::incoming_headers()
(#35376) - GH-35377 - [C++][FlightRPC] 将
ServerCallContext
参数添加到arrow::flight::ServerAuthHandler
方法 (#35378) - GH-35390 - [Python] 整合 Table 和 RecordBatch 中的一些 API (#35396)
- GH-35400 - [R] 从 utils 导入 download.file (#35401)
- GH-35403 - [文档] 支持 sphinx 6 用于构建文档 (#36296)
- GH-35411 - [MATLAB] 为数值数组创建一个模板化的 C++ 代理类 (#35479)
- GH-35415 - [Python] RecordBatch 字符串表示形式包括列预览 (#35416)
- GH-35417 - [GLib] 添加 GArrowRunEndEncodedDataType (#36444)
- GH-35418 - [GLib] 添加 GArrowRunEndEncodedArray (#36470)
- GH-35435 - [Ruby][Flight] 添加 ArrowFlight::Client#authenticate_basic (#35436)
- GH-35442 - [C++][FlightRPC] 将 ServerCallContext 而不是 CallHeaders 传递给 ServerMiddlewareFactory::StartCall() (#35454)
- GH-35480 - [MATLAB] 添加名为
arrow.array.Array
的抽象 MATLAB 基类 (#35491) - GH-35482 - [Go] 在
array.FixedSizeListBuilder.AppendNull
中将空值附加到值 (#35481) - GH-35485 - [CI][Python] Archery 格式化 Python C++ 代码库 (#35487)
- GH-35489 - [MATLAB] 将 CMake
build
目录添加到 MATLAB.gitignore
(#35493) - GH-35492 - [MATLAB]:添加 arrow.array.Float32Array MATLAB 类 (#35495)
- GH-35500 - [C++][Go][Java][FlightRPC] 添加对结果集过期的支持 (#36009)
- GH-35506 - [C++] 在 Substrait 中支持 First 和 Last 聚合器 (#35513)
- GH-35511 - [C++] Util:在
SwapEndianArrayData
中添加 memory_pool (#36431) - GH-35515 - [C++][Python] 添加不可分解的聚合 UDF (#35514)
- GH-35516 - [R] 将 11.0.0.3 添加到向后兼容性矩阵中 (#35517)
- GH-35537 - [MATLAB] 为数值数组创建共享测试类实用程序 (#35556)
- GH-35542 - [R] 实现模式提取函数 (#35543)
- GH-35545 - [R] 在 pkgdown 网站上重新组织参考页面 (#36171)
- GH-35550 - [MATLAB] 向 `arrow.array.Array` 添加公共 `toMATLAB` 方法,用于转换为 MATLAB 类型 (#35551)
- GH-35557 - [MATLAB] 添加无符号整数数组 MATLAB 类(即 `UInt8Array`、`UInt16Array`、`UInt32Array`、`UInt64Array`) (#35562)
- GH-35558 - [MATLAB] 添加有符号整数数组 MATLAB 类(即 `Int8Array`、`Int16Array`、`Int32Array`、`Int64Array`) (#35561)
- GH-35579 - [C++] 在 Parquet 扫描器中支持未命名的 FieldRefs (#35798)
- GH-35598 - [MATLAB] 向 `MATLAB arrow.array.
` 类添加公共 `Valid` 属性以查询空值(即有效位图支持) (#35655) - GH-35601 - [R][文档] 为 fileysystem.R 添加缺少的文档 (#35895)
- GH-35607 - [C++] 支持简单的 Substrait 聚合扩展 (#35608)
- GH-35609 - [文档] 启用文档子部分的构建 (#35610)
- GH-35611 - [C++] 删除 ListBuilder 和 BinaryBuilder 不必要的安全操作 (#35613)
- GH-35652 - [Go][计算] 允许使用 Go Compute 执行 Substrait 表达式 (#35654)
- GH-35659 - [Swift] 初始 Swift IPC 写入器 (#35660)
- GH-35669 - [C++] 更新到 double-conversion 3.3.0,激活新标志,删除补丁 (#36002)
- GH-35676 - [MATLAB] 添加一个 `InferNulls` 键值对,用于在构建 `arrow.array.Array` 期间控制空值推断 (#35827)
- GH-35686 - [Go] 向 TimestampBuilder 添加 AppendTime (#35687)
- GH-35693 - [MATLAB] 将 `Valid` 作为键值对添加到 `arrow.array.Float64Array` 构造函数中 (#35977)
- GH-35705 - [R] 将文档页面从 acero 重命名 (#36107)
- GH-35706 - [CI] 设置 pr_review_trigger.yml 的最小权限 (#35708)
- GH-35709 - [R][文档] 记录将数据传递给 duckdb 以进行窗口聚合 (#35882)
- GH-35711 - [Go] 向某些构建器添加 `Value` 和 `GetValueIndex` 方法 (#35744)
- GH-35729 - [C++][Parquet] 为 Parquet 中的 BloomFilter 实现批处理接口 (#35731)
- GH-35746 - [Parquet][C++][Python] 将默认 Parquet 版本切换到 2.6 (#36137)
- GH-35749 - [C++] 在计算内核中处理行程结束编码的过滤器 (#35750)
- GH-35752 - [CI][GLib][Ruby] 将 GITHUB_ACTIONS 环境变量传递给 Docker 容器 (#35753)
- GH-35754 - [CI][GLib] 不要构建静态 C++ 库 (#35755)
- GH-35757 - [C++][Parquet] 使用页面编码统计信息来构建编码 (#35758)
- GH-35765 - [C++] 将 vector_selection.cc 拆分为更多编译单元 (#35751)
- GH-35779 - [R][文档] 记录类窗口功能的解决方法 (#35702)
- GH-35783 - [JS] 更新依赖项 (#35784)
- GH-35786 - [C++] 添加 pairwise_diff 函数 (#35787)
- GH-35788 - [Swift] 错误修复并将读取器/写入器更改为用户 Result 类型 (#35774)
- GH-35803 - [文档] 为 Swift 在实现状态表中添加列 (#35862)
- GH-35817 - [文档][C++] 修复关于空处理的 value_counts/unique 文档 (#35818)
- GH-35828 - [Go] 为 `array.ApproxEqual` 添加 `array.WithUnorderedMapKeys` 选项 (#35823)
- GH-35847 - [C++][第三方] 将 xxhash 版本升级到 v0.8.1 (#35849)
- GH-35871 - [Go] 在 `array.ApproxEqual` 中考虑结构有效位图 (#35872)
- GH-35879 - [C++] 将捆绑的 google-cloud-cpp 升级到 2.12.0 (#36119)
- GH-35906 - [文档] 允许在未安装 pyarrow 的情况下构建文档 (#35907)
- GH-35909 - [Go] 弃用 `arrow.MapType.ValueField` 和 `arrow.MapType.ValueType` 方法 (#35899)
- GH-35914 - [MATLAB] 集成最新的 libmexclass 更改以支持错误处理 (#35918)
- GH-35915 - [Ruby] 添加对自动从 Hash 转换函数选项的支持 (#35927)
- GH-35922 - [C++] 放弃对 Debian GNU/Linux buster (10) 的支持 (#35923)
- GH-35926 - [C++][Parquet] 允许通过禁用统计信息来禁用 ColumnIndex (#35958)
- GH-35935 - [C++] 使用 `use_threads=false` 清理 Acero 计划的中断 (#35953)
- GH-35949 - [R] CSV 文件读取器选项类对象应打印所选值 (#35955)
- GH-35961 - [C++][FlightSQL] 接受 Protobuf 3.12.0 或更高版本 (#35962)
- GH-35969 - [Swift] 使用 ArrowType 代替 ArrowType.info 并添加 binary、time32 和 time64 类型 (#35985)
- GH-35974 - [Go] 如果导入 C Array Stream 失败,则不要 panic (#35978)
- GH-35975 - [Go] 支持导入 decimal256 (#35981)
- GH-35979 - [C++] 将 Acero 标量和哈希聚合重构到单独的文件中 (#35980)
- GH-35984 - [MATLAB] 为所有数值数组类添加空支持 (#36039)
- GH-35987 - [C++] 解除 brew protobuf 版本锁定 (#36087)
- GH-35987 - [C++] 将 brew protobuf 版本锁定到 21 (#36029)
- GH-35990 - [CI][C++][Windows] 不要将 -l 用于“choco list” (#35991)
- GH-36006 - [打包][RPM] 添加对 Amazon Linux 2023 的支持 (#36081)
- GH-36008 - [Ruby][Parquet] 添加 Parquet::ArrowFileReader#each_row_group (#36022)
- GH-36014 - [Go] 允许结构体中出现重复的字段名称 (#36015)
- GH-36023 - [CI][Ruby][发布] 抑制 verify-rc-ruby 中无意义的进度日志 (#36024)
- GH-36025 - [JS] 在 `verify-release-candidate.sh` 中允许 Node.js 18.14 或更高版本 (#36089)
- GH-36031 - [JS]:更新依赖项 (#36032)
- GH-36033 - [JS] 删除 BigInt 兼容性 (#36034)
- GH-36038 - [Python] 在 ExtensionType 类上实现 **reduce** (#36170)
- GH-36040 - [MATLAB] 添加 `arrow.array.BooleanArray` 类 (#36041)
- GH-36045 - [Python] 提高 pc.map_lookup / MapLookupOptions 的可用性 (#36387)
- GH-36047 - [C++][计算] 为 IndexIn 和 IsIn 添加对持续时间类型的支持 (#36058)
- GH-36050 - [文档][C] 修复 C 导出文档中的内存泄漏 (#36051)
- GH-36055 - [JS] 在 CI 中使用 Node.js 18 (#36147)
- GH-36056 - [CI] 为 GitHub Actions 启用 Dependabot (#36194)
- GH-36059 - [C++][计算] 为标量查找函数的哈希表预留空间 (#36067)
- GH-36070 - [Go][Flight] 添加 Flight 客户端 Cookie 中间件 (#36071)
- GH-36072 - [MATLAB] 添加 MATLAB `arrow.tabular.RecordBatch` 类 (#36190)
- GH-36074 - [C++] 阐明 ConcatenateTablesOptions::field_merge_options 的文档 (#36075)
- GH-36092 - [C++] 简化 as-of-join 节点中的并发 (#36094)
- GH-36095 - [Go] 为 `pqarrow.FileWriter.WriteBuffered` 添加文档 (#36163)
- GH-36096 - [Python] 在 Array.to_pandas 中调用 **from_arrow** (#36314)
- GH-36098 - [MATLAB] 将 C++ 代理构造函数更改为接受选项结构体,而不是包含参数的元胞数组 (#36108)
- GH-36105 - [Go] 在 csv 中支持 float16 (#36106)
- GH-36109 - [MATLAB] 如果所有数组元素均有效,则将 nullptr 存储为有效位图 (#36114)
- GH-36120 - [C#] 通过 C API 支持模式元数据 (#36122)
- GH-36128 - [C++][计算] 允许持续时间与所有整数类型相乘 (#36231)
- GH-36129 - [Python] 整合 Table 和 RecordBatch 中的通用 API (#36130)
- GH-36131 - [文档] 将 https://arrow.apache.org/julia/ 用于 Julia URL (#36156)
- GH-36141 - [Go] 在 csv 中支持大类型和固定类型 (#36142)
- GH-36151 - [Java] 在
ParallelSearcher
中为keyPosition
添加volatile
声明 (#36152) - GH-36157 - [C++][开发] 添加使用 python3 运行 IWYU 的支持 (#36159)
- GH-36166 - [C++][MATLAB] 添加将 UTF-8 字符串转换为 UTF-16 和将 UTF-16 字符串转换为 UTF-8 的实用程序 (#36167)
- GH-36173 - [C++] 为 UTF8StringToUTF16 添加单独的高位和低位代码点测试用例 (#36383)
- GH-36177 - [MATLAB] 将类型对象层次结构添加到 MATLAB 接口 (#36210)
- GH-36178 - [C++] 支持 ReadRangeCache 惰性模式的预取 (#36180)
- GH-36181 - [Go] 为所有构建器添加方法
AppendNulls
和AppendEmptyValues
(#36145) - GH-36198 - [Go] 删除已弃用的相等性检查 (#36169)
- GH-36203 - [C++] 支持 is_in 和 index_in 的双向转换 (#36204)
- GH-36207 - [MATLAB] 将 MATLAB 自动保存文件 (
.asv
) 添加到.gitignore
(#36208) - GH-36212 - [MATLAB] 更新
README.md
以提及对arrow.array.Array
类的支持 (#36213) - GH-36217 - [MATLAB] 添加 arrow.array.TimestampArray (#36333)
- GH-36218 - [CI][Go] 仅在主分支上运行基准测试步骤 (#36229)
- GH-36218 - [CI][Go] 仅在主分支上运行基准测试步骤 (#36219)
- GH-36220 - [CI] 仅在主分支上运行“Docker 推送”步骤 (#36221)
- GH-36227 - [C++] 新的 GcsOption 用于设置项目 ID (#36228)
- GH-36232 - [打包][Ubuntu] 放弃对 Ubuntu 22.10 (kinetic) 的支持 (#36237)
- GH-36233 - [打包][Ubuntu] 添加对 Ubuntu 23.04 (lunar) 的支持 (#36238)
- GH-36234 - [打包][Debian] 添加对 Debian GNU/Linux trixie (13) 的支持 (#36285)
- GH-36241 - [打包] 放弃对 Amazon Linux 2 的支持 (#36282)
- GH-36243 - [开发] 在合并过程中删除 PR 工作流标签 (#36244)
- GH-36249 - [MATLAB] 创建一个
MATLAB_ASSIGN_OR_ERROR
宏来镜像 C++ 的ARROW_ASSIGN_OR_RAISE
宏 (#36273) - GH-36250 - [MATLAB] 添加
arrow.array.StringArray
类 (#36366) - GH-36251 - [MATLAB] 向
arrow.array.Array
添加Type
属性 (#36270) - GH-36252 - [Python] 添加不可分解的哈希聚合 UDF (#36253)
- GH-36255 - [C++] 添加列表上“if_else”内核的基准测试 (#36256)
- GH-36264 - [R] 添加 scalar() 函数 (#36265)
- GH-36271 - [R] 分离 R6 类和便捷函数 (#36394)
- GH-36284 - [Python][Parquet] 在 Python API 中支持写入页面索引 (#36290)
- GH-36287 - [Ruby] 添加自动安装 arrow-c-glib conda 包的支持 (#36288)
- GH-36293 - [C++] 将 ipc_write_options.memory_pool 用于压缩缓冲区并在压缩后缩小 (#36294)
- GH-36297 - [C++][Parquet] 非二进制字典编码的基准测试 (#36298)
- GH-36299 - [R][CI] 删除 pkgdown 检查 CI 步骤 (#36300)
- GH-36309 - [C++] 添加在类列表类型标量之间进行转换的功能 (#36310)
- GH-36317 - [C++] 从 CleanListOffsets 返回 BufferVector (#36316)
- GH-36319 - [Go][Parquet] 改进的行组编写器错误消息 (#36320)
- GH-36337 - [Ruby] 放宽 Apache Arrow C++ 版本要求 (#36338)
- GH-36342 - [C++] 为 RecordBatch 添加缺少的移动语义 (#36343)
- GH-36345 - [C++] 在 IsIn 和 IndexIn 内核中优先使用 TypeError 而不是 Invalid (#36358)
- GH-36359 - [MATLAB] 为 RecordBatch 添加对时间戳数组的支持 (#36361)
- GH-36367 - [C++] 添加压缩范围实用程序 (#36393)
- GH-36375 - [Java] 在 ComplexWriter 中添加了创建 MapWriter 的功能。 (#36351)
- GH-36380 - [R] 创建便捷函数 arrow_array (#36381)
- GH-36384 - [Go] Schema: NumFields (#36365)
- GH-36402 - [CI][macOS] 忽略
brew update
失败 (#36403) - GH-36405 - [C++][ORC] 将 ORC 升级到 1.9.0 (#36406)
- GH-36407 - [C++] 添加 arrow::ipc::Listener::OnSchemaDecoded(schema, filtered_schema) (#36533)
- GH-36408 - [GLib][FlightSQL] 添加对 INSERT/UPDATE/DELETE 的支持 (#36409)
- GH-36414 - [C++] 添加缺少的 type_traits.h 谓词:is_var_length_list() (#36415)
- GH-36421 - [Java] 启用对读取 JSON 数据集的支持 (#36422)
- GH-36423 - [C++][Compute] 在
Expression::IsSatisfiable
中支持“or” (#36424) - GH-36450 - [CI][Python] 上传 Windows 的 wheel 工件 (#36466)
- GH-36479 - [C++][FlightRPC] 使用 find_package() 检测到的 gRPC 版本 (#36581)
- GH-36483 - [C++] 使
UTF8StringToUTF16
和UTF16StringToUTF8
接受string_views
(#36485) - GH-36492 - [CI][Python] 添加 Ubuntu 22.04 夜间构建 (#36480)
- GH-36513 - [开发][C#] 为 NuGet 添加 Dependabot 配置 (#36514)
- GH-36541 - [Python][CI] 在合并 GH-33321 后修复 nopandas 构建 (#36586)
- GH-36541 - [Python][CI] 确保“无 pandas”CI 构建没有安装 pandas(不要在 conda-python 镜像中安装文档需求) (#36542)
- GH-36544 - [Swift] 将一些 init 方法添加/更改为公共访问权限 (#36545)
- GH-36553 - [Python] 如果未构建某些子模块(cython 或 cpp),则改进错误消息 (#36554)
- GH-36556 - [CI][C++] 在 Valgrind 构建中启用 S3 (#36579)
- GH-36560 - [MATLAB] 从
arrow.array.<Numeric>Array
构造函数中删除 DeepCopy 键值对 (#36561) - GH-36568 - [Go] 在 ValueStr 中包含时间戳时区 (#36569)
- GH-36577 - [开发][C#] 为某些软件包使用
version-update:semver-major
(#36578) - GH-36582 - [CI][C++][Homebrew] 反向移植最新的公式更改 (#36583)
- GH-36599 - [MATLAB] 将 libmexclass 版本提升至 3465900 (#36600)
- GH-36744 - [Python][打包] 为 pyarrow 构建依赖项添加 cython<3 的上限 (#36743)
- GH-36746 - [R] 更新 12.0.1.1 版本的 NEWS.md (#36747)
- GH-36756 - [CI][Python] 在 verify-release-candidate 脚本上安装 Cython < 3.0 (#36757)
- GH-36805 - [R] 为 13.0.0 更新 NEWS.md (#36806)
- GH-36839 - [CI][文档] 更新 test-ubuntu-default-docs 以使用 GitHub Actions 而不是 Azure (#36840)
- GH-36947 - [CI] 将释放磁盘空间移动到 Jinja 宏中以便能够在文档作业中重用它 (#36948)
- PARQUET-2316 - [C++] 允许 parquet FileReader 中的 PreBuffer 部分化 (#36192)
- PARQUET-2323 - [C++] 使用位图存储预缓冲的列块 (#36649)