Apache Arrow 13.0.0 (2023 年 8 月 23 日)
这是一个主要版本,涵盖了超过 2 个月的开发工作。
下载
贡献者
此版本包含了来自 108 位不同贡献者的 608 次提交。
$ git shortlog -sn apache-arrow-12.0.1..apache-arrow-13.0.0
83 Sutou Kouhei
47 Raúl Cumplido
35 Nic Crane
26 Joris Van den Bossche
25 mwish
24 Weston Pace
20 sgilmore10
19 Felipe Oliveira Carvalho
17 Antoine Pitrou
16 Alenka Frim
15 Matt Topol
15 rtpsw
13 Igor Izvekov
13 Jin Shang
12 Dane Pitkin
12 Kevin Gurney
11 Alex Shcherbakov
11 David Li
11 Dewey Dunnington
9 Gang Wu
9 Jacob Wujciak-Jens
8 Ben Harkins
8 Herman Schaaf
7 david dali susanibar arce
6 Dominik Moritz
6 Will Jones
6 abandy
5 Curt Hagenlocher
5 Yevgeny Pats
5 dependabot[bot]
4 Li Jin
4 Matthias Loibl
4 Neal Richardson
3 Bryce Mecum
3 Jinpeng
3 eitsupi
2 Abe Tomoaki
2 Aleksei Smirnov
2 Benjamin Kietzman
2 Chunchun Ye
2 David Greiss
2 Davide Pasetto
2 Julien Jerphanion
2 Junming Chen
2 Laurent Goujon
2 Michael Lui
2 Simon Perkins
2 Spencer Nelson
2 henrymai
2 liujiacheng777
2 rtadepalli
2 zhjwpku
1 0x26res
1 Adam Reeve
1 Alexey Ozeritskiy
1 Aljaž Mur Eržen
1 Andrew Lamb
1 Anja Kefala
1 Arnaud Feldmann
1 Austin Dickey
1 Benson Muite
1 Bryan Cutler
1 Carlos O'Ryan
1 Chenxi LI
1 Chris Hoff
1 Diana Sulmone
1 Diogo Teles Sant'Anna
1 Dirk Eddelbuettel
1 Dongjoon Hyun
1 Dr. Jan-Philip Gehrcke
1 Elliott Brossard
1 Erez Rokah
1 Fokko Driesprong
1 Francis
1 Ian Cook
1 Ivan Chesnov
1 James Henderson
1 June Liu
1 Lei Hou
1 Mark Wolfe
1 Martin Traverse
1 Mats Kindahl
1 Matthew Roeschke
1 Nick Byrne
1 NoahFournier
1 Parth Chonkar
1 Philip
1 Rok Mihevc
1 Romain François
1 Rong Ma
1 Sergey Fedorov
1 Sven Rebhan
1 The Alchemist
1 Theodore Tsirpanis
1 Thor
1 Toby Dylan Hocking
1 Wenbo Hu
1 candiduslynx
1 clickingbuttons
1 jeremyosterhoudt
1 lord
1 lriggs
1 micah-white
1 panbingkun
1 ruoxi
1 sunpeng
1 takuya kodama
1 wenxlan
补丁提交者
以下 Apache 提交者将贡献的补丁合并到了仓库中。
$ git shortlog -sn --group=trailer:signed-off-by apache-arrow-12.0.1..apache-arrow-13.0.0
155 Sutou Kouhei
96 Antoine Pitrou
62 Matt Topol
44 Joris Van den Bossche
44 Nic Crane
34 David Li
29 Raúl Cumplido
27 Weston Pace
16 Jacob Wujciak-Jens
16 Will Jones
13 Li Jin
8 Dewey Dunnington
7 Eric Erhardt
6 Alenka Frim
5 AlenkaF
5 Dominik Moritz
4 Benjamin Kietzman
2 Andrew Lamb
2 Kevin Gurney
2 Matthew Topol
1 Gang Wu
1 Neal Richardson
变更日志
Apache Arrow 13.0.0 (2023-08-23 07:00:00)
Bug 修复
- GH-14969 - [R][文档] 启用 pkgdown 内置搜索 (#36374)
- GH-20385 - [C++][Parquet] 拒绝扩展类型的部分加载 (#33634)
- GH-23870 - [Python] 确保 parquet.write_to_dataset 不会为未观察到的字典(类别)值创建空文件 (#36465)
- GH-32832 - [Go] 支持使用 tinygo 构建 (#35723)
- GH-34017 - [Python][FlightRPC][文档] 修复 FlightStreamReader.read_chunk 的文档字符串 (#35583)
- GH-34293 - [Java] 在 Windows 上加载原生库时出错 (#34312)
- GH-34338 - [Java] 移除在 -ea 上自动启用 BaseAllocator.DEBUG 的功能 (#36042)
- GH-34351 - [C++][Parquet] 统计信息:添加详细文档和微小优化 (#35989)
- GH-34363 - [C++] 在 S3 上传中使用等大小部分以实现 R2 兼容性 (#35808)
- GH-34391 - [C++] Future as-of-join-node 在远距离时间上挂起 (#34392)
- GH-34523 - [C++] 避免混合捆绑的 Abseil 和系统 Abseil (#35387)
- GH-34656 - [CI][Python] 使用 gemfury 工具上传 wheels 而非 curl,以修复 Windows wheel 上传问题 (#35032)
- GH-34723 - [Java] 启用 Netty 分配器内存使用情况的日志跟踪 (#35314)
- GH-34752 - [C++] 添加对 LoongArch 的支持 (#34740)
- GH-34775 - [R] arrow_table: as.data.frame() 有时返回 tbl,有时返回 data.frame (#35173)
- GH-34884 - [Python] : 支持序列化 pyarrow.dataset PartitioningFactory 对象 (#36550)
- GH-34884 - [Python] : 支持序列化 pyarrow.dataset Partitioning 子类 (#36462)
- GH-34886 - [Python] 为 Table 和 RecordBatch 添加正确的 array numpy 转换 (#36242)
- GH-34897 - [R] 确保 RStringViewer 辅助类不拥有任何 Array 引用 (#35812)
- GH-34907 - [文档][R] 版本选择器报告发布版本为 dev (#35103)
- GH-35007 - [C++] 修复读取 stdin (#35006)
- GH-35015 - [Go] 修复 parquet 内存泄漏 (#35973)
- GH-35027 - [Go] : 在 FixedSizeBinaryBuilder Unmarshal 中使用 base64.StdEncoding (#35028)
- GH-35053 - [Java] 修复 MemoryUtil 支持 Java 21 的问题 (#36370)
- GH-35059 - [C++] 修复 run-end encoded 输入的 “hash_count” (#35129)
- GH-35101 - [C++] 更新 ArrowConfig.cmake.in 中已弃用的 LOCATION 目标属性 (#35109)
- GH-35107 - [FlightSQL] : 使用
uint8
指代 8 位无符号整数而非uint1
(#35108) - GH-35118 - [格式][FlightSQL] 更多使用
int32
指代 32 位整数而非int
(#35213) - GH-35118 - [FlightSQL] 使用
int32
指代 32 位整数而非int
(#35120) - GH-35140 - [R] 重写 configure 脚本并确保我们不使用不匹配的 libarrow (#35147)
- GH-35144 - [C++] 修复聚合节点输出顺序改变时损坏的单元测试 (#35145)
- GH-35177 - [文档][Python] 抑制 “WARNING: autosummary: failed to import serialize” (#35182)
- GH-35179 - [C++] 修复 Arrow::bundled_dependencies 的 IMPORTED_LOCATION 属性 (#35196)
- GH-35188 - [Go] 在 CSV Reader 中对扩展类型使用 AppendValueFromString (#35189)
- GH-35190 - [Go] 正确处理 CSV reader 中的 null 值 (#35191)
- GH-35193 - [Python][打包] 在 Windows wheels 上启用 GCS (#35255)
- GH-35202 - [Go][Parquet] 修复读取嵌套空列表时的 panic (#35276)
- GH-35234 - [Go] 修复 Callers 的 skip 参数 (#35231)
- GH-35240 - [Go][FlightRPC] 修复客户端中间件中的崩溃问题 (#35241)
- GH-35266 - [GLib][Parquet] 修复 GC 错误,子元数据中缺少父元数据引用 (#35286)
- GH-35266 - [CI][GLib][Parquet] 忽略 gparquet_column_chunk_metadata_equal() 测试 (#35278)
- GH-35267 - [C#] 序列化 FlightInfo 中的 TotalBytes 和 TotalRecords (#35222)
- GH-35270 - [C++] 在哈希连接内部使用 Buffer 代替原始缓冲区 (#35347)
- GH-35297 - [C++][IPC] 修复 map 字段的 schema 反序列化 (#35298)
- GH-35306 - 修复 Schema.Fields() 返回字段副本的问题 (#35307)
- GH-35310 - [Go] 从字符串转换 decimal128 值不正确 (#35311)
- GH-35316 - [C++][FlightSQL] 在 SQLite 示例服务器中使用 RowsToBatches() 代替 ArrayFromJSON() (#35322)
- GH-35326 - [Go] 修复
*array.List
和*array.LargeList
的ValueOffsets
实现 (#35327) - GH-35346 - [CI][Python] 将 gdb 从 env-file 移动到 dockerfile (#35348)
- GH-35352 - [Java] 修复“半复杂”类型的问题 (#35353)
- GH-35359 - [C++] 如果所有元素都为 null,FixedSizeListArray.flatten() 会出错 (#35674)
- GH-35360 - [C++] 在 ScalarHashImpl::ArrayHash() 中考虑 offset (#35814)
- GH-35363 - [C++] 修复 Substrait schema 名称以及分段聚合 (#35364)
- GH-35379 - [C++][FlightRPC] 添加 teardown 所需检查以避免错误时崩溃 (#35380)
- GH-35383 - [C++] 优先使用 max_concurrency 而非 executor capacity 以避免 segmentation fault (#35384)
- GH-35406 - [网站][文档] Arrow 文档页面缺少 logo
- GH-35413 - [Python] 为 pyarrow 公共 API 添加具体的浮点数组类型 (#35414)
- GH-35421 - [Go] 确保
array.X.ValueStr
和array.XBuilder.AppendValueFromString
之间的接口契约 (#35457) - GH-35425 - [R] R < 4.0 上的测试由于 data.frame 转换而失败 (#35432)
- GH-35438 - [文档] 修改源文档 (#35549)
-
GH-35445 - [R] 行为类似于 group_by(foo) > across(everything()) 与 dplyr 不同 (#35473) - GH-35448 - [C++] 修复 strptime 格式中 %z 的检测问题 (#35449)
- GH-35468 - [C++] 修复多批次的 Acero var/std (#35469)
- GH-35483 - [CI][C++] 为 Windows 添加 snprintf 头文件 (#35484)
- GH-35490 - [Python] Interchange 协议:更新字符串和 large_string 的测试 (#35504)
- GH-35501 - [C++] 修复 MSVC 中的错误 C2280 (#35683)
- GH-35503 - [CI][打包][C++] Snappy 补丁在 arm64 Windows wheel 构建中应用失败 (#35509)
- GH-35521 - [C++] 仅在 null 计数为 0 时对 null bitmap 进行哈希处理 (#35522)
- GH-35526 - [CI][C++] 修复 arrow::internal::IsNullRunEndEncoded 重复声明的问题 (#35527)
- GH-35528 - [Java] 修复 RangeEqualsVisitor 比较不同起始索引的 BitVector 的问题 (#35525)
- GH-35534 - [R] 确保缺失的分组变量被添加到变量列表的开头 (#36305)
- GH-35539 - [C++] 移除公共头文件中对内部头文件的使用 (#35592)
- GH-35553 - [JAVA] 修复 NettyArrowBuf 中的 unwrap() (#35554)
- GH-35571 - [C++][CI][Parquet] 在解密测试中将
EQ
更改为FLOAT_EQ
(#35605) - GH-35573 - [Python] pa.FixedShapeTensorArray.to_numpy_ndarray 在 sliced arrays 上失败 (#36164)
- GH-35576 - [C++] 使 Decimal{128,256}::FromReal 更精确 (#35997)
- GH-35588 - [Java] 为 null 值返回常量 hashCode,解决 #35588 (#35590)
- GH-35593 - [R] 使用 `[[` 和 `$` 尝试从 Datasets 中提取列时,结果混乱 (NULL)
- GH-35596 - [C++][CI] 使用 PCG 改进编译缓存 (#35597)
- GH-35599 - [Python] 规范固定形状张量扩展数组/类型不可序列化 (#35933)
- GH-35606 - [CI][C++][MinGW32] 为 decimal 测试使用更精确的浮点输入 (#35680)
- GH-35617 - [文档] C API 示例中 n_buffers 的当前使用 (#35626)
- GH-35618 - [C++][文档] 改进 Datum 的文档 (#35794)
- GH-35633 - [R] R 构建失败,出现错误 'Invalid: Timestamps already have a timezone: 'UTC'. Cannot localize to 'UTC'' (#35671)
- GH-35635 - [C++][CI] 在 PathFromUriHelper 中忽略主机时保留根目录,以修复 HDFS 测试 (#36063)
- GH-35636 - [C++] 从 compute-vector-test 中提取两个耗时的测试套件 (#36401)
- GH-35649 - [R] 始终从主 R 线程调用 DuckDB 的
RecordBatchReader::ReadNext()
(#36307) - GH-35651 - [C++] 抑制 gcc 13 中引入的自移动警告 (#36328)
- GH-35651 - [C++] 不要与 MinGW 一起使用自移动 (#35653)
- GH-35662 - [CI][C++][MinGW] 避免在 release 构建中 FormatTwoDigits() 的崩溃 (#35663)
- GH-35665 - [C++][Parquet] DeltaLengthByteArrayEncoder::Put 预留了太多空间 (#35670)
- GH-35675 - [C++] 不要将 ArraySpan 复制到 REE ArraySpan 中 (#35677)
- GH-35681 - [Ruby] 为空表添加 #select_columns 支持 (#35682)
- GH-35684 - [Go][Parquet] 修复 nil list array 的 nil 解引用 (#35690)
- GH-35710 - [R] 对新 configure 脚本的后续改进 (#36435)
- GH-35712 - [C++][CI] MacOS 在 arrow-array-test 中禁用 ASSERT_DEATH (#35724)
- GH-35728 - [CI][Python] 将 test_total_bytes_allocated 移动到子进程以提高可靠性 (#36355)
- GH-35733 - [Java] 修复 IntervalMonthDayNanoVector ctor 中的 minor type (#35734)
- GH-35736 - [C++] 修复编译 key_map_avx2.cc (#35737)
- GH-35760 - [C++] C Data Interface 辅助函数也应该在非 debug 模式下运行检查 (#36215)
- GH-35761 - [Go] 修复 TypeEqual 中的 map 比较 (#35762)
- GH-35763 - [Go] 修复列表的 TypeEqual (#35764)
- GH-35789 - [C++] 从 CumulativeSumOptions 中移除 check_overflow (#35790)
- GH-35809 - [C#] 改进 C Data Interface (#35810)
- GH-35819 - [GLib][Ruby] 引用 GArrowExecutePlan 的依赖对象 (#35963)
- GH-35833 - [C++] 添加对 Abseil 20230125 的支持 (#35881)
- GH-35837 - [C++] 如果在源节点应用背压时调用 StopProducing,Acero 将挂起 (#35902)
- GH-35838 - [C++] 为 asof join node 添加背压测试 (#35874)
- GH-35838 - [C++] 修复 asof join 背压 (#35878)
- GH-35853 - [Python] 修复 NumPy NEP50 的弃用警告 (#35854)
- GH-35858 - [Python] 修复 PR GH-36011 中的 linting 问题 (#36046)
- GH-35858 - [Python] 禁止 None schema parquet writer (#36011)
- GH-35859 - [Python] 实际将默认行组大小更改为 1Mi (#36012)
- GH-35866 - [Go] 在
arrow.NestedType.Fields()
实现中提供副本 (#35867) - GH-35868 - [C++] asof-join-node-test 中偶尔出现 TSAN 失败 (#35904)
- GH-35869 - [R][发布] 维护分支 12.0.1 上 test-r-devdocs 出现 Undefined symbol _ZN5arrow6Status14AddContextLineEPKciS2_
- GH-35870 - [C++] 添加对使用 CMAKE_CXX_FLAGS_DEBUG 更改优化标志的支持 (#35924)
- GH-35891 - [文档][Python] 更新 Parquet C++ 仓库链接 (#35892)
- GH-35911 - [Go] 修复 decimal256Traits 的 CastToBytes 方法 (#35912)
- GH-35943 - [Dev] 确保 PR body 为空时 link issue 工作正常 (#36460)
- GH-35948 - [Go] 在 JSON 序列化数组时,仅将
int8
和unit8
转换为float64
(#35950) - GH-35952 - [R] 确保 schema metadata 可以实际设置为命名字符向量 (#35954)
- GH-35960 - [Java] 检测分配中的溢出 (#36185)
- GH-35965 - [Go] 修复
Decimal256DictionaryBuilder
(#35966) - GH-35982 - [Go] 修复 go1.18 构建中断问题 (#35983)
- GH-35988 - [C#] C data interface 实现可能在导入时发生内存泄漏 (#35996)
- GH-36003 - [打包][RPM] RPM 作业存在重复的 artifact pattern (#36004)
- GH-36013 - [C++] 禁用 Protobuf 3.22+ 的捆绑 OpenTelemetry (#36016)
- GH-36052 - [Go][Parquet] 386 的交叉构建失败 (#36066)
- GH-36053 - [C++] 汇总变量时,随机出现 NA,而数据子集中没有 NA (#36368)
- GH-36076 - [C++] 移除已弃用的 cli 标志 (#36077)
- GH-36082 - [发布] post-11-bump-versions.sh 在 main 分支上对 deb minor/patch 版本不做任何更改 (#36083)
- GH-36090 - [C++] 为 Acero 和 Datasets 添加测试库 (#36206)
- GH-36117 - [C++] 确保创建 BUILD_OUTPUT_ROOT_DIRECTORY (#36160)
- GH-36121 - [R] 对
set_io_thread_count()
使用num_threads
< 2 发出警告 (#36304) - GH-36168 - [C++][Python] 支持 Arrow list 到 pandas 的 halffloat 转换 (#35944)
- GH-36172 - [R] Windows devdocs 构建失败,因为它使用了未构建 JSON 功能的 libarrow (#36174)
- GH-36176 - [C++] 修复单键 Table 排序的回归问题 (#36179)
- GH-36182 - [Gandiva][C++] 修复 substring_index 函数在 index 为负数时的错误 (#36184)
- GH-36200 - [CI][文档] 避免 “No space left on device” 错误 (#36230)
- GH-36201 - [Python][CI] test_total_bytes_allocated 在 manylinux 的 arm64 wheels 上失败
- GH-36209 - [Java] 由于安全漏洞升级 Netty (#36211)
- GH-36214 - [C++] 在可能的情况下,将
FieldPath::Hash
指定为模板参数 (#36222) - GH-36224 - [CI] 更新 GitHub 脚本中的 rest api 调用 (#36225)
- GH-36239 - [CI][C++] 添加对 ARROW__FLAGS_ 的多个标志的支持 (#36281)
- GH-36245 - [C++] gcc 13 编译错误
- GH-36257 - [CI][Dev][Archery] bot 需要 pygithub 1.59.0 或更高版本 (#36467)
- GH-36259 - [R] as_schema 描述文档不正确 (#36260)
- GH-36311 - [C++] 修复
utf8_slice_codeunits
中的整数溢出 (#36575) - GH-36327 - [C++] 修复 Valgrind 失败问题 (#36461)
- GH-36329 - [C++][CI] 在 macOS 上使用 OpenSSL 3 (#36336)
- GH-36331 - [C++][CI] AsofJoinTest 中偶发的测试失败 (#36356)
- GH-36340 - [Java] 解决 allocator logger 线程中的竞态条件 (#36341)
- GH-36346 - [C++] 安全的 S3 finalization (#36442)
- GH-36349 - [Python][CI] 在 hypothesis 测试中避免使用 'build/etc/localtime' 时区 (#36391)
- GH-36352 - [Python] 为 GcsFileSystem 选项添加 project_id (#36376)
- GH-36353 - [R] 修复 package version 引用,使其仅为文本而非数字 (#36364)
- GH-36369 - [C++][FlightRPC] 修复 FlightClient::Authenticate*() 中的挂起 bug (#36372)
- GH-36396 - [R] array tests 中调用的函数不存在 (#36397)
- GH-36404 - [CI][C++][Gandiva] JNI 构建在 arm64 macOS 上的崩溃测试
- GH-36446 - [C++] ConcatenateImpl 中的次要样式改进 (#36463)
- GH-36447 - [C++][CI] arrow-s3fs-test 在一些 nightly job 中失败
- GH-36448 - [C++][CI] vcpkg nightly job 构建 scalar_test.cc 失败
- GH-36449 - [C++][CI] Python 作业不使用 -g1 (#36453)
- GH-36451 - [CI][C++] 修复 Fedora 35 上的编译失败 (#36457)
- GH-36452 - [CI][C++] 测试 C++20 与兼容编译器的支持 (#36454)
- GH-36456 - [R] 使用 autobrew 时链接到正确版本的 OpenSSL (#36551)
- GH-36475 - [C++][CI] 修复 Flight feature verification (#36473)
- GH-36476 - [C++][FlightRPC] 修复 FlightInfo 中未初始化的字段 (#36484)
- GH-36477 - [CI][macOS] 在 crossbow 任务中忽略 brew update 失败 (#36478)
- GH-36482 - [C++][CI] 修复 AsofJoinBasicTest 中偶发的测试失败 (#36499)
- GH-36498 - [Python][CI] Hypothesis nightly test 失败,出现 pytz.exceptions.UnknownTimeZoneError: 'Factory' (#36508)
- GH-36500 - [CI][Java][JAR] 移除 Homebrew 的 protobuf (#36515)
- GH-36501 - [CI][Java][JAR] 确保移除 Homebrew 的 gRPC 包 (#36516)
- GH-36523 - [C++] 修复 TSan 检测到的 S3 中的锁排序问题 (#36536)
- GH-36524 - [GLib] 抑制 pessimizing-move 警告 (#36531)
- GH-36537 - [Python] 确保 dataset writer 遵循默认 Parquet 版本 2.6 (#36538)
- GH-36543 - [CI][文档] 使用 -g1 而非 -g 构建文档 (#36576)
- GH-36598 - [C++][MinGW] 修复 Protobuf 23.4 构建失败问题 (#36606)
- GH-36629 - [CI][Python] 由于我们在 arrow->pandas 转换中对非纳秒的更改,跳过 dask 测试 (#36630)
- GH-36641 - [C++] 移除非 acero 文件中对 acero 的引用 (#36650)
- GH-36659 - [Python] 修复 pyarrow.dataset.Partitioning.eq 与其他类型比较时的问题 (#36661)
- GH-36669 - [Go] 防止 C Data 结构中的垃圾数据 (#36670)
- GH-36686 - [C++] 将 CMAKE_OSX_SYSROOT 传递给外部项目 (#36706)
- GH-36687 - [R] 在 autobrew formula 中添加正确的 branch 名称以便本地测试 (#36689)
- GH-36707 - [C++] 对 OPENSSL_ROOT_DIR 也使用 ARROW_PACKAGE_PREFIX (#36710)
- GH-36812 - [C#] 修复 C API 支持,使其与 .NET desktop framework 一起工作 (#36813)
- GH-36832 - [打包][RPM] 移除不必要的 Requires (#36833)
- GH-36892 - [C++] 修复
FieldPath::Get
中的性能回归问题 (#37032) - GH-36913 - [C++] 跳过空缓冲区的连接以修复 UBSan 错误 (#36914)
- GH-36928 - [Java] 使其与 netty 最新版本 4.1.96 良好运行 (#36926)
- GH-36969 - [R] 在 gcc-13 上执行捆绑构建时,默认禁用 GCS (#37147)
- GH-37019 - [R] read_parquet() 等文档需要更新 (#37020)
- GH-37197 - [Java][CI][打包] 在 java-jars GitHub job 上释放一些磁盘空间 (#37198)
- GH-37201 - [CI][打包][Java] java-jars job 在 macOS aarch_64 上失败
新特性和改进
- GH-14790 - [Dev] 避免 PRs 上带有 Closes issue id 的额外评论 (#35811)
- GH-14946 - [C++] 添加 flattening FieldPath/FieldRef::Get 方法 (#35197)
- GH-15187 - [Java] 将
reader
初始化改为惰性加载,并添加新的getTransferPair()
函数接受Field
类型参数 (#34424) - GH-18547 - [Java] 支持在 ArrowStreamWriter 中重新发送字典 (#35920)
- GH-20047 - [MATLAB] 在 Windows 上为 MATLAB Interface 启用 GitHub Actions CI (#35792)
- GH-21761 - [Python] 接受 pyarrow scalars 作为 array 构造函数的参数 (#36162)
- GH-26153 - [C++] 共享 RecordBatchStreamReader 和 StreamDecoder 的通用代码 (#36344)
- GH-29781 - [C++][Parquet] 默认使用符合标准的嵌套类型 (#35146)
- GH-29887 - [C++] 实现 dictionary array 排序 (#35280)
- GH-31521 - [C++][Flight] 将 Flight SQL 客户端迁移到 Result (#36559)
- GH-32190 - [C++][Compute] 实现 cumulative prod, max 和 min 函数 (#36020)
- GH-32282 - [R] 更新 case_when() 绑定以匹配 dplyr 中的更改 (#35502)
- GH-32335 - [C++][文档] 添加 Acero 的设计文档 (#35320)
- GH-32605 - [C#] 扩展 validity buffer api (#35342)
- GH-32605 - [C#] 扩展 ArrowBuffer.BitmapBuilder 以提高 array 连接的性能 (#13810)
- GH-32739 - [CI][文档] 文档 Docs PR Preview (#35614)
- GH-32763 - [C++] 为 fetch & sort 添加 FromProto (#34651)
- GH-33206 - [C++] 添加对 StructArray 排序和嵌套排序键的支持 (#35727)
- GH-33321 - [Python] 支持转换为 pandas >= 2.0 的非纳秒 datetime64 (#35656)
- GH-33517 - [C++][Flight] 在 CI 上测试 UCX (#14667)
- GH-33804 - [Python] 添加对 manylinux_2_28 wheel 的支持 (#34818)
- GH-33854 - [MATLAB] 在 MATLAB interface 中添加基本的 libmexclass 集成代码 (#34563)
- GH-33856 - [C#] 为 C# 实现 C Data Interface (#35496)
- GH-33980 - [文档][Python] 文档 DataFrame Interchange Protocol 的实现和使用 (#35835)
- GH-33987 - [R] 支持新的 dplyr .by/by 参数 (#35667)
- GH-34216 - [Python] 支持用 Python 读取 JSON Datasets (#34586)
- GH-34223 - [Java] Java Substrait Consumer JNI 调用 ACERO C++ (#34227)
- GH-34375 - [C++][Parquet] page index 启用时忽略 page header 统计信息 (#35455)
- GH-34386 - [C++] 添加 PathFromUriOrPath 方法 (#34420)
- GH-34436 - [R] JSON Dataset 绑定 (#35055)
- GH-34509 - [C++][Parquet] 次要:更新 ArrowReaderProperties::batch_size 的措辞 (#36486)
- GH-34722 - [C++][Parquet] 次要:更新 Parquet NextPage 的措辞 (#35368)
- GH-34729 - [C++][Python] 增强 Arrow<->Pandas map/pydict 支持 (#34730)
- GH-34749 - [Java] 使 Zstd 压缩级别可配置 (#34873)
- GH-34787 - [Python] ChunkedArray.to_numpy 接受 zero_copy_only=False (#35582)
- GH-34788 - [Python][打包][CI] 移除对 Python 3.7 的支持 (#36061)
- GH-34852 - [C++][Go][Java][FlightRPC] 添加有序数据支持 (#35178)
- GH-34858 - [Swift] 初步 reader 实现 (#34842)
- GH-34868 - [Python] 在类之间共享 docstrings (#34894)
- GH-34911 - [C++] 添加 first 和 last 聚合器 (#34912)
- GH-34918 - [C++] 更新 vendored double-conversion 3.2.1 (#34919)
- GH-34921 - [C++][Python][Java] 要求 CMake 3.16 或更高版本 (#35921)
- GH-34949 - [C++][Parquet] 按列启用 page index (#35230)
- GH-34971 - [格式] 添加 C Data Interface 的非 CPU 版本 (#34972)
- GH-34979 - [Python] 为 Table 和 RecordBatch 创建基类 (#34980)
- GH-35004 - [C++] 移除 RelationInfo (#35005)
- GH-35033 - [Java][Datasets] 添加 Java 对多文件 datasets 的支持 (#35034)
- GH-35035 - [R] 为 Schemas 实现 names<- (#35172)
- GH-35067 - [JavaScript] signed
BigNum
的 toString (#35067) - GH-35084 - [文档][格式] 添加如何更改格式规范 (#35174)
- GH-35099 - [CI][打包] 升级 vcpkg 到 2023.04.15 版本 (#35430)
- GH-35112 - [Python] 在 Python MapType 中公开 keys_sorted (#35113)
- GH-35124 - [C++] 输出连接结果时避免不必要的复制 (#35114)
- GH-35125 - [C++][Acero] 在 QueryOptions 中添加一个自定义的 io-executor (#35464)
- GH-35130 - [文档] 记录如何成为协作者以获得分诊角色 (#36445)
- GH-35134 - [C++] 在 double-conversion 库周围添加
arrow_vendored
命名空间 (#35135) - GH-35136 - [Go][FlightSQL] 支持未实现
CreatePreparedStatement
的后端 (#35137) - GH-35162 - [Go] Float16 算术运算 (#35163)
- GH-35164 - [Go] 十进制数据类型的附加方法 (#35165)
- GH-35168 - [CI][打包][Conan] 合并上游更改 (#35169)
- GH-35171 - [C++][Parquet] 实现数据页 v2 的 CRC (#35242)
- GH-35180 - [R] 实现 cumsum 函数的绑定 (#35339)
- GH-35212 - [Go] 添加使用 ARROW_CHECKED_MAX_RETAINED_FRAMES 显示完整调用堆栈的功能 (#35215)
- GH-35228 - [C++][Parquet] 小改动:修复 Parquet Reader 中的注释拼写错误 (#35229)
- GH-35245 - [Java][Dataset][Linux] 启用 GCS (#35246)
- GH-35247 - [C++] 添加 Arrow Substrait 对 stddev/variance 的支持 (#35249)
- GH-35250 - [Python] 添加将 datetime 列转换为 pandas 的测试 (#35546)
- GH-35256 - [Go] 为 Metadata 添加 ToMap 方法 (#35257)
- GH-35264 - [Python] Interchange 协议:测试清理 (#35530)
- GH-35275 - [Java] 确保 VectorSchemaRoot slice 返回一个新的 root (#35476)
- GH-35279 - [C++][Parquet] 工具:增强 Parquet 打印统计信息 (#35262)
- GH-35282 - [C++] 启用模糊测试时自动启用 brotli (#35283)
- GH-35290 - [JS] 更新依赖项 (#35291)
- GH-35302 - [Go] 改进 pqarrow 中不支持的类型错误消息 (#35303)
- GH-35304 - [C++][ORC] 支持属性转换 (#35499)
- GH-35315 - [C++][CMake] 为 Flight SQL 添加预设 (#35317)
- GH-35335 - [Python][文档] 修复
map_
的 docstring (#35336) - GH-35361 - [C++] 从 cpp/build-support/run-test.sh 移除 Perl 依赖项 (#35362)
- GH-35375 - [C++][FlightRPC] 添加
arrow::flight::ServerCallContext::incoming_headers()
(#35376) - GH-35377 - [C++][FlightRPC] 为
arrow::flight::ServerAuthHandler
方法添加ServerCallContext
参数 (#35378) - GH-35390 - [Python] 整合 Table 和 RecordBatch 中的一些 API (#35396)
- GH-35400 - [R] 从 utils 导入 download.file (#35401)
- GH-35403 - [文档] 支持 sphinx 6 构建文档 (#36296)
- GH-35411 - [MATLAB] 为 Numeric Arrays 创建模板化的 C++ 代理类 (#35479)
- GH-35415 - [Python] RecordBatch 字符串表示包含列预览 (#35416)
- GH-35417 - [GLib] 添加 GArrowRunEndEncodedDataType (#36444)
- GH-35418 - [GLib] 添加 GArrowRunEndEncodedArray (#36470)
- GH-35435 - [Ruby][Flight] 添加 ArrowFlight::Client#authenticate_basic (#35436)
- GH-35442 - [C++][FlightRPC] 将 ServerCallContext 传递给 ServerMiddlewareFactory::StartCall() 而不是 CallHeaders (#35454)
- GH-35480 - [MATLAB] 添加名为
arrow.array.Array
的抽象 MATLAB 基类 (#35491) - GH-35482 - [Go] 在
array.FixedSizeListBuilder.AppendNull
中将 null 追加到值 (#35481) - GH-35485 - [CI][Python] Archery 格式化 Python C++ 代码库 (#35487)
- GH-35489 - [MATLAB] 将 CMake
build
目录添加到 MATLAB.gitignore
(#35493) - GH-35492 - [MATLAB] : 添加 arrow.array.Float32Array MATLAB 类 (#35495)
- GH-35500 - [C++][Go][Java][FlightRPC] 添加对结果集过期的支持 (#36009)
- GH-35506 - [C++] 在 Substrait 中支持 First 和 Last 聚合器 (#35513)
- GH-35511 - [C++] Util:在
SwapEndianArrayData
中添加 memory_pool (#36431) - GH-35515 - [C++][Python] 添加不可分解的聚合 UDF (#35514)
- GH-35516 - [R] 将 11.0.0.3 添加到向后兼容性矩阵 (#35517)
- GH-35537 - [MATLAB] 为 numeric arrays 创建共享测试类工具 (#35556)
- GH-35542 - [R] 实现 schema 提取函数 (#35543)
- GH-35545 - [R] 在 pkgdown 站点上重新组织参考页面 (#36171)
- GH-35550 - [MATLAB] 为
arrow.array.Array
添加公共toMATLAB
方法,用于转换为 MATLAB 类型 (#35551) - GH-35557 - [MATLAB] 添加无符号整数数组 MATLAB 类(即
UInt8Array
,UInt16Array
,UInt32Array
,UInt64Array
) (#35562) - GH-35558 - [MATLAB] 添加有符号整数数组 MATLAB 类(即
Int8Array
,Int16Array
,Int32Array
,Int64Array
) (#35561) - GH-35579 - [C++] 在 Parquet 扫描器中支持非命名 FieldRefs (#35798)
- GH-35598 - [MATLAB] 为
MATLAB arrow.array.<Array>
类添加一个公共Valid
属性,用于查询 Null 值(即支持有效性位图) (#35655) - GH-35601 - [R][文档] 为 fileysystem.R 添加缺失的文档 (#35895)
- GH-35607 - [C++] 支持简单的 Substrait 聚合扩展 (#35608)
- GH-35609 - [文档] 启用构建文档的子部分 (#35610)
- GH-35611 - [C++] 移除 ListBuilder 和 BinaryBuilder 中不必要的安全操作 (#35613)
- GH-35652 - [Go][Compute] 允许使用 Go Compute 执行 Substrait Expressions (#35654)
- GH-35659 - [Swift] 初始 Swift IPC writer (#35660)
- GH-35669 - [C++] 更新到 double-conversion 3.3.0,激活新标志,移除补丁 (#36002)
- GH-35676 - [MATLAB] 为
arrow.array.Array
构造期间控制 null 值推断添加InferNulls
名称-值对 (#35827) - GH-35686 - [Go] 为 TimestampBuilder 添加 AppendTime (#35687)
- GH-35693 - [MATLAB] 在
arrow.array.Float64Array
构造函数上添加Valid
作为名称-值对 (#35977) - GH-35705 - [R] 将文档页面从 acero 重命名 (#36107)
- GH-35706 - [CI] 在 pr_review_trigger.yml 上设置最小权限 (#35708)
- GH-35709 - [R][文档] 记录将数据传递给 duckdb 进行窗口聚合 (#35882)
- GH-35711 - [Go] 为某些构建器添加
Value
和GetValueIndex
方法 (#35744) - GH-35729 - [C++][Parquet] 在 Parquet 中实现 BloomFilter 的批处理接口 (#35731)
- GH-35746 - [Parquet][C++][Python] 将默认 Parquet 版本切换到 2.6 (#36137)
- GH-35749 - [C++] 在计算核中处理 run-end encoded 过滤器 (#35750)
- GH-35752 - [CI][GLib][Ruby] 将 GITHUB_ACTIONS 环境变量传递给 Docker 容器 (#35753)
- GH-35754 - [CI][GLib] 不要构建静态 C++ 库 (#35755)
- GH-35757 - [C++][Parquet] 使用 page-encoding-stats 构建编码 (#35758)
- GH-35765 - [C++] 将 vector_selection.cc 拆分为更多编译单元 (#35751)
- GH-35779 - [R][文档] 记录窗口类功能的临时解决方案 (#35702)
- GH-35783 - [JS] 更新依赖项 (#35784)
- GH-35786 - [C++] 添加 pairwise_diff 函数 (#35787)
- GH-35788 - [Swift] 错误修复并将 reader/writer 更改为使用 Result 类型 (#35774)
- GH-35803 - [文档] 为 Swift 的实现状态表添加列 (#35862)
- GH-35817 - [文档][C++] 修复 value_counts/unique 文档中关于 null 处理的部分 (#35818)
- GH-35828 - [Go] 为
array.ApproxEqual
添加array.WithUnorderedMapKeys
选项 (#35823) - GH-35847 - [C++][第三方库] 将 xxhash 版本提升到 v0.8.1 (#35849)
- GH-35871 - [Go] 在
array.ApproxEqual
中考虑 struct 有效性位图 (#35872) - GH-35879 - [C++] 将捆绑的 google-cloud-cpp 提升到 2.12.0 (#36119)
- GH-35906 - [文档] 启用在未安装 pyarrow 的情况下构建文档 (#35907)
- GH-35909 - [Go] 弃用
arrow.MapType.ValueField
和arrow.MapType.ValueType
方法 (#35899) - GH-35914 - [MATLAB] 集成最新的 libmexclass 更改以支持错误处理 (#35918)
- GH-35915 - [Ruby] 添加自动从 Hash 转换函数选项的支持 (#35927)
- GH-35922 - [C++] 停止支持 Debian GNU/Linux buster (10) (#35923)
- GH-35926 - [C++][Parquet] 允许通过禁用统计信息来禁用 ColumnIndex (#35958)
- GH-35935 - [C++] 使用
use_threads=false
干净地中断 Acero 计划 (#35953) - GH-35949 - [R] CSV File reader options 类对象应打印选定的值 (#35955)
- GH-35961 - [C++][FlightSQL] 接受 Protobuf 3.12.0 或更高版本 (#35962)
- GH-35969 - [Swift] 使用 ArrowType 而不是 ArrowType.info 并添加 binary, time32 和 time64 类型 (#35985)
- GH-35974 - [Go] 导入 C Array Stream 失败时不要 panic (#35978)
- GH-35975 - [Go] 支持导入 decimal256 (#35981)
- GH-35979 - [C++] 将 Acero scalar 和 hash 聚合重构到单独的文件中 (#35980)
- GH-35984 - [MATLAB] 为所有 numeric array 类添加 null 支持 (#36039)
- GH-35987 - [C++] 解除对 brew protobuf 版本的固定 (#36087)
- GH-35987 - [C++] 将 brew protobuf 版本固定到 21 (#36029)
- GH-35990 - [CI][C++][Windows] “choco list” 不要使用 -l 选项 (#35991)
- GH-36006 - [打包][RPM] 添加对 Amazon Linux 2023 的支持 (#36081)
- GH-36008 - [Ruby][Parquet] 添加 Parquet::ArrowFileReader#each_row_group (#36022)
- GH-36014 - [Go] 允许 struct 中存在重复字段名 (#36015)
- GH-36023 - [CI][Ruby][Release] 抑制 verify-rc-ruby 中无意义的进度日志 (#36024)
- GH-36025 - [JS] 允许在
verify-release-candidate.sh
中使用 Node.js 18.14 或更高版本 (#36089) - GH-36031 - [JS] : 更新依赖项 (#36032)
- GH-36033 - [JS] 移除 BigInt 兼容性 (#36034)
- GH-36038 - [Python] 在 ExtensionType 类上实现 reduce (#36170)
- GH-36040 - [MATLAB] 添加
arrow.array.BooleanArray
类 (#36041) - GH-36045 - [Python] 改进 pc.map_lookup / MapLookupOptions 的可用性 (#36387)
- GH-36047 - [C++][Compute] 为 IndexIn 和 IsIn 添加对 duration 类型的支持 (#36058)
- GH-36050 - [文档][C] 修复 C 导出文档中的内存泄漏 (#36051)
- GH-36055 - [JS] 在 CI 中使用 Node.js 18 (#36147)
- GH-36056 - [CI] 为 GitHub Actions 启用 Dependabot (#36194)
- GH-36059 - [C++][Compute] 为 scalar lookup 函数保留哈希表空间 (#36067)
- GH-36070 - [Go][Flight] 添加 Flight Client Cookie 中间件 (#36071)
- GH-36072 - [MATLAB] 添加 MATLAB
arrow.tabular.RecordBatch
类 (#36190) - GH-36074 - [C++] 澄清 ConcatenateTablesOptions::field_merge_options 的文档 (#36075)
- GH-36092 - [C++] 简化 as-of-join 节点中的并发处理 (#36094)
- GH-36095 - [Go] 为
pqarrow.FileWriter.WriteBuffered
添加文档 (#36163) - GH-36096 - [Python] 在 Array.to_pandas 中调用 from_arrow (#36314)
- GH-36098 - [MATLAB] 将 C++ 代理构造函数更改为接受 options struct,而不是包含参数的 cell array (#36108)
- GH-36105 - [Go] 在 csv 中支持 float16 (#36106)
- GH-36109 - [MATLAB] 如果所有数组元素都有效,则将 nullptr 存储为有效性位图 (#36114)
- GH-36120 - [C#] 通过 C API 支持 schema 元数据 (#36122)
- GH-36128 - [C++][Compute] 允许 duration 类型与所有整数类型相乘 (#36231)
- GH-36129 - [Python] 整合 Table 和 RecordBatch 中的通用 API (#36130)
- GH-36131 - [文档] Julia URL 使用 https://arrow.apache.org/julia/ (#36156)
- GH-36141 - [Go] 在 csv 中支持 large 和 fixed 类型 (#36142)
- GH-36151 - [Java] 在
ParallelSearcher
的keyPosition
中添加volatile
声明 (#36152) - GH-36157 - [C++][开发] 添加使用 python3 运行 IWYU 的支持 (#36159)
- GH-36166 - [C++][MATLAB] 添加用于将 UTF-8 字符串转换为 UTF-16 和将 UTF-16 字符串转换为 UTF-8 的工具 (#36167)
- GH-36173 - [C++] 为 UTF8StringToUTF16 添加单独的高低码点测试用例 (#36383)
- GH-36177 - [MATLAB] 将 Type 对象层次结构添加到 MATLAB 接口 (#36210)
- GH-36178 - [C++] 支持 ReadRangeCache 惰性模式的预取 (#36180)
- GH-36181 - [Go] 为所有构建器添加
AppendNulls
和AppendEmptyValues
方法 (#36145) - GH-36198 - [Go] 移除已弃用的相等性检查 (#36169)
- GH-36203 - [C++] 支持 is_in 和 index_in 的双向类型转换 (#36204)
- GH-36207 - [MATLAB] 将 MATLAB autosave 文件 (
.asv
) 添加到.gitignore
(#36208) - GH-36212 - [MATLAB] 更新
README.md
以提及对arrow.array.Array
类的支持 (#36213) - GH-36217 - [MATLAB] 添加 arrow.array.TimestampArray (#36333)
- GH-36218 - [CI][Go] 只在 main 分支上运行基准测试步骤 (#36229)
- GH-36218 - [CI][Go] 只在 main 分支上运行基准测试步骤 (#36219)
- GH-36220 - [CI] 只在 main 分支上运行“Docker Push”步骤 (#36221)
- GH-36227 - [C++] 新的 GcsOption 用于设置 project id (#36228)
- GH-36232 - [打包][Ubuntu] 停止支持 Ubuntu 22.10 (kinetic) (#36237)
- GH-36233 - [打包][Ubuntu] 添加对 Ubuntu 23.04 (lunar) 的支持 (#36238)
- GH-36234 - [打包][Debian] 添加对 Debian GNU/Linux trixie (13) 的支持 (#36285)
- GH-36241 - [打包] 停止支持 Amazon Linux 2 (#36282)
- GH-36243 - [开发] 合并时移除 PR workflow label (#36244)
- GH-36249 - [MATLAB] 创建一个
MATLAB_ASSIGN_OR_ERROR
宏,以镜像 C++ 的ARROW_ASSIGN_OR_RAISE
宏 (#36273) - GH-36250 - [MATLAB] 添加
arrow.array.StringArray
类 (#36366) - GH-36251 - [MATLAB] 为
arrow.array.Array
添加Type
属性 (#36270) - GH-36252 - [Python] 添加不可分解的哈希聚合 UDF (#36253)
- GH-36255 - [C++] 添加列表上 “if_else” 核的基准测试 (#36256)
- GH-36264 - [R] 添加 scalar() 函数 (#36265)
- GH-36271 - [R] 分离 R6 类和便利函数 (#36394)
- GH-36284 - [Python][Parquet] 在 Python API 中支持写入页面索引 (#36290)
- GH-36287 - [Ruby] 添加自动安装 arrow-c-glib conda package 的支持 (#36288)
- GH-36293 - [C++] 对压缩缓冲区使用 ipc_write_options.memory_pool 并在压缩后收缩 (#36294)
- GH-36297 - [C++][Parquet] 非二进制字典编码的基准测试 (#36298)
- GH-36299 - [R][CI] 移除 pkgdown check CI 步骤 (#36300)
- GH-36309 - [C++] 添加在列表状类型的标量之间进行类型转换的功能 (#36310)
- GH-36317 - [C++] 从 CleanListOffsets 返回一个 BufferVector (#36316)
- GH-36319 - [Go][Parquet] 改进 row group writer 错误消息 (#36320)
- GH-36337 - [Ruby] 放宽所需的 Apache Arrow C++ 版本 (#36338)
- GH-36342 - [C++] 为 RecordBatch 添加缺失的移动语义 (#36343)
- GH-36345 - [C++] 在 IsIn 和 IndexIn 核中优先使用 TypeError 而不是 Invalid (#36358)
- GH-36359 - [MATLAB] 为 RecordBatch 添加对 Timestamp 数组的支持 (#36361)
- GH-36367 - [C++] 添加 zipped range 工具 (#36393)
- GH-36375 - [Java] 在 ComplexWriter 中添加创建 MapWriter 的功能。 (#36351)
- GH-36380 - [R] 创建便利函数 arrow_array (#36381)
- GH-36384 - [Go] Schema: NumFields (#36365)
- GH-36402 - [CI][macOS] 忽略
brew update
失败 (#36403) - GH-36405 - [C++][ORC] 将 ORC 升级到 1.9.0 (#36406)
- GH-36407 - [C++] 添加 arrow::ipc::Listener::OnSchemaDecoded(schema, filtered_schema) (#36533)
- GH-36408 - [GLib][FlightSQL] 添加对 INSERT/UPDATE/DELETE 的支持 (#36409)
- GH-36414 - [C++] 添加缺失的 type_traits.h 断言:is_var_length_list() (#36415)
- GH-36421 - [Java] 启用支持读取 JSON Datasets (#36422)
- GH-36423 - [C++][Compute] 在
Expression::IsSatisfiable
中支持“或” (#36424) - GH-36450 - [CI][Python] 上传 Windows 的 wheel artifacts (#36466)
- GH-36479 - [C++][FlightRPC] 使用 find_package() 检测到的 gRPC 版本 (#36581)
- GH-36483 - [C++] 使
UTF8StringToUTF16
和UTF16StringToUTF8
接受string_views
(#36485) - GH-36492 - [CI][Python] 添加 Ubuntu 22.04 每晚构建 (#36480)
- GH-36513 - [开发][C#] 为 NuGet 添加 Dependabot 配置 (#36514)
- GH-36541 - [Python][CI] 修复 GH-33321 合并后的 nopandas 构建 (#36586)
- GH-36541 - [Python][CI] 确保“不带 pandas”的 CI 构建未安装 pandas(不在 conda-python 镜像中安装文档依赖) (#36542)
- GH-36544 - [Swift] 添加/修改一些 init 方法为公共访问 (#36545)
- GH-36553 - [Python] 改进某些子模块(cython 或 cpp)未构建时的错误消息 (#36554)
- GH-36556 - [CI][C++] 在 Valgrind 构建中启用 S3 (#36579)
- GH-36560 - [MATLAB] 从
arrow.array.<Numeric>Array
构造函数中移除 DeepCopy 名称-值对 (#36561) - GH-36568 - [Go] 在 ValueStr 中包含 Timestamp Zone (#36569)
- GH-36577 - [开发][C#] 对某些包使用
version-update:semver-major
(#36578) - GH-36582 - [CI][C++][Homebrew] 回溯最新的 formula 更改 (#36583)
- GH-36599 - [MATLAB] 将 libmexclass 版本提升到 3465900 (#36600)
- GH-36744 - [Python][打包] 为 pyarrow 构建依赖项添加 cython<3 的上限固定 (#36743)
- GH-36746 - [R] 更新 12.0.1.1 版本的 NEWS.md (#36747)
- GH-36756 - [CI][Python] 在 verify-release-candidate 脚本中安装 Cython < 3.0 (#36757)
- GH-36805 - [R] 更新 13.0.0 的 NEWS.md (#36806)
- GH-36839 - [CI][文档] 更新 test-ubuntu-default-docs 使用 GitHub actions 而非 Azure (#36840)
- GH-36947 - [CI] 将释放磁盘空间的功能移动到 Jinja 宏中,以便在 docs job 中复用 (#36948)
- PARQUET-2316 - [C++] 允许 parquet FileReader 进行部分 PreBuffer (#36192)
- PARQUET-2323 - [C++] 使用位图存储预缓冲的列块 (#36649)