Apache Arrow 13.0.0 (2023年8月23日)
这是一个涵盖两个多月开发的主要版本。
下载
贡献者
此版本包括来自108位不同贡献者的608次提交。
$ git shortlog -sn apache-arrow-12.0.1..apache-arrow-13.0.0
83 Sutou Kouhei
47 Raúl Cumplido
35 Nic Crane
26 Joris Van den Bossche
25 mwish
24 Weston Pace
20 sgilmore10
19 Felipe Oliveira Carvalho
17 Antoine Pitrou
16 Alenka Frim
15 Matt Topol
15 rtpsw
13 Igor Izvekov
13 Jin Shang
12 Dane Pitkin
12 Kevin Gurney
11 Alex Shcherbakov
11 David Li
11 Dewey Dunnington
9 Gang Wu
9 Jacob Wujciak-Jens
8 Ben Harkins
8 Herman Schaaf
7 david dali susanibar arce
6 Dominik Moritz
6 Will Jones
6 abandy
5 Curt Hagenlocher
5 Yevgeny Pats
5 dependabot[bot]
4 Li Jin
4 Matthias Loibl
4 Neal Richardson
3 Bryce Mecum
3 Jinpeng
3 eitsupi
2 Abe Tomoaki
2 Aleksei Smirnov
2 Benjamin Kietzman
2 Chunchun Ye
2 David Greiss
2 Davide Pasetto
2 Julien Jerphanion
2 Junming Chen
2 Laurent Goujon
2 Michael Lui
2 Simon Perkins
2 Spencer Nelson
2 henrymai
2 liujiacheng777
2 rtadepalli
2 zhjwpku
1 0x26res
1 Adam Reeve
1 Alexey Ozeritskiy
1 Aljaž Mur Eržen
1 Andrew Lamb
1 Anja Kefala
1 Arnaud Feldmann
1 Austin Dickey
1 Benson Muite
1 Bryan Cutler
1 Carlos O'Ryan
1 Chenxi LI
1 Chris Hoff
1 Diana Sulmone
1 Diogo Teles Sant'Anna
1 Dirk Eddelbuettel
1 Dongjoon Hyun
1 Dr. Jan-Philip Gehrcke
1 Elliott Brossard
1 Erez Rokah
1 Fokko Driesprong
1 Francis
1 Ian Cook
1 Ivan Chesnov
1 James Henderson
1 June Liu
1 Lei Hou
1 Mark Wolfe
1 Martin Traverse
1 Mats Kindahl
1 Matthew Roeschke
1 Nick Byrne
1 NoahFournier
1 Parth Chonkar
1 Philip
1 Rok Mihevc
1 Romain François
1 Rong Ma
1 Sergey Fedorov
1 Sven Rebhan
1 The Alchemist
1 Theodore Tsirpanis
1 Thor
1 Toby Dylan Hocking
1 Wenbo Hu
1 candiduslynx
1 clickingbuttons
1 jeremyosterhoudt
1 lord
1 lriggs
1 micah-white
1 panbingkun
1 ruoxi
1 sunpeng
1 takuya kodama
1 wenxlan
补丁提交者
以下 Apache 提交者将贡献的补丁合并到仓库中。
$ git shortlog -sn --group=trailer:signed-off-by apache-arrow-12.0.1..apache-arrow-13.0.0
155 Sutou Kouhei
96 Antoine Pitrou
62 Matt Topol
44 Joris Van den Bossche
44 Nic Crane
34 David Li
29 Raúl Cumplido
27 Weston Pace
16 Jacob Wujciak-Jens
16 Will Jones
13 Li Jin
8 Dewey Dunnington
7 Eric Erhardt
6 Alenka Frim
5 AlenkaF
5 Dominik Moritz
4 Benjamin Kietzman
2 Andrew Lamb
2 Kevin Gurney
2 Matthew Topol
1 Gang Wu
1 Neal Richardson
更新日志
Apache Arrow 13.0.0 (2023-08-23 07:00:00)
Bug 修复
- GH-14969 - [R][文档] 启用 pkgdown 内置搜索功能 (#36374)
- GH-20385 - [C++][Parquet] 拒绝扩展类型的部分加载 (#33634)
- GH-23870 - [Python] 确保 parquet.write_to_dataset 不会为未观察到的字典(分类)值创建空文件 (#36465)
- GH-32832 - [Go] 支持使用 tinygo 构建 (#35723)
- GH-34017 - [Python][FlightRPC][文档] 修复 FlightStreamReader.read_chunk 的文档字符串 (#35583)
- GH-34293 - [Java] 在 Windows 上加载原生库时出错 (#34312)
- GH-34338 - [Java] 移除在 -ea 标志下自动启用 BaseAllocator.DEBUG 的功能 (#36042)
- GH-34351 - [C++][Parquet] 统计信息:添加详细文档和微小优化 (#35989)
- GH-34363 - [C++] 在S3上传中使用相等大小的分块以实现R2兼容性 (#35808)
- GH-34391 - [C++] future as-of-join-node 在处理较远时间时挂起 (#34392)
- GH-34523 - [C++] 避免混合使用捆绑的 Abseil 和系统的 Abseil (#35387)
- GH-34656 - [CI][Python] 使用 gemfury 工具上传 wheel 文件,而不是 curl,以修复 Windows wheel 文件上传问题 (#35032)
- GH-34723 - [Java] 启用对 Netty 分配器内存使用的日志跟踪 (#35314)
- GH-34752 - [C++] 添加对 LoongArch 的支持 (#34740)
- GH-34775 - [R] arrow_table: as.data.frame() 有时返回 tbl,有时返回 data.frame (#35173)
- GH-34884 - [Python]:支持对 pyarrow.dataset PartitioningFactory 对象进行 pickle 操作 (#36550)
- GH-34884 - [Python]:支持对 pyarrow.dataset Partitioning 的子类进行 pickle 操作 (#36462)
- GH-34886 - [Python] 为 Table 和 RecordBatch 添加正确的 __array__ numpy 转换 (#36242)
- GH-34897 - [R] 确保 RStringViewer 辅助类不拥有任何 Array 引用 (#35812)
- GH-34907 - [文档][R] 版本选择器报告发布版本为开发版 (#35103)
- GH-35007 - [C++] 修复读取标准输入 (stdin) 的问题 (#35006)
- GH-35015 - [Go] 修复 parquet 内存泄漏 (#35973)
- GH-35027 - [Go]:在 FixedSizeBinaryBuilder Unmarshal 中使用 base64.StdEncoding (#35028)
- GH-35053 - [Java] 修复 MemoryUtil 以支持 Java 21 (#36370)
- GH-35059 - [C++] 修复针对行程长度编码输入的 "hash_count" (#35129)
- GH-35101 - [C++] 更新 ArrowConfig.cmake.in 中已弃用的 LOCATION 目标属性 (#35109)
- GH-35107 - [FlightSQL]:使用 `uint8` 而不是 `uint1` 来指代8位无符号整数 (#35108)
- GH-35118 - [格式][FlightSQL] 更多地使用 `int32` 而不是 `int` 来指代32位整数 (#35213)
- GH-35118 - [FlightSQL] 使用 `int32` 而不是 `int` 来指代32位整数 (#35120)
- GH-35140 - [R] 重写 configure 脚本并确保我们不使用不匹配的 libarrow (#35147)
- GH-35144 - [C++] 修复因聚合节点输出顺序改变而损坏的单元测试 (#35145)
- GH-35177 - [文档][Python] 抑制 "WARNING: autosummary: failed to import serialize" 警告 (#35182)
- GH-35179 - [C++] 修复 Arrow::bundled_dependencies 的 IMPORTED_LOCATION 属性 (#35196)
- GH-35188 - [Go] 在 CSV 读取器中对扩展类型使用 AppendValueFromString (#35189)
- GH-35190 - [Go] 在 CSV 读取器中正确处理空值 (#35191)
- GH-35193 - [Python][打包] 在 Windows wheel 文件中启用 GCS (#35255)
- GH-35202 - [Go][Parquet] 修复读取嵌套空列表时出现的 panic (#35276)
- GH-35234 - [Go] 修复 Callers 函数的 skip 参数 (#35231)
- GH-35240 - [Go][FlightRPC] 修复客户端中间件中的崩溃问题 (#35241)
- GH-35266 - [GLib][Parquet] 修复一个 GC 错误,即子元数据中缺少父元数据的引用 (#35286)
- GH-35266 - [CI][GLib][Parquet] 忽略 gparquet_column_chunk_metadata_equal() 测试 (#35278)
- GH-35267 - [C#] 在 FlightInfo 中序列化 TotalBytes 和 TotalRecords (#35222)
- GH-35270 - [C++] 在哈希连接内部使用 Buffer 而不是原始缓冲区 (#35347)
- GH-35297 - [C++][IPC] 修复 map 字段的 schema 反序列化问题 (#35298)
- GH-35306 - 修复 Schema.Fields() 以返回字段的副本 (#35307)
- GH-35310 - [Go] 从字符串转换的 decimal128 值不正确 (#35311)
- GH-35316 - [C++][FlightSQL] 在 SQLite 示例服务器中使用 RowsToBatches() 而不是 ArrayFromJSON() (#35322)
- GH-35326 - [Go] 修复 `*array.List` 和 `*array.LargeList` 的 `ValueOffsets` 实现 (#35327)
- GH-35346 - [CI][Python] 将 gdb 从 env-file 移动到 dockerfile (#35348)
- GH-35352 - [Java] 修复“半复杂”类型的问题 (#35353)
- GH-35359 - [C++] 如果所有元素都为 null,FixedSizeListArray.flatten() 会报错 (#35674)
- GH-35360 - [C++] 在 ScalarHashImpl::ArrayHash() 中考虑偏移量 (#35814)
- GH-35363 - [C++] 修复 Substrait schema 名称和分段聚合问题 (#35364)
- GH-35379 - [C++][FlightRPC] 添加 teardown 所需的检查以避免出错时崩溃 (#35380)
- GH-35383 - [C++] 优先使用 max_concurrency 而不是 executor capacity 以避免分段错误 (#35384)
- GH-35406 - [网站][文档] Arrow 文档页面缺少徽标
- GH-35413 - [Python] 将具体的浮点数数组类型添加到 pyarrow 公共 API 中 (#35414)
- GH-35421 - [Go] 确保 `array.X.ValueStr` 和 `array.XBuilder.AppendValueFromString` 之间的接口约定一致 (#35457)
- GH-35425 - [R] 由于 data.frame 转换,在 R < 4.0 版本上测试失败 (#35432)
- GH-35438 - [文档] 对源文档进行修正 (#35549)
- GH-35445 - [R] 类似于 group_by(foo) |> across(everything()) 的行为与 dplyr 不同 (#35473)
- GH-35448 - [C++] 修复 strptime 格式中 %z 的检测 (#35449)
- GH-35468 - [C++] 修复 Acero 中多批次处理的 var/std 问题 (#35469)
- GH-35483 - [CI][C++] 为 Windows 添加 snprintf 的头文件 (#35484)
- GH-35490 - [Python] 交换协议:更新 string 和 large_string 的测试 (#35504)
- GH-35501 - [C++] 修复 MSVC 中的错误 C2280 (#35683)
- GH-35503 - [CI][打包][C++] Snappy 补丁在 arm64 Windows wheel 构建中应用失败 (#35509)
- GH-35521 - [C++] 仅当空计数为 0 时才对空值位图进行哈希 (#35522)
- GH-35526 - [CI][C++] 修复 arrow::internal::IsNullRunEndEncoded 重复声明的问题 (#35527)
- GH-35528 - [Java] 修复 RangeEqualsVisitor 比较具有不同起始索引的 BitVector 的问题 (#35525)
- GH-35534 - [R] 确保将缺失的分组变量添加到变量列表的开头 (#36305)
- GH-35539 - [C++] 从公共头文件中移除对内部头文件的使用 (#35592)
- GH-35553 - [JAVA] 修复 NettyArrowBuf 中的 unwrap() (#35554)
- GH-35571 - [C++][CI][Parquet] 在解密测试中将 `EQ` 更改为 `FLOAT_EQ` (#35605)
- GH-35573 - [Python] pa.FixedShapeTensorArray.to_numpy_ndarray 在切片数组上失败 (#36164)
- GH-35576 - [C++] 使 Decimal{128,256}::FromReal 更精确 (#35997)
- GH-35588 - [Java] 为空值返回一个常量哈希码,解决了 #35588 (#35590)
- GH-35593 - [R] 使用 `[[` 和 `$` 尝试从数据集中提取列时出现令人困惑的 (NULL) 结果
- GH-35596 - [C++][CI] 使用 PCG 改进编译缓存 (#35597)
- GH-35599 - [Python] 规范的固定形状张量扩展数组/类型不可 pickle。(#35933)
- GH-35606 - [CI][C++][MinGW32] 为十进制测试使用更精确的浮点数输入 (#35680)
- GH-35617 - [文档] C API 示例中当前 n_buffers 的用法 (#35626)
- GH-35618 - [C++][文档] 改进 Datum 的文档 (#35794)
- GH-35633 - [R] R 构建因错误 'Invalid: Timestamps already have a timezone: 'UTC'. Cannot localize to 'UTC'' 而失败 (#35671)
- GH-35635 - [C++][CI] 在 PathFromUriHelper 中忽略主机时保留根路径以修复 HDFS 测试 (#36063)
- GH-35636 - [C++] 从 compute-vector-test 中提取两个耗时的测试套件 (#36401)
- GH-35649 - [R] 始终从主 R 线程调用来自 DuckDB 的 `RecordBatchReader::ReadNext()` (#36307)
- GH-35651 - [C++] 抑制 gcc 13 中引入的自移动警告 (#36328)
- GH-35651 - [C++] 不要在 MinGW 中使用自移动 (#35653)
- GH-35662 - [CI][C++][MinGW] 避免在发布构建中 FormatTwoDigits() 崩溃 (#35663)
- GH-35665 - [C++][Parquet] DeltaLengthByteArrayEncoder::Put 预留了过多的空间 (#35670)
- GH-35675 - [C++] 不要将 ArraySpan 复制到 REE ArraySpan 中 (#35677)
- GH-35681 - [Ruby] 添加对空表的 #select_columns 支持 (#35682)
- GH-35684 - [Go][Parquet] 修复空列表数组的 nil 解引用问题 (#35690)
- GH-35710 - [R] 对新的 configure 脚本的后续改进 (#36435)
- GH-35712 - [C++][CI] MacOS 在 arrow-array-test 中禁用 ASSERT_DEATH (#35724)
- GH-35728 - [CI][Python] 将 test_total_bytes_allocated 移动到子进程以提高可靠性 (#36355)
- GH-35733 - [Java] 修复 IntervalMonthDayNanoVector 构造函数中的小类型错误 (#35734)
- GH-35736 - [C++] 修复编译 key_map_avx2.cc (#35737)
- GH-35760 - [C++] C 数据接口辅助函数也应在非调试模式下运行检查 (#36215)
- GH-35761 - [Go] 修复 TypeEqual 中的 map 比较 (#35762)
- GH-35763 - [Go] 修复列表的 TypeEqual (#35764)
- GH-35789 - [C++] 从 CumulativeSumOptions 中移除 check_overflow (#35790)
- GH-35809 - [C#] C 数据接口的改进 (#35810)
- GH-35819 - [GLib][Ruby] 引用 GArrowExecutePlan 的依赖对象 (#35963)
- GH-35833 - [C++] 添加对 Abseil 20230125 的支持 (#35881)
- GH-35837 - [C++] 如果在源节点上施加了背压时调用 StopProducing,Acero 将会挂起 (#35902)
- GH-35838 - [C++] 为 asof join 节点添加背压测试 (#35874)
- GH-35838 - [C++] 修复 asof join 背压问题 (#35878)
- GH-35853 - [Python] 修复 NumPy NEP50 引起的弃用警告 (#35854)
- GH-35858 - [Python] 修复 PR GH-36011 引入的 linting 问题 (#36046)
- GH-35858 - [Python] 禁止使用无 schema 的 parquet writer (#36011)
- GH-35859 - [Python] 实际上将默认行组大小更改为 1Mi (#36012)
- GH-35866 - [Go] 在 `arrow.NestedType.Fields()` 实现中提供副本 (#35867)
- GH-35868 - [C++] asof-join-node-test 中偶尔出现 TSAN 失败 (#35904)
- GH-35869 - [R][发布] 在 12.0.1 维护分支的 test-r-devdocs 上出现未定义符号 _ZN5arrow6Status14AddContextLineEPKciS2_
- GH-35870 - [C++] 添加通过 CMAKE_CXX_FLAGS_DEBUG 更改优化标志的支持 (#35924)
- GH-35891 - [文档][Python] 更新到 Parquet C++ 仓库的链接 (#35892)
- GH-35911 - [Go] 修复 decimal256Traits 的 CastToBytes 方法 (#35912)
- GH-35943 - [开发] 确保在 PR 正文为空时 link issue 功能正常工作 (#36460)
- GH-35948 - [Go] 在 JSON 序列化数组时仅将 `int8` 和 `uint8` 转换为 `float64` (#35950)
- GH-35952 - [R] 确保 schema 元数据可以实际设置为命名的字符向量 (#35954)
- GH-35960 - [Java] 检测分配中的溢出 (#36185)
- GH-35965 - [Go] 修复 `Decimal256DictionaryBuilder` (#35966)
- GH-35982 - [Go] 修复 go1.18 损坏的构建 (#35983)
- GH-35988 - [C#] C 数据接口实现在导入时可能发生泄漏 (#35996)
- GH-36003 - [打包][RPM] RPM 作业有重复的 artifact 模式 (#36004)
- GH-36013 - [C++] 使用 Protobuf 3.22+ 时禁用捆绑的 OpenTelemetry (#36016)
- GH-36052 - [Go][Parquet] 386 架构的交叉构建失败 (#36066)
- GH-36053 - [C++] 对一个变量进行汇总时会随机产生 NA,而数据子集中并没有 NA (#36368)
- GH-36076 - [C++] 移除已弃用的 cli 标志 (#36077)
- GH-36082 - [发布] post-11-bump-versions.sh 在 main 分支上不进行 deb 次要/补丁版本更新 (#36083)
- GH-36090 - [C++] 为 Acero 和 Datasets 添加测试库 (#36206)
- GH-36117 - [C++] 确保创建 BUILD_OUTPUT_ROOT_DIRECTORY (#36160)
- GH-36121 - [R] 当 `num_threads` < 2 时,为 `set_io_thread_count()` 发出警告 (#36304)
- GH-36168 - [C++][Python] 支持 Arrow 列表到 pandas 的半精度浮点数转换 (#35944)
- GH-36172 - [R] Windows devdocs 构建失败,因为它使用了没有 JSON 功能的 libarrow 构建 (#36174)
- GH-36176 - [C++] 修复单键 Table 排序的回归问题 (#36179)
- GH-36182 - [Gandiva][C++] 当索引为负数时,修复 substring_index 函数。(#36184)
- GH-36200 - [CI][文档] 避免“设备上没有剩余空间”错误 (#36230)
- GH-36201 - [Python][CI] test_total_bytes_allocated 在 manylinux 的 arm64 wheel 文件上失败
- GH-36209 - [Java] 因安全漏洞升级 Netty (#36211)
- GH-36214 - [C++] 尽可能将 `FieldPath::Hash` 指定为模板参数 (#36222)
- GH-36224 - [CI] 更新 GitHub 脚本中的 rest api 调用 (#36225)
- GH-36239 - [CI][C++] 为 ARROW_*_FLAGS 添加对多个标志的支持 (#36281)
- GH-36245 - [C++] 使用 gcc 13 编译时出错
- GH-36257 - [CI][开发][Archery] bot 需要 pygithub 1.59.0 或更高版本 (#36467)
- GH-36259 - [R] as_schema 文档的描述不正确 (#36260)
- GH-36311 - [C++] 修复 `utf8_slice_codeunits` 中的整数溢出问题 (#36575)
- GH-36327 - [C++][CI] 修复 Valgrind 失败 (#36461)
- GH-36329 - [C++][CI] 在 macOS 上使用 OpenSSL 3 (#36336)
- GH-36331 - [C++][CI] AsofJoinTest 中偶发错误 (#36356)
- GH-36340 - [Java] 解决分配器日志线程中的竞争条件 (#36341)
- GH-36346 - [C++] 安全的 S3 终结处理 (#36442)
- GH-36349 - [Python][CI] 避免在 hypothesis 测试中使用 'build/etc/localtime' 时区 (#36391)
- GH-36352 - [Python] 将 project_id 添加到 GcsFileSystem 选项中 (#36376)
- GH-36353 - [R] 修复包版本引用,使其仅为文本,而非数字 (#36364)
- GH-36369 - [C++][FlightRPC] 修复 FlightClient::Authenticate*() 中的挂起错误 (#36372)
- GH-36396 - [R] 数组测试中调用了不存在的函数 (#36397)
- GH-36404 - [CI][C++][Gandiva] 在 arm64 macOS 上进行 JNI 构建的崩溃测试
- GH-36446 - [C++] ConcatenateImpl 中的小样式改进 (#36463)
- GH-36447 - [C++][CI] arrow-s3fs-test 在某些夜间作业中失败
- GH-36448 - [C++][CI] vcpkg 夜间作业构建 scalar_test.cc 失败
- GH-36449 - [C++][CI] 不为 Python 作业使用 -g1 (#36453)
- GH-36451 - [CI][C++] 修复 Fedora 35 上的编译失败 (#36457)
- GH-36452 - [CI][C++] 使用兼容的编译器测试 C++20 支持 (#36454)
- GH-36456 - [R] 使用 autobrew 时链接到正确版本的 OpenSSL (#36551)
- GH-36475 - [C++][CI] 修复 Flight 功能验证 (#36473)
- GH-36476 - [C++][FlightRPC] 修复 FlightInfo 中未初始化的字段 (#36484)
- GH-36477 - [CI][macOS] 在 crossbow 任务中忽略 brew update 失败 (#36478)
- GH-36482 - [C++][CI] 修复 AsofJoinBasicTest 中的偶发测试失败 (#36499)
- GH-36498 - [Python][CI] Hypothesis 夜间测试因 pytz.exceptions.UnknownTimeZoneError: 'Factory' 失败 (#36508)
- GH-36500 - [CI][Java][JAR] 移除 Homebrew 的 protobuf (#36515)
- GH-36501 - [CI][Java][JAR] 确保移除 Homebrew 的 gRPC 包 (#36516)
- GH-36523 - [C++] 修复 S3 中 TSan 检测到的锁顺序问题 (#36536)
- GH-36524 - [GLib] 抑制一个 pessimizing-move 警告 (#36531)
- GH-36537 - [Python] 确保数据集写入器遵循默认的 Parquet 版本 2.6 (#36538)
- GH-36543 - [CI][文档] 构建文档时使用 -g1 代替 -g (#36576)
- GH-36598 - [C++][MinGW] 修复 Protobuf 23.4 的构建失败 (#36606)
- GH-36629 - [CI][Python] 由于我们在 arrow->pandas 转换中进行了非纳秒级更改,跳过 dask 测试 (#36630)
- GH-36641 - [C++] 从非 acero 文件中移除对 acero 的引用 (#36650)
- GH-36659 - [Python] 修复与其他类型比较时 pyarrow.dataset.Partitioning.__eq__ 的问题 (#36661)
- GH-36669 - [Go] 防止 C Data 结构中的垃圾数据 (#36670)
- GH-36686 - [C++] 将 CMAKE_OSX_SYSROOT 传递给外部项目 (#36706)
- GH-36687 - [R] 为 autobrew 公式添加正确的分支名称以方便本地测试 (#36689)
- GH-36707 - [C++] 也为 OPENSSL_ROOT_DIR 使用 ARROW_PACKAGE_PREFIX (#36710)
- GH-36812 - [C#] 修复 C API 支持以与 .NET 桌面框架一起工作 (#36813)
- GH-36832 - [打包][RPM] 移除不必要的 Requires (#36833)
- GH-36892 - [C++] 修复 `FieldPath::Get` 中的性能回归问题 (#37032)
- GH-36913 - [C++] 跳过空缓冲区的连接以修复 UBSan 错误 (#36914)
- GH-36928 - [Java] 使其能与最新的 netty 版本 4.1.96 良好运行 (#36926)
- GH-36969 - [R] 在 gcc-13 上进行捆绑构建时默认禁用 GCS (#37147)
- GH-37019 - [R] read_parquet() 等函数的文档需要更新 (#37020)
- GH-37197 - [Java][CI][打包] 在 java-jars GitHub 作业中释放一些磁盘空间 (#37198)
- GH-37201 - [CI][打包][Java] java-jars 作业在 macOS aarch_64 上失败
新功能和改进
- GH-14790 - [开发] 避免在 PR 上使用 Closes issue id 产生额外评论 (#35811)
- GH-14946 - [C++] 添加展平的 FieldPath/FieldRef::Get 方法 (#35197)
- GH-15187 - [Java] 将 `reader` 初始化设为惰性,并添加了新的 `getTransferPair()` 函数,该函数接受 `Field` 类型 (#34424)
- GH-18547 - [Java] 支持在 ArrowStreamWriter 中重新发送字典 (#35920)
- GH-20047 - [MATLAB] 在 Windows 上为 MATLAB 接口启用 GitHub Actions CI (#35792)
- GH-21761 - [Python] 在数组构造函数中接受 pyarrow 标量 (#36162)
- GH-26153 - [C++] 为 RecordBatchStreamReader 和 StreamDecoder 共享通用代码 (#36344)
- GH-29781 - [C++][Parquet] 默认切换到使用兼容的嵌套类型 (#35146)
- GH-29887 - [C++] 实现字典数组排序 (#35280)
- GH-31521 - [C++][Flight] 将 Flight SQL 客户端迁移到 Result (#36559)
- GH-32190 - [C++][计算] 实现累积乘积、最大值和最小值函数 (#36020)
- GH-32282 - [R] 更新 case_when() 绑定以匹配 dplyr 中的更改 (#35502)
- GH-32335 - [C++][文档] 为 Acero 添加设计文档 (#35320)
- GH-32605 - [C#] 扩展有效性缓冲区 API (#35342)
- GH-32605 - [C#] 扩展 ArrowBuffer.BitmapBuilder 以提高数组连接性能 (#13810)
- GH-32739 - [CI][文档] 记录文档 PR 预览 (#35614)
- GH-32763 - [C++] 为 fetch 和 sort 添加 FromProto (#34651)
- GH-33206 - [C++] 添加对 StructArray 排序和嵌套排序键的支持 (#35727)
- GH-33321 - [Python] 支持为 pandas >= 2.0 转换为非纳秒精度的 datetime64 (#35656)
- GH-33517 - [C++][Flight] 在 CI 上测试 UCX (#14667)
- GH-33804 - [Python] 添加对 manylinux_2_28 wheel 的支持 (#34818)
- GH-33854 - [MATLAB] 为 MATLAB 接口添加基本的 libmexclass 集成代码 (#34563)
- GH-33856 - [C#] 为 C# 实现 C 数据接口 (#35496)
- GH-33980 - [文档][Python] 记录 DataFrame 交换协议的实现和用法 (#35835)
- GH-33987 - [R] 支持新的 dplyr .by/by 参数 (#35667)
- GH-34216 - [Python] 支持使用 Python 读取 JSON 数据集 (#34586)
- GH-34223 - [Java] Java Substrait Consumer JNI 调用 ACERO C++ (#34227)
- GH-34375 - [C++][Parquet] 当页面索引启用时忽略页面头统计信息 (#35455)
- GH-34386 - [C++] 添加一个 PathFromUriOrPath 方法 (#34420)
- GH-34436 - [R] JSON 数据集的绑定 (#35055)
- GH-34509 - [C++][Parquet] 改进 ArrowReaderProperties::batch_size 的文档字符串 (#36486)
- GH-34722 - [C++][Parquet] 小修改:更新 Parquet NextPage 的措辞 (#35368)
- GH-34729 - [C++][Python] 增强的 Arrow<->Pandas map/pydict 支持 (#34730)
- GH-34749 - [Java] 使 Zstd 压缩级别可配置 (#34873)
- GH-34787 - [Python] 为 ChunkedArray.to_numpy 接受 zero_copy_only=False (#35582)
- GH-34788 - [Python][打包][CI] 放弃对 Python 3.7 的支持 (#36061)
- GH-34852 - [C++][Go][Java][FlightRPC] 添加对有序数据的支持 (#35178)
- GH-34858 - [Swift] 初步的 reader 实现 (#34842)
- GH-34868 - [Python] 在类之间共享文档字符串 (#34894)
- GH-34911 - [C++] 添加 first 和 last 聚合器 (#34912)
- GH-34918 - [C++] 更新 vendored double-conversion 到 3.2.1 版本 (#34919)
- GH-34921 - [C++][Python][Java] 要求 CMake 3.16 或更高版本 (#35921)
- GH-34949 - [C++][Parquet] 按列启用页面索引 (#35230)
- GH-34971 - [格式] 添加非 CPU 版本的 C 数据接口 (#34972)
- GH-34979 - [Python] 为 Table 和 RecordBatch 创建一个基类 (#34980)
- GH-35004 - [C++] 移除 RelationInfo (#35005)
- GH-35033 - [Java][数据集] 添加从 Java 对多文件数据集的支持 (#35034)
- GH-35035 - [R] 为 Schemas 实现 names<- (#35172)
- GH-35067 - [JavaScript] 有符号 `BigNum` 的 toString 方法 (#35067)
- GH-35084 - [文档][格式] 添加如何更改格式规范的说明 (#35174)
- GH-35099 - [CI][打包] 将 vcpkg 升级到 2023.04.15 版本 (#35430)
- GH-35112 - [Python] 在 Python MapType 中公开 keys_sorted (#35113)
- GH-35124 - [C++] 在输出连接结果时避免不必要的复制 (#35114)
- GH-35125 - [C++][Acero] 在 QueryOptions 中添加一个自定义的 io-executor (#35464)
- GH-35130 - [文档] 记录如何成为协作者以获得 triage 角色 (#36445)
- GH-35134 - [C++] 在 double-conversion 库周围添加 `arrow_vendored` 命名空间 (#35135)
- GH-35136 - [Go][FlightSQL] 支持未实现 `CreatePreparedStatement` 的后端 (#35137)
- GH-35162 - [Go] Float16 算术运算 (#35163)
- GH-35164 - [Go] 十进制数据类型的附加方法 (#35165)
- GH-35168 - [CI][打包][Conan] 合并上游更改 (#35169)
- GH-35171 - [C++][Parquet] 为数据页 v2 实现 CRC (#35242)
- GH-35180 - [R] 实现 cumsum 函数的绑定 (#35339)
- GH-35212 - [Go] 添加使用 ARROW_CHECKED_MAX_RETAINED_FRAMES 显示完整调用堆栈的能力 (#35215)
- GH-35228 - [C++][Parquet] 小修改:修复 Parquet Reader 中的注释拼写错误 (#35229)
- GH-35245 - [Java][数据集][Linux] 启用 GCS (#35246)
- GH-35247 - [C++] 添加 Arrow Substrait 对 stddev/variance 的支持 (#35249)
- GH-35250 - [Python] 添加 datetime 列转换为 pandas 的测试 (#35546)
- GH-35256 - [Go] 将 ToMap 添加到 Metadata (#35257)
- GH-35264 - [Python] 交换协议:测试清理 (#35530)
- GH-35275 - [Java] 确保 VectorSchemaRoot slice 返回一个新的根 (#35476)
- GH-35279 - [C++][Parquet] 工具:增强 Parquet 打印统计信息的功能 (#35262)
- GH-35282 - [C++] 启用 fuzzing 时自动启用 brotli (#35283)
- GH-35290 - [JS] 更新依赖项 (#35291)
- GH-35302 - [Go] 在 pqarrow 中改进不支持类型的错误消息 (#35303)
- GH-35304 - [C++][ORC] 支持属性转换 (#35499)
- GH-35315 - [C++][CMake] 为 Flight SQL 添加预设 (#35317)
- GH-35335 - [Python][文档] 修复 `map_` 的文档字符串 (#35336)
- GH-35361 - [C++] 从 cpp/build-support/run-test.sh 中移除 Perl 依赖 (#35362)
- GH-35375 - [C++][FlightRPC] 添加 `arrow::flight::ServerCallContext::incoming_headers()` (#35376)
- GH-35377 - [C++][FlightRPC] 向 `arrow::flight::ServerAuthHandler` 方法添加 `ServerCallContext` 参数 (#35378)
- GH-35390 - [Python] 整合 Table 和 RecordBatch 中的一些 API (#35396)
- GH-35400 - [R] 从 utils 导入 download.file (#35401)
- GH-35403 - [文档] 支持 sphinx 6 构建文档 (#36296)
- GH-35411 - [MATLAB] 为数值数组创建一个模板化的 C++ 代理类 (#35479)
- GH-35415 - [Python] RecordBatch 字符串表示包含列预览 (#35416)
- GH-35417 - [GLib] 添加 GArrowRunEndEncodedDataType (#36444)
- GH-35418 - [GLib] 添加 GArrowRunEndEncodedArray (#36470)
- GH-35435 - [Ruby][Flight] 添加 ArrowFlight::Client#authenticate_basic (#35436)
- GH-35442 - [C++][FlightRPC] 将 ServerCallContext 而不是 CallHeaders 传递给 ServerMiddlewareFactory::StartCall() (#35454)
- GH-35480 - [MATLAB] 添加名为 `arrow.array.Array` 的抽象 MATLAB 基类 (#35491)
- GH-35482 - [Go] 在 `array.FixedSizeListBuilder.AppendNull` 中向值中附加空值 (#35481)
- GH-35485 - [CI][Python] Archery 格式化 Python C++ 代码库 (#35487)
- GH-35489 - [MATLAB] 将 CMake `build` 目录添加到 MATLAB 的 `.gitignore` 文件中 (#35493)
- GH-35492 - [MATLAB]:添加 arrow.array.Float32Array MATLAB 类 (#35495)
- GH-35500 - [C++][Go][Java][FlightRPC] 添加对结果集过期的支持 (#36009)
- GH-35506 - [C++] 在 Substrait 中支持 First 和 Last 聚合器 (#35513)
- GH-35511 - [C++] 工具:在 `SwapEndianArrayData` 中添加 memory_pool (#36431)
- GH-35515 - [C++][Python] 添加不可分解的聚合 UDF (#35514)
- GH-35516 - [R] 将 11.0.0.3 添加到向后兼容性矩阵中 (#35517)
- GH-35537 - [MATLAB] 为数值数组创建共享测试类实用工具 (#35556)
- GH-35542 - [R] 实现 schema 提取函数 (#35543)
- GH-35545 - [R] 在 pkgdown 网站上重新组织参考页面 (#36171)
- GH-35550 - [MATLAB] 向 `arrow.array.Array` 添加公共 `toMATLAB` 方法,用于转换为 MATLAB 类型 (#35551)
- GH-35557 - [MATLAB] 添加无符号整数数组 MATLAB 类(即 `UInt8Array`、`UInt16Array`、`UInt32Array`、`UInt64Array`)(#35562)
- GH-35558 - [MATLAB] 添加有符号整数数组 MATLAB 类(即 `Int8Array`、`Int16Array`、`Int32Array`、`Int64Array`)(#35561)
- GH-35579 - [C++] 在 Parquet 扫描器中支持非命名的 FieldRefs (#35798)
-
GH-35598 - [MATLAB] 向 `MATLAB arrow.array.
` 类添加公共 `Valid` 属性以查询空值(即支持有效性位图)(#35655) - GH-35601 - [R][文档] 向 fileysystem.R 添加缺失的文档 (#35895)
- GH-35607 - [C++] 支持简单的 Substrait 聚合扩展 (#35608)
- GH-35609 - [文档] 支持构建文档的子部分 (#35610)
- GH-35611 - [C++] 移除 ListBuilder 和 BinaryBuilder 的不必要安全操作 (#35613)
- GH-35652 - [Go][计算] 允许使用 Go Compute 执行 Substrait 表达式 (#35654)
- GH-35659 - [Swift] 初步的 Swift IPC writer (#35660)
- GH-35669 - [C++] 更新到 double-conversion 3.3.0,激活新标志,移除补丁 (#36002)
- GH-35676 - [MATLAB] 添加一个 `InferNulls` 名称-值对,用于在构建 `arrow.array.Array` 期间控制空值推断 (#35827)
- GH-35686 - [Go] 将 AppendTime 添加到 TimestampBuilder (#35687)
- GH-35693 - [MATLAB] 在 `arrow.array.Float64Array` 构造函数中将 `Valid` 作为名称-值对添加 (#35977)
- GH-35705 - [R] 重命名 acero 的文档页面 (#36107)
- GH-35706 - [CI] 在 pr_review_trigger.yml 上设置最低权限 (#35708)
- GH-35709 - [R][文档] 记录将数据传递给 duckdb 进行窗口聚合的方法 (#35882)
- GH-35711 - [Go] 向某些 builder 中添加 `Value` 和 `GetValueIndex` 方法 (#35744)
- GH-35729 - [C++][Parquet] 在 Parquet 中为 BloomFilter 实现批处理接口 (#35731)
- GH-35746 - [Parquet][C++][Python] 将默认 Parquet 版本切换到 2.6 (#36137)
- GH-35749 - [C++] 在计算内核中处理行程长度编码的过滤器 (#35750)
- GH-35752 - [CI][GLib][Ruby] 将 GITHUB_ACTIONS 环境变量传递给 Docker 容器 (#35753)
- GH-35754 - [CI][GLib] 不构建静态 C++ 库 (#35755)
- GH-35757 - [C++][Parquet] 使用页面编码统计信息来构建编码 (#35758)
- GH-35765 - [C++] 将 vector_selection.cc 拆分为更多的编译单元 (#35751)
- GH-35779 - [R][文档] 记录类似窗口功能的变通方法 (#35702)
- GH-35783 - [JS] 更新依赖项 (#35784)
- GH-35786 - [C++] 添加 pairwise_diff 函数 (#35787)
- GH-35788 - [Swift] 错误修复并将 reader/writer 更改为使用 Result 类型 (#35774)
- GH-35803 - [文档] 为 Swift 在实现状态表中添加列 (#35862)
- GH-35817 - [文档][C++] 修复 value_counts/unique 文档中关于 null 处理的部分 (#35818)
- GH-35828 - [Go] 为 `array.ApproxEqual` 添加 `array.WithUnorderedMapKeys` 选项 (#35823)
- GH-35847 - [C++][第三方] 将 xxhash 版本升级到 v0.8.1 (#35849)
- GH-35871 - [Go] 在 `array.ApproxEqual` 中考虑结构体的有效性位图 (#35872)
- GH-35879 - [C++] 将捆绑的 google-cloud-cpp 升级到 2.12.0 (#36119)
- GH-35906 - [文档] 支持在未安装 pyarrow 的情况下构建文档 (#35907)
- GH-35909 - [Go] 弃用 `arrow.MapType.ValueField` 和 `arrow.MapType.ValueType` 方法 (#35899)
- GH-35914 - [MATLAB] 集成最新的 libmexclass 更改以支持错误处理 (#35918)
- GH-35915 - [Ruby] 添加支持从 Hash 自动转换函数选项 (#35927)
- GH-35922 - [C++] 放弃对 Debian GNU/Linux buster (10) 的支持 (#35923)
- GH-35926 - [C++][Parquet] 允许通过禁用统计信息来禁用 ColumnIndex (#35958)
- GH-35935 - [C++] 清理使用 `use_threads=false` 的 Acero plan 的中断 (#35953)
- GH-35949 - [R] CSV 文件读取器选项类对象应打印所选值 (#35955)
- GH-35961 - [C++][FlightSQL] 接受 Protobuf 3.12.0 或更高版本 (#35962)
- GH-35969 - [Swift] 使用 ArrowType 而不是 ArrowType.info,并添加 binary、time32 和 time64 类型 (#35985)
- GH-35974 - [Go] 如果导入 C Array Stream 失败,不要 panic (#35978)
- GH-35975 - [Go] 支持导入 decimal256 (#35981)
- GH-35979 - [C++] 将 Acero 标量和哈希聚合重构到单独的文件中 (#35980)
- GH-35984 - [MATLAB] 为所有数值数组类添加 null 支持 (#36039)
- GH-35987 - [C++] 取消固定 brew protobuf 版本 (#36087)
- GH-35987 - [C++] 将 brew protobuf 版本固定为 21 (#36029)
- GH-35990 - [CI][C++][Windows] 不对 "choco list" 使用 -l (#35991)
- GH-36006 - [打包][RPM] 添加对 Amazon Linux 2023 的支持 (#36081)
- GH-36008 - [Ruby][Parquet] 添加 Parquet::ArrowFileReader#each_row_group (#36022)
- GH-36014 - [Go] 允许结构体中存在重复的字段名 (#36015)
- GH-36023 - [CI][Ruby][发布] 抑制来自 verify-rc-ruby 的无意义进度日志 (#36024)
- GH-36025 - [JS] 在 `verify-release-candidate.sh` 中允许 Node.js 18.14 或更高版本 (#36089)
- GH-36031 - [JS]:更新依赖项 (#36032)
- GH-36033 - [JS] 移除 BigInt 兼容性代码 (#36034)
- GH-36038 - [Python] 在 ExtensionType 类上实现 __reduce__ (#36170)
- GH-36040 - [MATLAB] 添加 `arrow.array.BooleanArray` 类 (#36041)
- GH-36045 - [Python] 提高 pc.map_lookup / MapLookupOptions 的可用性 (#36387)
- GH-36047 - [C++][计算] 为 IndexIn 和 IsIn 添加对 duration 类型的支持 (#36058)
- GH-36050 - [文档][C] 修复 C 导出文档中的内存泄漏 (#36051)
- GH-36055 - [JS] 在 CI 中使用 Node.js 18 (#36147)
- GH-36056 - [CI] 为 GitHub Actions 启用 Dependabot (#36194)
- GH-36059 - [C++][计算] 为标量查找函数预留哈希表空间 (#36067)
- GH-36070 - [Go][Flight] 添加 Flight 客户端 Cookie 中间件 (#36071)
- GH-36072 - [MATLAB] 添加 MATLAB `arrow.tabular.RecordBatch` 类 (#36190)
- GH-36074 - [C++] 阐明 ConcatenateTablesOptions::field_merge_options 的文档 (#36075)
- GH-36092 - [C++] 简化 as-of-join 节点中的并发性 (#36094)
- GH-36095 - [Go] 为 `pqarrow.FileWriter.WriteBuffered` 添加文档 (#36163)
- GH-36096 - [Python] 在 Array.to_pandas 中调用 __from_arrow__ (#36314)
- GH-36098 - [MATLAB] 更改 C++ 代理构造函数以接受选项结构体而不是包含参数的单元格数组 (#36108)
- GH-36105 - [Go] 在 csv 中支持 float16 (#36106)
- GH-36109 - [MATLAB] 如果所有数组元素都有效,则将 nullptr 存储为有效性位图 (#36114)
- GH-36120 - [C#] 通过 C API 支持 schema 元数据 (#36122)
- GH-36128 - [C++][计算] 允许 duration 和所有整数类型之间进行乘法运算 (#36231)
- GH-36129 - [Python] 整合 Table 和 RecordBatch 中的通用 API (#36130)
- GH-36131 - [文档] 为 Julia URL 使用 https://arrow.apache.org/julia/ (#36156)
- GH-36141 - [Go] 在 csv 中支持 large 和 fixed 类型 (#36142)
- GH-36151 - [Java] 在 `ParallelSearcher` 中为 `keyPosition` 添加 `volatile` 声明 (#36152)
- GH-36157 - [C++][开发] 添加使用 python3 运行 IWYU 的支持 (#36159)
- GH-36166 - [C++][MATLAB] 添加将 UTF-8 字符串转换为 UTF-16 以及将 UTF-16 字符串转换为 UTF-8 的实用工具 (#36167)
- GH-36173 - [C++] 为 UTF8StringToUTF16 添加单独的高低码点测试用例 (#36383)
- GH-36177 - [MATLAB] 将 Type 对象层次结构添加到 MATLAB 接口中 (#36210)
- GH-36178 - [C++] 支持 ReadRangeCache 惰性模式的预取 (#36180)
- GH-36181 - [Go] 为所有 builder 添加 `AppendNulls` 和 `AppendEmptyValues` 方法 (#36145)
- GH-36198 - [Go] 移除已弃用的相等性检查 (#36169)
- GH-36203 - [C++] 支持在 is_in 和 index_in 中进行双向转换 (#36204)
- GH-36207 - [MATLAB] 将 MATLAB 自动保存文件 (`.asv`) 添加到 `.gitignore` 中 (#36208)
- GH-36212 - [MATLAB] 更新 `README.md` 以提及对 `arrow.array.Array` 类的支持 (#36213)
- GH-36217 - [MATLAB] 添加 arrow.array.TimestampArray (#36333)
- GH-36218 - [CI][Go] 仅在主分支上运行基准测试步骤 (#36229)
- GH-36218 - [CI][Go] 仅在主分支上运行基准测试步骤 (#36219)
- GH-36220 - [CI] 仅在主分支上运行 "Docker Push" 步骤 (#36221)
- GH-36227 - [C++] 用于设置项目 ID 的新 GcsOption (#36228)
- GH-36232 - [打包][Ubuntu] 放弃对 Ubuntu 22.10 (kinetic) 的支持 (#36237)
- GH-36233 - [打包][Ubuntu] 添加对 Ubuntu 23.04 (lunar) 的支持 (#36238)
- GH-36234 - [打包][Debian] 添加对 Debian GNU/Linux trixie (13) 的支持 (#36285)
- GH-36241 - [打包] 放弃对 Amazon Linux 2 的支持 (#36282)
- GH-36243 - [开发] 在合并时移除 PR 工作流标签 (#36244)
- GH-36249 - [MATLAB] 创建一个 `MATLAB_ASSIGN_OR_ERROR` 宏以镜像 C++ 的 `ARROW_ASSIGN_OR_RAISE` 宏 (#36273)
- GH-36250 - [MATLAB] 添加 `arrow.array.StringArray` 类 (#36366)
- GH-36251 - [MATLAB] 向 `arrow.array.Array` 添加 `Type` 属性 (#36270)
- GH-36252 - [Python] 添加不可分解的哈希聚合 UDF (#36253)
- GH-36255 - [C++] 为列表上的 "if_else" 内核添加基准测试 (#36256)
- GH-36264 - [R] 添加 scalar() 函数 (#36265)
- GH-36271 - [R] 拆分 R6 类和便利函数 (#36394)
- GH-36284 - [Python][Parquet] 在 Python API 中支持写入页面索引 (#36290)
- GH-36287 - [Ruby] 添加支持自动安装 arrow-c-glib conda 包 (#36288)
- GH-36293 - [C++] 使用 ipc_write_options.memory_pool 进行压缩缓冲,并在压缩后收缩 (#36294)
- GH-36297 - [C++][Parquet] 非二进制字典编码的基准测试 (#36298)
- GH-36299 - [R][CI] 移除 pkgdown 检查 CI 步骤 (#36300)
- GH-36309 - [C++] 添加在类列表类型的标量之间进行转换的能力 (#36310)
- GH-36317 - [C++] 从 CleanListOffsets 返回一个 BufferVector (#36316)
- GH-36319 - [Go][Parquet] 改进了行组写入器的错误消息 (#36320)
- GH-36337 - [Ruby] 放宽所需的 Apache Arrow C++ 版本 (#36338)
- GH-36342 - [C++] 为 RecordBatch 添加缺失的移动语义 (#36343)
- GH-36345 - [C++] 在 IsIn 和 IndexIn 内核中优先使用 TypeError 而不是 Invalid (#36358)
- GH-36359 - [MATLAB] 为 RecordBatch 添加对 Timestamp 数组的支持 (#36361)
- GH-36367 - [C++] 添加一个 zipped range 实用工具 (#36393)
- GH-36375 - [Java] 在 ComplexWriter 中添加创建 MapWriter 的功能 (#36351)
- GH-36380 - [R] 创建便利函数 arrow_array (#36381)
- GH-36384 - [Go] Schema: NumFields (#36365)
- GH-36402 - [CI][macOS] 忽略 `brew update` 失败 (#36403)
- GH-36405 - [C++][ORC] 将 ORC 升级到 1.9.0 (#36406)
- GH-36407 - [C++] 为 arrow::ipc::Listener 添加 OnSchemaDecoded(schema, filtered_schema) (#36533)
- GH-36408 - [GLib][FlightSQL] 添加对 INSERT/UPDATE/DELETE 的支持 (#36409)
- GH-36414 - [C++] 添加缺失的 type_traits.h 谓词:is_var_length_list() (#36415)
- GH-36421 - [Java] 启用对读取 JSON 数据集的支持 (#36422)
-
GH-36423 - [C++][Compute] 在
Expression::IsSatisfiable中支持 "or" (#36424) - GH-36450 - [CI][Python] 为 Windows 上传 wheel 构建产物 (#36466)
- GH-36479 - [C++][FlightRPC] 使用 find_package() 检测到的 gRPC 版本 (#36581)
-
GH-36483 - [C++] 使
UTF8StringToUTF16和UTF16StringToUTF8接受string_views(#36485) - GH-36492 - [CI][Python] 添加 Ubuntu 22.04 的夜间构建 (#36480)
- GH-36513 - [Dev][C#] 为 NuGet 添加 Dependabot 配置 (#36514)
- GH-36541 - [Python][CI] 修复合并 GH-33321 后的 nopandas 构建 (#36586)
- GH-36541 - [Python][CI] 确保 "Without pandas" CI 构建中没有安装 pandas (不在 conda-python 镜像中安装文档要求) (#36542)
- GH-36544 - [Swift] 将一些 init 方法的访问权限添加/更改为 public (#36545)
- GH-36553 - [Python] 改进当某些子模块 (cython 或 cpp) 未构建时的错误信息 (#36554)
- GH-36556 - [CI][C++] 在 Valgrind 构建中启用 S3 (#36579)
-
GH-36560 - [MATLAB] 从
arrow.array.<Numeric>Array构造函数中移除 DeepCopy 名称-值对 (#36561) - GH-36568 - [Go] 在 ValueStr 中包含时间戳时区 (#36569)
-
GH-36577 - [Dev][C#] 对某些包使用
version-update:semver-major(#36578) - GH-36582 - [CI][C++][Homebrew] 向后移植最新的 formula 变更 (#36583)
- GH-36599 - [MATLAB] 将 libmexclass 版本提升至 3465900 (#36600)
- GH-36744 - [Python][Packaging] 在 pyarrow 构建依赖中为 cython<3 添加版本上限 (#36743)
- GH-36746 - [R] 为 12.0.1.1 版本更新 NEWS.md (#36747)
- GH-36756 - [CI][Python] 在 verify-release-candidate 脚本中安装 Cython < 3.0 (#36757)
- GH-36805 - [R] 为 13.0.0 版本更新 NEWS.md (#36806)
- GH-36839 - [CI][Docs] 更新 test-ubuntu-default-docs 以使用 GitHub actions 替代 Azure (#36840)
- GH-36947 - [CI] 将释放磁盘空间操作移至 Jinja 宏,以便在文档作业中重用 (#36948)
- PARQUET-2316 - [C++] 允许在 parquet FileReader 中进行部分预缓冲 (PreBuffer) (#36192)
- PARQUET-2323 - [C++] 使用位图存储预缓冲的列块 (#36649)