Apache Arrow 14.0.0 (2023年11月1日)
这是一个涵盖两个多月开发的主要版本。
下载
贡献者
此版本包括来自116位不同贡献者的612个提交。
$ git shortlog -sn apache-arrow-13.0.0..apache-arrow-14.0.0
69 Sutou Kouhei
59 dependabot[bot]
52 sgilmore10
34 Nic Crane
28 mwish
27 Raúl Cumplido
25 Kevin Gurney
19 Antoine Pitrou
19 Dewey Dunnington
17 Alenka Frim
16 Dane Pitkin
16 Matt Topol
13 Joris Van den Bossche
12 Jin Shang
11 David Li
11 Felipe Oliveira Carvalho
10 James Duong
8 Curt Hagenlocher
7 Jacob Wujciak-Jens
6 Benjamin Kietzman
6 Weston Pace
5 Frederic Branczyk
5 david dali susanibar arce
4 Ben Harkins
4 Thor
3 Bryce Mecum
3 Chris Jordan-Squire
3 Diego Fernández Giraldo
3 Francis
3 Ian Cook
3 Jonathan Keane
3 Junming Chen
3 Tim Schaub
3 h-vetinari
3 takuya kodama
2 Abe Tomoaki
2 Adam Reeve
2 Dominik Moritz
2 Elliott Brossard
2 Fokko Driesprong
2 Gang Wu
2 Mark Wolfe
2 Matthias Loibl
2 Rok Mihevc
2 Thomas Newton
2 Timothy Meehan
2 Vibhatha Lakmal Abeykoon
2 Will Jones
2 abandy
2 davidhcoe
2 jeremyosterhoudt
2 lambda
2 谢天
1 0x26res
1 Alex Shcherbakov
1 Alexander Grueneberg
1 Angela Li
1 Anja Kefala
1 Arkadiusz Rudny
1 Ashish Bailkeri
1 Austin Dickey
1 Bruno Tremblay
1 Chelsea Jones
1 Christian Lorentzen
1 Danyaal Khan
1 David Greiss
1 DenisTarasyuk
1 Donald Tolley
1 Ed Seidl
1 Edward Visel
1 Eero Lihavainen
1 Erik McKelvey
1 Fernando Mayer
1 František Nečas
1 George Godik
1 Hirokazu SUZUKI
1 Hyunseok Seo
1 Ikko Eltociear Ashimine
1 Ivan Chesnov
1 Jacek Stania
1 James Henderson
1 Jinpeng
1 Joe Marshall
1 Jonathan Swenson
1 Judah Rand
1 Justin Heesemann
1 KarateSnowMachine
1 Kevin Liu
1 Kuba Martin
1 Kyle Barron
1 Laurent Goujon
1 Li Jin
1 Michael Lui
1 Miguel Pragier
1 Paul Taylor
1 Rajat Subhra Mukherjee
1 Ray Zhang
1 SGZW
1 Sam Albers
1 Slobodan Ilic
1 Spencer Nelson
1 Srinivas Lade
1 Tero Vuotila
1 Thomas Grainger
1 Tommy Setiawan
1 Val Gridnev
1 Vitalii Tverdokhlib
1 Yue
1 andrewchambers
1 hrishisd
1 ismail simsek
1 panbingkun
1 patrick
1 pegasas
1 rtpsw
1 yyang52
补丁提交者
以下 Apache 提交者将贡献的补丁合并到仓库中。
$ git shortlog -sn --group=trailer:signed-off-by apache-arrow-13.0.0..apache-arrow-14.0.0
190 Sutou Kouhei
81 Antoine Pitrou
70 Kevin Gurney
46 Matt Topol
40 David Li
35 Nic Crane
31 Raúl Cumplido
28 Joris Van den Bossche
19 Jacob Wujciak-Jens
14 Dewey Dunnington
12 AlenkaF
12 Weston Pace
11 Benjamin Kietzman
4 Gang Wu
3 Dominik Moritz
2 Eric Erhardt
2 Jonathan Keane
1 Li Jin
1 Will Jones
更新日志
Apache Arrow 14.0.0 (2023-10-31 07:00:00)
Bug 修复
- GH-15017 - [Python] 强化 test_memory.py 以便与 ARROW_USE_GLOG=ON 一同使用 (#36901)
- GH-15281 - [C++] 将 bytes_view 别名替换为 span (#36334)
- GH-31621 - [JS] 修复 Union 的空值位图 (#37122)
- GH-32439 - [Python] 修复在对嵌套结构进行分块时出现的 off by one 错误 (#37376)
- GH-32483 - [Docs][Python] 澄清需要使用 conda-forge 来安装 nightly conda 包 (#37948)
- GH-33807 - [R] 如果检测到在模拟环境下运行,则添加一条消息 (#37777)
- GH-34567 - [JS] 改进构建过程,不生成 `bin/bin` 目录 (#36607)
- GH-34640 - [R] 当同时提供分区(非hive风格)和schema时,无法在CSV数据集中读取分区列 (#37658)
- GH-34909 - [C++] 避免大整数输入时求均值发生溢出 (#37243)
- GH-35095 - [C++] 防止在 arrow::ipc::IpcFormatWriter 中关闭后写入 (#37783)
- GH-35167 - [Docs][C++] 对 arrow::json::TableReader 使用新API (#37301)
- GH-35292 - [Release] 重试 "apt install" (#36836)
- GH-35328 - [Go][FlightSQL] 修复 FlightSql 驱动程序的不稳定测试 (#38044)
- GH-35450 - [C++] 当使用不匹配列长的 `RecordBatch::ToStructArray` 被调用时返回错误 (#36654)
- GH-35581 - [C++] 在标量中存储偏移量 (#36018)
- GH-35641 - [CI][C++] 禁用预编译头文件 (#37502)
- GH-35658 - [Packaging] 将 conda recipes 与 feedstocks 同步 (#35637)
- GH-35770 - [Go][Documentation] 更新注释中 TimestampType 的零值为秒 (#37905)
- GH-35942 - [C++] 提高 Decimal 到 Real 的转换精度 (#36667)
- GH-36069 - [Java] 确保 S3 在关闭时被终结 (#36934)
- GH-36154 - [JS][CI] 在 CI 中使用 `jest` 缓存 (#36373)
- GH-36189 - [C++][Parquet] StreamReader::SkipRows() 在多行组文件中会跳到不正确的位置 (#36191)
- GH-36318 - [Go] 仅为现有值的数量解码长度,而不是为所有 nvalues 解码 (#36322)
- GH-36323 - [Python] 修复超出 datetime 范围的值的 Timestamp 标量 repr 错误 (#36942)
- GH-36332 - [CI][Java] 与 Spark 的集成作业因 NoSuchMethodError:io.netty.buffer.PooledByteBufAllocator 而失败
- GH-36371 - [Java] CycloneDX 无法加载 mojo 'makeBom'
- GH-36379 - [C++] 绑定的依赖项包含路径应覆盖系统包含目录 (#37612)
- GH-36502 - [C++] 为 ReferencedByteRanges 添加对行程编码数组的支持 (#36521)
- GH-36610 - [CI][C++] 默认不启用 ARROW_ACERO (#36611)
- GH-36619 - [Python] Parquet 统计信息的字符串表示具有误导性 (#36626)
- GH-36634 - [Dev] 确保合并脚本在从 GitHub 请求信息时会遍历所有页面 (#36637)
- GH-36638 - [R] 在 Windows 上使用 create_package_with_all_dependencies() 时出错 (#37226)
- GH-36645 - [Go] 写入 parquet 时将 writer.Close 错误返回给调用者 (#36646)
- GH-36655 - [Dev] 修复用于上传 nightly wheels 的 fury 命令 (#36657)
- GH-36663 - [C++] 修复枚举选项的默认值信息 (#36684)
- GH-36680 - [Python] 添加缺失的 pytest.mark.acero (#36683)
- GH-36685 - [R][C++] 修复使用 Homebrew 时的非法操作码故障 (#36705)
- GH-36688 - [C#] 修复解引用错误 (#36691)
- GH-36692 - [CI][Packaging] 因 faraday 依赖问题将 gemfury 固定到 0.12.0 (#36693)
- GH-36708 - [C++] 完全计算空值计数,以便 REE 分配合理 (#36740)
- GH-36712 - [CI] 当 issue 更新时也更新其组件 (#36723)
- GH-36720 - [R] stringr 修饰函数不能使用命名空间前缀调用 (#36758)
- GH-36726 - [R] 在 S3 连接上调用 read_parquet 导致错误消息被忽略 (#37024)
- GH-36730 - [Python] 添加对 Cython 3.0.0 的支持 (#37097)
- GH-36771 - [R] stringr 辅助函数在求值时丢失调用环境 (#36784)
- GH-36776 - [C++] 使 ListArray::FromArrays() 能够处理包含空值的切片偏移数组 (#36780)
- GH-36787 - [R] lintr 更新导致 main 分支上的测试失败 (#36788)
- GH-36809 - [Python] MapScalar.as_py 与自定义字段名 (#36830)
- GH-36819 - [R] 使用 RunWithCapturedR 读取 Parquet 文件 (#37274)
- GH-36828 - [C++][Parquet] 使缓冲的 RowGroupSerializer 使用 BufferedPageWriter (#36829)
- GH-36850 - [Go] 修复 Arrow Concatenate,确保分配的内存被释放 (#36854)
- GH-36856 - [C++] 从 BasicDecimal256FromLE() 参数中移除不必要的大括号 (#36987)
- GH-36858 - [Go] 修复 dictionary builder 泄漏 (#36859)
- GH-36860 - [C++] 在系统 Protobuf 存在但系统 gRPC 不存在时报告 CMake 错误 (#36904)
- GH-36863 - [C#] 移除不必要的修复,即当 .NET > 5.0 时,不在 CDataInterfacePythonTests 上关闭 PythonEngine (#36872)
- GH-36863 - [C#][Packaging] 当 .NET > 5.0 时,不在 CDataInterfacePythonTests 上关闭 PythonEngine (#36868)
- GH-36883 - [R] 移除触发 CRAN 警告的版本号 (#36884)
- GH-36920 - [Java][Docs] 将 ARROW_JSON 变量添加到 maven 构建配置文件中 (#36921)
- GH-36922 - [CI][C++][Windows] 从 PATH 搜索 OpenSSL (#36923)
- GH-36935 - [Go] 修复 Timestamp 到 Time 的日期转换 (#36964)
- GH-36939 - [C++][Parquet] 多次调用 BooleanArray 的 Direct put 时不正确 (#36972)
- GH-36941 - [CI][Docs] 使用系统 Protobuf (#36943)
- GH-36949 - [C++] 修复 KeyColumnArray 的缓冲区数组边界断言。(#36966)
- GH-36973 - [CI][Python] Archery linter 集成 flake8==6.1.0 (#36976)
- GH-36975 - [C++][FlightRPC] 跳过未知字段,不要崩溃 (#36979)
- GH-36981 - [Go] 修复 ipc reader 泄漏 (#36982)
- GH-36983 - [Python] pyarrow.fs.S3FileSystem 和 s3fs 的 get_file_info 行为不同 (#37768)
- GH-36991 - [Python][Packaging] 在 Windows 上跳过需要 tz 数据库的测试 (#36996)
- GH-37017 - [C++] 防止意外使用 BMI2 指令 (#37610)
- GH-37022 - [CI][Java] 使用官方 Maven 下载 URL (#37119)
- GH-37050 - [Python][Interchange protocol] 为空 dataframe 添加一个解决方法 (#38037)
- GH-37056 - [Java] 修复从 c-data 导入空数据数组的问题 (#37531)
- GH-37067 - [C++] 安装绑定的 GoogleTest (#37483)
- GH-37099 - [C++] 修复 Flight-UCX 的构建 (#37105)
- GH-37102 - [Go][Parquet] 编码:在 ReserveBytes 时让 BitWriter Reserve (#37112)
- GH-37106 - [C++] 移除溢出整数舍入的基准测试 (#37109)
- GH-37107 - [C++] 抑制 GCC 7 的未使用变量警告 (#37240)
- GH-37110 - [C++] Expression: SmallestTypeFor 对 Scalar 丢失了时区信息 (#37135)
- GH-37111 - [C++][Parquet] 数据集:修复 Schema 转换 (#37793)
- GH-37116 - [C++][ORC] 链接到 absl::log_internal_check_op 以支持 ABSL_DCHECK*() (#37117)
- GH-37120 - [CI][Docs] 确保移除现有的 Node.js (#37121)
- GH-37129 - [CI][Docs] 使用 Ubuntu 22.04 (#37132)
- GH-37129 - [CI][Docs] 释放磁盘空间 (#37131)
- GH-37148 - [C++] 显式列出 Type::type 枚举的整数值 (#37149)
- GH-37173 - [C++][Go][Format] C-导出/导入行程编码数组 (#37174)
- GH-37208 - [R] 使用当前运行的 R 二进制文件来编译测试程序 (nix install) (#37225)
- GH-37213 - [C#] 更新一个因 rebase/merge 冲突而遗漏的对 FlatBuffers 的引用 (#37214)
- GH-37217 - [Python] 为 Cython 添加缺失的文档字符串 (#37218)
- GH-37239 - [Ruby] 更新 ArrowTable#initialize 的文档以澄清参数细节 (#37261)
- GH-37245 - [MATLAB] `arrow.internal.proxy.validate` 在构建要显示的消息以抛出 `arrow:proxy:ProxyNameMismatch` 错误时抛出 `MATLAB:UndefinedFunction` (#37248)
- GH-37266 - [CI][C++] 使用 ARROW_CMAKE_ARGS 而不是 CMAKE_ARGS (#37272)
- GH-37276 - [C++] 在单线程环境中跳过多线程测试 (#37327)
- GH-37294 - [C++] 为 HasSubstr 匹配器使用 std::string (#37314)
- GH-37299 - [C++] 修复与 Homebrew 的 clang-format 版本不匹配的错误 (#37300)
- GH-37303 - [Python] 由于 CumulativeSumOptions 重构,更新 test_option_class_equality (#37305)
- GH-37308 - [C++][Docs] 更改 CPP 教程的名称并对作业进行小幅修复 (#37311)
- GH-37325 - [R] 更新 NEWS.md,补充 13.0.0 版本中缺失的变更 (#37326)
- GH-37329 - [Release][Homebrew] 遵循目录结构变更 (#37349)
- GH-37340 - [MATLAB] 如果 `index` 引用了一个 `arrow.array.Time32Array` 列,`arrow.tabular.RecordBatch` 的 `column(index)` 方法会报错 (#37347)
- GH-37352 - [C++] 不要将所有依赖项都放到 ArrowConfig.cmake/arrow.pc 中 (#37399)
- GH-37373 - [CI] 使集成构建更精简 (#37366)
- GH-37373 - [CI][Integration] 释放磁盘空间 (#37374)
- GH-37377 - [C#] 在 TimestampArray.ConvertTo() 中发生溢出时抛出 OverflowException (#37388)
- GH-37386 - [R] 由于“无效的非字符版本规范”导致 CRAN 失败 (#37387)
- GH-37406 - [C++][FlightSQL] 添加缺失的 ArrowFlight::arrow_flight_{shared,static} 依赖项 (#37407)
- GH-37408 - [C++] 仅在 ARROW_COMPUTE=ON 时安装 arrow-compute.pc (#37409)
- GH-37410 - [C++][Gandiva] 添加对使用 LLVM 共享库的支持 (#37412)
- GH-37411 - [C++][Python] 添加 string -> date 的转换内核 (修复 python 标量转换) (#38038)
- GH-37414 - [Release][CI] 更新对错误的 apache-arrow Homebrew formula 路径的引用 (#37415)
- GH-37419 - [Go][Parquet] 为 pqarrow 添加 Decimal256 支持 (#37503)
- GH-37431 - [R] R 版本 < 4.0 的测试失败,因为测试中使用了基本管道符 (|>) (#37432)
- GH-37433 - [CI][Release] 增加 macOS 的超时时间 (#37530)
- GH-37437 - [C++] 修复 MakeArrayOfNull 对具有大字符串值类型的列表数组的支持 (#37467)
- GH-37453 - [C++][Parquet] WriteBatch 的性能修复 (#37454)
- GH-37456 - [R] CRAN 传入检查显示 NOTE,因为一个未文档化的内部函数 (#37457)
- GH-37463 - [R] CRAN 传入检查因测试运行时间过长而失败 (#37464)
- GH-37466 - [C++][Parquet] 修复 DELTA_BYTE_ARRAY 解码器中的 Valgrind 失败 (#37471)
- GH-37470 - [Python][Parquet] 为 `ParquetFileWriteOptions` 添加缺失的参数 (#37469)
- GH-37480 - [Python] 提升 pandas 版本,该版本包含对 pandas 问题 50127 的回归修复 (#37481)
- GH-37485 - [C++][Skyhook] 不要使用已弃用的 BufferReader API (#37486)
- GH-37487 - [C++][Parquet] 数据集:实现同步的 `ParquetFileFormat::GetReader` (#37514)
- GH-37488 - [C++] 为 C++ Azure SDK 禁用 unity 构建 (#37489)
- GH-37500 - [CI][C++] 默认禁用 Dataset 和 Substrait (#37501)
- GH-37507 - [GLib] 不要使用隐式包含目录 (#37508)
- GH-37515 - [C++] 如果 `ChunkedArray` 可能有 `NaN` 值,则从 `ChunkedArray::Equals(const std::shared_ptr<arrow::ChunkedArray>& other)` 中移除内存地址优化 (#37579)
- GH-37523 - [C++][CI][CUDA] 不要使用更新的 API 并添加缺失的 CUDA 依赖项 (#37497)
- GH-37535 - [C++][Parquet] 在 parquet.pc 中添加缺失的 "thrift" 依赖 (#37603)
- GH-37539 - [C++][FlightRPC] 修复绑定到 IPv6 地址的问题 (#37552)
- GH-37555 - [Python] 更新 get_file_info_selector 以忽略基目录 (#37558)
- GH-37560 - [Python][Documentation] 将令人困惑的批量大小从 128Ki 替换为 128_000 (#37605)
- GH-37574 - [Python] 与 numpy 2.0 的兼容性 (#38040)
- GH-37576 - [R] 使用 `SafeCallIntoR()` 在分配失败后调用垃圾回收器 (#37565)
- GH-37601 - [C++][Parquet] 添加缺失的 GoogleMock 依赖 (#37602)
- GH-37608 - [C++][Gandiva] TO_DATE 函数支持 YYYY-MM 和 YYYY 格式 (#37609)
- GH-37614 - [R][CI] 因 duckdb 仓库移动更新 CI 作业 (#37615)
- GH-37621 - [Packaging][Conda] 将 conda recipes 与 feedstocks 同步 (#37624)
- GH-37639 - [CI] 修复在旧操作系统上的 checkout (#37640)
- GH-37648 - [Packaging][Linux] 修复 libarrow-glib-dev/arrow-glib-devel 的依赖关系 (#37714)
- GH-37650 - [Python] 在 FilterMetaFunction 中检查过滤器输入 (#38075)
- GH-37671 - [R] 旧的时区符号链接导致 CRAN 失败 (#37672)
- GH-37712 - [Go][Parquet] 修复 ARM64 平台上用于位图提取位的汇编代码 (#37785)
- GH-37715 - [Packaging][CentOS] 在 CentOS 9 Stream 上使用默认 g++ (#37718)
- GH-37730 - [C#] 如果 fractionalPart 过大,在 DecimalUtility 中抛出 OverflowException (#37731)
- GH-37735 - [C++][FreeBSD] 抑制一个 shorten-64-to-32 警告 (#38004)
- GH-37738 - [Go][CI] 更新用于验证的 Go 版本 (#37745)
- GH-37750 - [R][C++] 添加与 IntelLLVM 的兼容性 (#37781)
- GH-37767 - [C++][CMake] 不要修改 .git/index (#38003)
- GH-37771 - [Go][Benchmarking] 更新 Conbench 的 git 信息 (#37772)
- GH-37803 - [Python][CI] 固定 setuptools_scm 以修复发布验证脚本 (#37930)
- GH-37803 - [CI][Dev][Python] 发布和合并脚本错误 (#37819)
- GH-37805 - [CI][MATLAB] 在 MATLAB CI 工作流中,为 `matlab-actions/setup-matlab` action 硬编码 `release` 为 `R2023a` (#37808)
- GH-37813 - [R] 为 open_delim_dataset() 添加 quoted_na 参数 (#37828)
- GH-37829 - [Java] 避免在追加可变长度向量时两次调整数据缓冲区的大小 (#37844)
- GH-37834 - [Gandiva] 迁移到新的 LLVM PassManager API (#37867)
- GH-37845 - [Go][Parquet] 检查逻辑字段的数量而不是物理列的数量 (#37846)
- GH-37858 - [Docs][JS] 修复用于生成 JS 文档的远程 URL 检查 (#37870)
- GH-37893 - [Java] 将 Types.proto 移动到子文件夹中 (#37894)
- GH-37907 - [R] rosetta 变量的设置缺失 (#37961)
- GH-37927 - [CI][Dev][Archery] crossbow 作业的徽章即使在失败或成功时也总是显示 `no status`
- GH-37936 - [CI] 修复 nightly rc-verify 构建中的集成测试 (#37933)
- GH-37950 - [R] R < 4.0 的测试失败,因为测试调用 data.frame() 时未指定 stringsAsFactors=FALSE (#37951)
- GH-37952 - [C++] 将 unique->shared 显式化以修复至少一个编译器上的构建失败 (#38136)
- GH-37993 - [CI] 修复 conda-integration 构建 (#37990)
- GH-37999 - [CI][Archery] 在 ARM 作业上安装 python3-dev 以访问 Python.h (#38009)
- GH-38011 - [C++][Dataset] 改变 force close 倾向于在写入时关闭 (#38030)
- GH-38014 - [Python] 在 13.0.0 版本中,pyarrow 扩展类型无法正确转换为 pandas
- GH-38034 - [Python] DataFrame 交换协议 - 修正分类列的 dtype 信息 (#38065)
- GH-38039 - [C++][Parquet] 修复获取 Parquet 列压缩级别时的段错误 (#38025)
- GH-38049 - [R] 阻止 `on_rosetta()` 发出警告 (#38052)
- GH-38057 - [Python][CI] 修复不稳定的 hypothesis 测试 (#38058)
- GH-38059 - [Python][CI] 将 CUDA 升级到 11.2.2 (#38081)
- GH-38060 - [Python][CI] 升级 Spark 版本 (#38082)
- GH-38068 - [C++][CI] 修复 Parquet 单元测试 `arrow_reader_writer_test.cc` 的编译 (#38069)
- GH-38074 - [C++] 修复哈希连接中对大字符串和二进制类型进行切片时的偏移量大小计算 (#38147)
- GH-38076 - [Java][CI][Java-Jars][MacOS] 适用于 MacOS AARCH 64 的 C++ 库
- GH-38077 - [C++] 将绑定的 GoogleTest 输出到 ${BUILD_DIR}/${CONFIG} (#38132)
- GH-38084 - [R] 当明确检查文件移除时不要进行内存映射 (#38085)
- GH-38193 - [CI][Java] 为 "AMD64 manylinux2014 Java JNI" 释放磁盘空间 (#38194)
- GH-38197 - [R] 更新曾使用 setup-r@v1 的 actions 以使用 setup-r@v2 (#38218)
- GH-38200 - [CI][Release][Go] 确保移除所有模块缓存 (#38222)
- GH-38201 - [CI][Packaging] 在 conan 上使用 thrift 时固定 zlib 版本为 1.2.13 (#38202)
- GH-38206 - [CI] 移除更多预安装文件 (#38233)
- GH-38226 - [R] 从 test-r-versions 中移除 R 3.5 (#38230)
- GH-38227 - [R] 修复 nightly 构建中的非 unicode 字符错误 (#38232)
- GH-38228 - [R] 使用 `examplesIf` 将需要数据集的示例括起来 (#38229)
- GH-38239 - [CI][Python] 暂时在 Python CI 作业中禁用 -W error (#38238)
- GH-38263 - [C++]:在需要 char 指针的地方,优先调用 string_view::data() 而非 begin() (#38265)
- GH-38282 - [C++]:使用正确的类型签名实现 ReplaceString (#38283)
- GH-38286 - [CI][R] 为 ubuntu-r-only-r 镜像清理 GitHub runner 磁盘 (#38287)
- GH-38293 - [R] 修复不确定的 duckdb 测试 (#38294)
- GH-38295 - [CI][R] 为 Azure Pipelines 作业释放磁盘空间 (#38302)
- GH-38332 - [CI][Release] 在 RAT lint 中解析符号链接 (#38337)
新功能和改进
- GH-20086 - [C++] 固定大小列表和可变大小列表之间的转换 (#37292)
- GH-21815 - [JS] 添加对 Duration 类型的支持 (#37341)
- GH-24868 - [C++] 使用 ExtensionType 添加一个具有可变维度的 Tensor 逻辑值类型 (#37166)
- GH-25659 - [Java] 为 Large 类型添加 DefaultVectorComparators (#37887)
- GH-29184 - [R] 读取以逗号作为小数点的 CSV (#38002)
- GH-29238 - [C++][Dataset][Parquet] 在新的 Dataset API 中支持 parquet 模块化加密 (#34616)
- GH-29847 - [C++] 使用 C++ Azure SDK 进行构建 (#36835)
- GH-32863 - [C++][Parquet] 向 Parquet 写入器添加 DELTA_BYTE_ARRAY 编码器 (#14341)
- GH-33032 - [C#] 支持固定大小列表 (#35716)
- GH-33749 - [Ruby] 添加 Arrow::RecordBatch#each_raw_record (#37137)
- GH-33985 - [C++] 添加表达式的 substrait 序列化/反序列化 (#34834)
- GH-34031 - [Python] 使用 PyCapsule 在 Python 层级通信 C 数据接口指针
- GH-34105 - [R] 为失败的构建提供额外输出 (#37727)
- GH-34213 - [C++] 如果用户正在进行递归 GetFileInfo,则使用不带分隔符的递归调用 (#35440)
- GH-34252 - [Java] 支持 ScannerBuilder::Project 或 ScannerBuilder::Filter 作为 Substrait proto 扩展表达式 (#35570)
- GH-34588 - [C++][Python] 为 "dictionary_decode" 添加一个 MetaFunction (#35356)
- GH-34620 - [C#] 在 .NET 6.0+ 上支持 DateOnly 和 TimeOnly (#36125)
- GH-34950 - [C++][Parquet] 支持页面索引加密 (#36574)
- GH-35116 - [CI][C++] 在某些 CI 平台上启用编译时 AVX2 (#36662)
- GH-35176 - [C++] 添加对为 emscripten 禁用线程的支持 (#35672)
- GH-35243 - [C#] 实现 MapType (#37885)
- GH-35273 - [C++] 添加整数舍入内核 (#36289)
- GH-35287 - [C++][Parquet] 添加 CodecOptions 以自定义压缩参数 (#35886)
- GH-35296 - [Go] 添加 arrow.Table.String() (#35580)
- GH-35409 - [Python][Docs] 阐明 EC2 的 S3FileSystem 凭证链 (#35312)
- GH-35531 - [Python] C 数据接口 PyCapsule 协议 (#37797)
- GH-35600 - [Python] 允许通过 python API 设置时区数据库的路径 (#37436)
- GH-35623 - [C++][Python] FixedShapeTensorType.ToString() 应打印类型的参数 (#36496)
- GH-35627 - [Format][Integration] 将 string-view 添加到 arrow 格式 (#37526)
- GH-35698 - [C#] 更新 FlatBuffers (#35699)
- GH-35740 - 为列表数组的 values 属性添加文档 (#35865)
- GH-35775 - [Go][Parquet] 允许在写入行组后写入键值文件元数据 (#37786)
- GH-35903 - [C++] Azure Blob Storage 文件系统实现的骨架 (#35701)
- GH-35916 - [Java][arrow-jdbc] 向 JdbcFieldInfo 添加额外字段 (#37123)
- GH-35934 - [C++][Parquet] PageIndex 读取基准测试 (#36702)
- GH-36078 - [C#] C# 的 Flight SQL 实现 (#36079)
- GH-36103 - [C++] 初始设备同步 API (#37040)
- GH-36111 - [C++] 重构 dict_internal.h 以使用 Result (#37754)
- GH-36124 - [C++] 默认导出 compile_commands.json (#37426)
- GH-36155 - [C++][Go][Java][FlightRPC] 添加对长时运行查询的支持 (#36946)
- GH-36187 - [C++] 在返回状态 "数据类型 ... 在连接非键字段中不受支持" 时显示问题字段的名称,用于 HashJoin (#36539)
- GH-36199 - [Python][CI][Spark] 更新我们 nightly 测试中使用的 spark 版本 (#36347)
- GH-36240 - [Python] 将 CumulativeSumOptions 重构为一个单独的类,以便独立弃用 (#36977)
- GH-36247 - [R] 添加 write_csv_dataset (#36436)
- GH-36326 - [C++] 移除在 v9.0 或更早版本中已弃用的 API (#36675)
- GH-36363 - [MATLAB] 为 DataType 类层次结构创建代理类 (#36419)
- GH-36417 - [C++] 添加 Buffer::data_as, Buffer::mutable_data_as (#36418)
- GH-36420 - [C++] 为 SetLookup 选项添加一个枚举选项 (#36739)
- GH-36433 - [C++] 将 fast_float 版本更新到 3.10.1 (#36434)
- GH-36469 - [Java][Packaging] 使用 mavencentral jars 分发 linux aarch64 库 (#36487)
- GH-36488 - [C++] 导入/导出 ArrowDeviceArray (#36489)
- GH-36511 - [C++][FlightRPC] 移除 GRPCPP_PP_INCLUDE (#36679)
- GH-36512 - [C++][FlightRPC] 添加异步 GetFlightInfo 客户端调用 (#36517)
- GH-36546 - [Swift] swift arrow flight 的初始实现 (#36547)
- GH-36570 - [Dev] 为 PR 添加 "Component: Swift" 标签 (#36571)
- GH-36573 - [CI] 移除 Travis CI 相关文件和提及 (#36741)
- GH-36590 - [Docs] 支持 Pydata Sphinx Theme 0.14.0 (#36591)
- GH-36601 - [MATLAB] 添加一个 MATLAB "类型特征" 类层次结构 (#36653)
- GH-36614 - [MATLAB] 子类化 arrow::Buffer 以保持支持 arrow::Arrays 的 MATLAB 数据存活 (#36615)
- GH-36618 - [C++] 为 ARROW_CHECK payload 的评估添加一个测试 (#36617)
- GH-36621 - [C++] 为 ACERO_ALIGNMENT_HANDLING 添加文档 (#36622)
- GH-36623 - [Go] 为 csv 添加 NullType 支持 (#36624)
- GH-36642 - [Python][CI] 在 pytest 期间将警告配置为错误 (#37018)
- GH-36643 - [C++][Parquet] 在 parquet 中使用嵌套命名空间 (#36647)
- GH-36652 - [MATLAB] 从现有的代理 ID 初始化 `arrow.array.Array` 子类的 `Type` 属性 (#36731)
- GH-36666 - [Python][CI] 重新启用被跳过的 dask 测试 test_pandas_timestamp_overflow_pyarrow (#38066)
- GH-36671 - [Go] BinaryMemoTable 优化 GetOrInsert 的分配 (#36811)
- GH-36672 - [Python][C++] 添加对向量函数 UDF 的支持 (#36673)
- GH-36674 - [C++] 在 arrow/ipc/reader.cc 中使用匿名命名空间 (#36937)
- GH-36696 - [Go] 改进 MapOf 和 ListOf 辅助函数 (#36697)
- GH-36698 - [Go][Parquet] 添加一个 TimestampLogicalType 创建函数… (#36699)
- GH-36709 - [Python] 允许在 Table.group_by 中指定 use_threads=False 以获得稳定的排序 (#36768)
- GH-36734 - [MATLAB] 在 ArrowType 而非 CType 上模板化 arrow::matlab::proxy::NumericArray (#36738)
- GH-36735 - 将 `TimeUnit` 和 `TimeZone` 添加到 `arrow.type.TimestampType` 的显示中 (#36871)
- GH-36750 - [R] 修复在 MacOS 上的 test-r-devdocs (#36751)
- GH-36752 - [Python] 在构建 wheels 时移除 AWS SDK 的绑定 (#36925)
- GH-36762 - [Dev] 当 issue 更新时仅移除组件标签 (#36763)
- GH-36765 - [Python][Dataset] 读取 Parquet 文件时将 pre_buffer 的默认值更改为 True (#37854)
- GH-36767 - [C++][CI] 修复在 i386 上的测试失败 (#36769)
- GH-36770 - [C++] 使用环境变量 AWS_ENDPOINT_URL 为 s3 使用自定义端点 (#36791)
- GH-36773 - [C++][Parquet] 避免多次计算预缓冲列的位图 (#36774)
- GH-36789 - [C++] 支持 divide(duration, duration) (#36800)
- GH-36793 - [Go] 允许 NewSchemaFromStruct 在字段被标记为 parquet:"-" 时跳过它们 (#36794)
- GH-36795 - [C#] 实现对稠密和稀疏联合体的支持 (#36797)
- GH-36816 - [C#] 减少内存分配 (#36817)
- GH-36824 - [C++] 改进 if-else 内核测试中 CheckWithDifferentShapes 的测试跟踪 (#36825)
- GH-36837 - [CI][RPM] 使用多核安装 gems (#36838)
- GH-36843 - [Python][Docs] 将 dict 添加到文档字符串中 (#36842)
- GH-36845 - [C++][Python] 允许在 `pa.concat_tables` 上进行类型提升 (#36846)
- GH-36852 - [MATLAB] 添加 `arrow.type.Field` 类 (#36855)
- GH-36853 - [MATLAB] 添加一个工具,从现有的 `arrow::DataType` 对象创建代理 (#36873)
- GH-36867 - [C++] 添加一个 struct_ 和 schema 的重载,接受一个 (name, type) 对的向量 (#36915)
- GH-36874 - [MATLAB] 将类型构造函数从 `arrow.type` 包移动到 `arrow` 包 (#36875)
- GH-36882 - [C++][Parquet] 当数据页和版本都是 V2 时,使用 RLE 作为 BOOLEAN 的默认编码 (#38163)
- GH-36882 - [C++][Parquet] 在 parquet 2.x 版本中默认为布尔值使用 RLE 编码 (#36955)
- GH-36885 - [Java][Docs] 将 substrait 依赖项添加到 maven 构建配置文件 (#36899)
- GH-36886 - [C++] 配置 `azurite` 以准备测试 Azure C++ 文件系统 (#36988)
- GH-36893 - [Go][Flight] 暴露底层的 protobuf 定义 (#36895)
- GH-36905 - [C++] 为选择函数添加 SparseUnion 支持 (#36906)
- GH-36927 - [Java][Docs] 在 Java maven 命令中启用 Gandiva 构建 (#36929)
- GH-36931 - [C++] 添加 cumulative_mean 函数 (#36932)
- GH-36933 - [Python] 数组 repr 中无意义的省略号 (#37168)
- GH-36936 - [Go] 使注册自定义函数成为可能 (#36959)
- GH-36944 - [C++] 为构建 GCS 统一 OpenSSL 检测 (#36945)
-
GH-36950 - [C++] 更改 std::vector<std::shared_ptr
> 以使用其别名:FieldVector (#37101) - GH-36952 - [C++][FlightRPC][Python] 添加发送头信息的方法 (#36956)
- GH-36953 - [MATLAB] 添加网关 `arrow.array` 函数以从 MATLAB 数据创建 Arrow 数组 (#36978)
- GH-36961 - [MATLAB] 添加 `arrow.tabular.Schema` 类及相关的 `arrow.schema` 构造函数 (#37013)
- GH-36970 - [C++][Parquet] parquet 元数据的小样式修复 (#36971)
- GH-36984 - [MATLAB] 创建 `arrow.recordbatch` 便捷构造函数 (#37025)
- GH-36990 - [R] 暴露 Parquet ReaderProperties (#36992)
- GH-36994 - [Java] 在 CI 中使用 JDK 21 (#38219)
- GH-37012 - [MATLAB] 从 `arrow.tabular.RecordBatch` 中移除私有属性 `ArrowArrays` (#37015)
- GH-37014 - [C++][Parquet] 合并统计信息时保留一些 Parquet 的 distinct counts (#37016)
- GH-37021 - [Java][arrow-jdbc] 可插拔的 getConsumer (#37085)
- GH-37028 - [C++] 为 if_else 函数添加对 duration 类型的支持 (#37064)
- GH-37041 - [MATLAB] 使用新的 MATLAB 接口 API 实现 Feather V1 读取器 (#37044)
- GH-37042 - [MATLAB] 使用新的 MATLAB 接口 API 实现 Feather V1 写入器 (#37043)
- GH-37045 - [MATLAB] 基于 arrow.internal.io.feather.Writer 实现 featherwrite (#37047)
- GH-37046 - [MATLAB] 基于 `arrow.internal.io.feather.Reader` 实现 `featherread` (#37163)
- GH-37049 - [MATLAB] 更新 feather `Reader` 和 `Writer` 对象,使其直接与 `arrow.tabular.RecordBatch` 而非 MATLAB `table` 一起工作 (#37052)
- GH-37051 - [Dev][JS] 为 npm 添加 Dependabot 配置 (#37053)
- GH-37073 - [Java] JDBC:仅在未提供令牌时使用用户名/密码认证 (#37083)
- GH-37093 - [Python] 添加带 GetFlightInfo 的异步 Flight 客户端 (#36986)
- GH-37096 - [MATLAB] 添加一个实用工具,从任意字符串列表中创建有效的 MATLAB 表变量名 (#37098)
- GH-37124 - [MATLAB] 添加用于验证数字和字符串索引值的实用函数 (#37150)
- GH-37128 - [Java] 将 CI 作业从 JDK 18 提升到 JDK 20 (#37125)
- GH-37141 - [GLib][FlightRPC] 添加更多 ArrowFlight::ClientOptions 属性 (#37142)
- GH-37143 - [GLib][FlightSQL] 添加对预备 INSERT 的支持 (#37196)
- GH-37144 - [C++] 添加 RecordBatchFileReader::To{RecordBatches,Table} (#37167)
- GH-37145 - [Python] 在 from_dataframe 中支持位大小为 1 的布尔列 (#37975)
- GH-37151 - [MATLAB] 在 `RecordBatch` 的 `table` 方法实现中使用 `makeValidVariableNames` 和 `makeValidDimensionNames` (#37152)
- GH-37155 - [MATLAB] 在 `arrow.tabular.RecordBatch` 的 `column()` 方法中使用 `arrow.internal.validate.index.numeric()` (#37156)
- GH-37157 - [MATLAB] 在 `arrow.tabular.Schema` 的 `field()` 方法中使用 `arrow.internal.validate.index.numericOrString()` (#37162)
- GH-37160 - [MATLAB] 如果给定一个零字符的字符串,`arrow.internal.validate.index.string()` 不应报错 (#37161)
- GH-37170 - [C++] 支持 RecordBatch 的 schema 重写 (#37171)
- GH-37175 - [MATLAB] 支持从 `arrow.array.Array` 值列表创建 `arrow.tabular.RecordBatch` 实例 (#37176)
- GH-37179 - [MATLAB] 添加一个测试工具,用于创建一个包含所有受支持类型的 MATLAB `table` (#37191)
- GH-37181 - [MATLAB] 移除过时的测试类 `tArrowCppCall.m` (#37185)
- GH-37182 - [MATLAB] 为 MATLAB `arrow.tabular.RecordBatch` 类添加公共 `Schema` 属性 (#37184)
- GH-37187 - [MATLAB] 基于新的内部 Feather Reader 和 Writer 对象重新实现 `tfeathermex.m` 测试 (#37189)
- GH-37188 - [MATLAB] 将 `test/util/featherRoundTrip.m` 移动到一个打包的测试实用函数中 (#37190)
- GH-37203 - [MATLAB] 移除未使用的 feather V1 MEX 基础设施和代码 (#37204)
- GH-37209 - [CI][Docs][MATLAB] 从 CMake 构建系统中移除对 `MATLAB_ARROW_INTERFACE` 标志的支持,并默认构建新的 MATLAB 接口代码 (#37211)
- GH-37210 - [Docs][MATLAB] 更新 MATLAB `README.md`,提及对新 MATLAB API 的支持 (例如 `RecordBatch`、`Field`、`Schema` 等) (#37215)
- GH-37212 - [C++] IO:为 ::arrow::io::BufferReader 添加 FromString (#37360)
- GH-37216 - [Docs] 添加处理未释放分配器的文档 (#37498)
- GH-37222 - [Docs][MATLAB] 将 `arrow.recordbatch` (全小写) 重命名为 `arrow.recordBatch` (驼峰式) (#37223)
- GH-37228 - [MATLAB] 添加 C++ `ARROW_MATLAB_EXPORT` 符号导出宏 (#37233)
- GH-37229 - [MATLAB] 添加 `arrow.type.Date32Type` 类和 `arrow.date32` 构造函数 (#37348)
- GH-37230 - [MATLAB] 添加 `arrow.type.Date64Type` 类和 `arrow.date64` 构造函数 (#37578)
- GH-37231 - [MATLAB] 添加 `arrow.type.Time32Type` 类和 `arrow.time32` 构造函数 (#37250)
- GH-37232 - [MATLAB] 添加 `arrow.type.Time64Type` 类和 `arrow.time64` 构造函数 (#37287)
- GH-37234 - [MATLAB] 创建一个抽象的 `arrow.type.TemporalType` 类 (#37236)
- GH-37237 - [C++] 将所有下载内容的提取时间设置为其时间戳 (#37238)
- GH-37244 - [Python] 移除对 pickle5 的支持 (#37644)
- GH-37246 - [Java] 暴露 VectorAppender 类以支持追加向量值 (#37247)
- GH-37251 - [MATLAB] 使 `arrow.type.TemporalType` 成为一个“标签”类 (#37256)
- GH-37252 - [MATLAB] 添加 `arrow.type.DateUnit` 枚举类 (#37280)
- GH-37253 - [MATLAB] 为 `hFixedWidth` 测试类添加测试用例,验证 `NumFields`、`BitWidth` 和 `ID` 属性不能被修改 (#37316)
- GH-37254 - [Python] 参数化所有 pickling 测试以使用 pickle 和 cloudpickle 模块 (#37255)
- GH-37257 - [Ruby][FlightSQL] 为自动关闭预备语句请求使用相同的选项 (#37258)
- GH-37259 - [Ruby] 添加显式的 csv gem 依赖 (#37506)
- GH-37262 - [MATLAB] 添加一个名为 `arrow.type.TimeType` 的抽象类 (#37279)
- GH-37268 - [C++] 在 fs 和 dataset 的一些构造函数中添加移动操作 (#37264)
- GH-37273 - [C++] 提升绑定的 xxhash 版本 (#37275)
- GH-37290 - [MATLAB] 添加 `arrow.array.Time32Array` 类 (#37315)
- GH-37293 - [C++][Parquet] 编码:为 DELTA_BYTE_ARRAY 添加基准测试 (#37641)
- GH-37306 - [Go] 添加二进制字典统一器 (#37309)
- GH-37307 - [Python][CI] 对 nightly dask 集成测试,手动跳过带有 skip_with_pyarrow_strings 标记的测试 (#37324)
- GH-37330 - [Docs][CI] 增加 Sphinx 构建的超时时间 (#37331)
- GH-37334 - [Packaging][Release][RPM] 不要移除旧的 repodata/* (#37351)
- GH-37337 - [MATLAB] 添加 `arrow.array.Time64Array` 类 (#37368)
- GH-37345 - [MATLAB] 将函数句柄添加到 `TypeTraits` 类的 `fromMATLAB` 静态构造方法中 (#37370)
- GH-37364 - [C++][GPU] 添加 Device Event/Stream 的 CUDA 实现 (#37365)
- GH-37367 - [MATLAB] 添加 `arrow.array.Date32Array` 类 (#37445)
- GH-37379 - [C++][Parquet] Thrift: 生成可移动类型 (#37461)
- GH-37384 - [R] 在 CI 上设置 R_CHECK_STOP_ON_INVALID_NUMERIC_VERSION_INPUTS = TRUE (#37385)
- GH-37391 - [MATLAB] 在 `arrow.array.Array` 上实现 `isequal()` 方法 (#37446)
- GH-37392 - [JS] 移除 lerna (#37393)
- GH-37394 - [C++][S3] 使用 AWS_SDK_VERSION_* 而非 try_compile() (#37395)
- GH-37416 - [Go] 允许访问字典构建器的底层索引构建器 (#37417)
- GH-37434 - [C++] IO: 为小输入重构 BufferedInputStream::Read (#37460)
- GH-37440 - [C#][Docs] 将 Flight SQL 支持的函数添加到 status.rst (#37441)
- GH-37447 - [C++][Docs] 文档化 `ARROW_SUBSTRAIT` CMake 标志 (#37451)
- GH-37448 - [MATLAB] 添加 `arrow.array.ChunkedArray` 类 (#37525)
- GH-37465 - [Go] 向 BooleanBuilder 添加 Value 方法 (#37459)
- GH-37472 - [MATLAB] 在 `arrow.type.Type` 上实现 `isequal()` 方法 (#37474)
- GH-37473 - [MATLAB] 添加对按 `Field` 名称索引 `RecordBatch` 列的支持 (#37475)
- GH-37477 - [MATLAB] 为 arrow.internal.validate.index.* 验证函数添加 `AllowNonScalar` 名称-值对 (#37482)
- GH-37510 - [C++] 不要安装绑定的 C++ Azure SDK (#38176)
- GH-37532 - [CI][Docs][MATLAB] 从 MATLAB 接口的 CMake 构建系统中移除 `GoogleTest` 支持 (#37784)
- GH-37537 - [Integration][C++] 添加 C 数据接口集成测试 (#37769)
- GH-37553 - [Java] 允许 FlightInfo#Schema 对于长时运行的查询为空 (#37528)
- GH-37562 - [Ruby] 添加对 table.each_raw_record.to_a 的支持 (#37600)
- GH-37567 - [C++] 将 JSON 集成代码迁移到 Result<> (#37573)
- GH-37568 - [MATLAB] 为 `arrow.tabular.Schema` MATLAB 类实现 `isequal` (#37619)
- GH-37569 - [MATLAB] 为 `arrow.type.Field` MATLAB 类实现 `isequal` (#37617)
- GH-37570 - [MATLAB] 为 `arrow.tabular.RecordBatch` MATLAB 类实现 `isequal` (#37627)
- GH-37571 - [MATLAB] 添加 `arrow.tabular.Table` MATLAB 类 (#37620)
- GH-37572 - [MATLAB] 添加 `arrow.array.Date64Array` 类 (#37581)
- GH-37584 - [Go] 为字符串数组添加值长度函数 (#37586)
- GH-37587 - [C++] 将集成机制移动到其自己的目录和命名空间中 (#37588)
- GH-37591 - [MATLAB] 使 `arrow.type.Type` 继承自 `matlab.mixin.Heterogeneous` (#37593)
- GH-37597 - [MATLAB] 向 `arrow.array.ChunkedArray` 类添加 `toMATLAB` 方法 (#37613)
- GH-37628 - [MATLAB] 为 `arrow.tabular.Table` MATLAB 类实现 `isequal` (#37629)
- GH-37635 - [Format][C++][Go] 将 app_metadata 添加到 FlightInfo 和 FlightEndpoint (#37679)
- GH-37636 - [Go] 提升最低 go 版本 (#37637)
- GH-37643 - [C++] 增强 arrow::Datum::ToString (#37646)
- GH-37651 - [C#] 暴露 ArrowArrayConcatenator.Concatenate (#37652)
- GH-37653 - [MATLAB] 添加 `arrow.array.StructArray` MATLAB 类 (#37806)
- GH-37654 - [MATLAB] 向 `arrow.type.Type` MATLAB 类添加 `Fields` 属性 (#37725)
- GH-37670 - [C++] IO FileInterface 继承自 enable_shared_from_this (#37713)
- GH-37681 - [R] 更新 NEWS.md for 13.0.0.1 (#37682)
- GH-37687 - [Go] 当容量足够时,在 realloc 中不进行复制。(#37688)
- GH-37694 - [Go] 为数组构建器添加 SetNull (#37695)
- GH-37701 - [Java] 为更多类型添加默认比较器 (#37748)
- GH-37702 - [Java] 添加与 C++ 一致的向量验证 (#37942)
- GH-37703 - [Java] 用于在 ListVector 中设置精确记录数的方法 (#37838)
- GH-37704 - [Java] 添加 schema IPC 序列化方法 (#37778)
- GH-37705 - [Java] VarChar 写入器的额外输入方法 (#37883)
- GH-37705 - [Java] 二进制写入器的额外输入方法 (#37791)
- GH-37706 - [Java] VarCharWriter 应支持从 `Text` 和 `String` 写入
- GH-37722 - [Java][FlightRPC] 弃用有状态的登录方法 (#37833)
- GH-37724 - [MATLAB] 添加 `arrow.type.StructType` MATLAB 类 (#37749)
- GH-37742 - [Python] 启用 Cython 3 (#37743)
- GH-37744 - [Swift] 为 arrow flight doGet FlightData 添加测试 (#37746)
- GH-37770 - [MATLAB] 添加 CSV `TableReader` 和 `TableWriter` MATLAB 类 (#37773)
- GH-37779 - [Go] 链接到 pkg.go.dev 网站以获取 Go 参考文档 (#37780)
- GH-37782 - [C++] 为 `arrow::StructArray` 添加 `CanReferenceFieldsByNames` 方法 (#37823)
- GH-37789 - [Integration][Go] Go C 数据接口集成测试 (#37788)
- GH-37795 - [Java][FlightSQL] 添加模拟的 FlightSqlProducer 和测试 (#37837)
- GH-37799 - [C++] 计算:CommonTemporal 支持 time32 和 time64 转换 (#37949)
- GH-37825 - [MATLAB] 改进 `arrow.type.Field` 的显示 (#37826)
- GH-37835 - [MATLAB] 改进 `arrow.tabular.Schema` 的显示 (#37836)
- GH-37842 - [R] 实现 infer_schema.data.frame() (#37843)
- GH-37849 - [C++] 将 cpp/src/**/*.cmake 添加到 cmake-format 目标 (#37850)
- GH-37851 - [C++] IPC: ArrayLoader 样式增强 (#37872)
- GH-37863 - [Java] 为 StructVector 添加类型化的 getters (#37916)
- GH-37864 - [Java] 从 OrcReader 中移除不必要的 throws (#37913)
- GH-37873 - [C++][Parquet] DELTA_BYTE_ARRAY: 在可能的情况下避免复制数据 (#37874)
- GH-37876 - [Format] 将 list-view 规范添加到 arrow 格式中 (#37877)
- GH-37880 - [CI][Python][Packaging] 添加对 Python 3.12 的支持 (#37901)
- GH-37906 - [Integration][C#] 实现 C# 的 C 数据接口集成测试 (#37904)
- GH-37917 - [Parquet] 为 FileSource 添加 OpenAsync (#37918)
- GH-37923 - [R] 将 macOS 构建系统移至 nixlibs.R (#37684)
- GH-37934 - [Doc][Integration] 文档化 C 数据接口测试 (#37935)
- GH-37939 - [C++] 在编码 DELTA_BINARY_PACKED 时对参考帧使用有符号算术 (#37940)
- GH-37941 - [R][CI][Release] 为预编译的二进制文件添加校验和验证 (#38115)
- GH-37945 - [R] 更新开发者文档 (#38220)
- GH-37971 - [CI][Java] nightly 上传不使用缓存 (#37980)
- GH-37978 - [C++] 添加对为 `arrow::PrettyPrintOptions` 指定自定义数组元素分隔符的支持 (#37981)
- GH-37984 - [Release] 为 YAML 日期值使用 ISO 8601 格式 (#37985)
- GH-37994 - [R] 为 CSV*Options 类创建包装函数 (#37995)
- GH-37996 - [MATLAB] 向 `arrow.array.StructArray` 添加一个名为 `fromMATLAB` 的静态构造方法 (#37998)
- GH-38005 - [Java] 运行 Java 测试时禁用调试日志 (#38006)
- GH-38015 - [MATLAB] 将 `arrow.buffer.Buffer` 类添加到 MATLAB 接口 (#38020)
- GH-38017 - [Go][FlightSQL] 增加由内部转换器处理的类型 (#38028)
- GH-38043 - [R] 在 macOS 上默认启用所有功能 (#38195)
- GH-38053 - [C++][Go] 从 Schema.fbs 重新生成源文件 (#38054)
- GH-38055 - [C++] 当 ARROW_ENABLE_THREADING=OFF 时不查找/使用 Threads::Threads (#38056)
- GH-38063 - [C++] 对外部项目的 ar/ranlib 使用绝对路径 (#38064)
- GH-38071 - [C++][CI] 修复预缓冲(pre-buffer)的重叠列块范围问题 (#38073)
- GH-38088 - [R] 移除对 brew 和 autobrew 的过时引用 (#38089)
-
GH-38138 - [R] 在建议依赖(suggests)中添加 curl 以便使用
skip_if_offline()(#38140) - GH-38142 - [R] 为 14.0.0 版本添加更新日志(NEWS) (#38143)
- GH-38145 - [文档][Python] 在 Python 安装文档中添加关于在 Windows 上安装 tzdata 的小节 (#38146)
- GH-38159 - [CI][发布] 在集成测试模式下仅运行集成测试 (#38177)
- GH-38172 - [CI][C++] 在 Ubuntu 22.04 上使用系统自带的 GoogleTest (#38173)
- GH-38174 - [C++] 将绑定的 Azure SDK for C++ 更新至 1.10.3 版本 (#38175)
- GH-38209 - [文档] 在较小屏幕上减小页眉项目的宽度并保持默认(较小)的页眉高度 (#38148)
- GH-38240 - [文档] version_match 应匹配 versions.json 中的版本 (#38241)
- GH-38243 - [CI][Python] 为数据集加密测试添加缺失的 dataset 标记 (#38244)
- GH-38285 - [Go] 轻微的依赖和文档更新 (#38284)
- GH-38312 - [文档] 将 Arrow C 设备数据接口页面添加到侧边栏目录(TOC)中 (#38313)
- PARQUET-2323 - [C++] 使用位图(bitmap)存储预缓冲的列块 (#36649)