Apache Arrow 14.0.0 (2023 年 11 月 1 日)
这是一个涵盖了 2 个多月开发的主要版本。
下载
贡献者
此版本包含来自 116 位不同贡献者的 612 个提交。
$ git shortlog -sn apache-arrow-13.0.0..apache-arrow-14.0.0
69 Sutou Kouhei
59 dependabot[bot]
52 sgilmore10
34 Nic Crane
28 mwish
27 Raúl Cumplido
25 Kevin Gurney
19 Antoine Pitrou
19 Dewey Dunnington
17 Alenka Frim
16 Dane Pitkin
16 Matt Topol
13 Joris Van den Bossche
12 Jin Shang
11 David Li
11 Felipe Oliveira Carvalho
10 James Duong
8 Curt Hagenlocher
7 Jacob Wujciak-Jens
6 Benjamin Kietzman
6 Weston Pace
5 Frederic Branczyk
5 david dali susanibar arce
4 Ben Harkins
4 Thor
3 Bryce Mecum
3 Chris Jordan-Squire
3 Diego Fernández Giraldo
3 Francis
3 Ian Cook
3 Jonathan Keane
3 Junming Chen
3 Tim Schaub
3 h-vetinari
3 takuya kodama
2 Abe Tomoaki
2 Adam Reeve
2 Dominik Moritz
2 Elliott Brossard
2 Fokko Driesprong
2 Gang Wu
2 Mark Wolfe
2 Matthias Loibl
2 Rok Mihevc
2 Thomas Newton
2 Timothy Meehan
2 Vibhatha Lakmal Abeykoon
2 Will Jones
2 abandy
2 davidhcoe
2 jeremyosterhoudt
2 lambda
2 谢天
1 0x26res
1 Alex Shcherbakov
1 Alexander Grueneberg
1 Angela Li
1 Anja Kefala
1 Arkadiusz Rudny
1 Ashish Bailkeri
1 Austin Dickey
1 Bruno Tremblay
1 Chelsea Jones
1 Christian Lorentzen
1 Danyaal Khan
1 David Greiss
1 DenisTarasyuk
1 Donald Tolley
1 Ed Seidl
1 Edward Visel
1 Eero Lihavainen
1 Erik McKelvey
1 Fernando Mayer
1 František Nečas
1 George Godik
1 Hirokazu SUZUKI
1 Hyunseok Seo
1 Ikko Eltociear Ashimine
1 Ivan Chesnov
1 Jacek Stania
1 James Henderson
1 Jinpeng
1 Joe Marshall
1 Jonathan Swenson
1 Judah Rand
1 Justin Heesemann
1 KarateSnowMachine
1 Kevin Liu
1 Kuba Martin
1 Kyle Barron
1 Laurent Goujon
1 Li Jin
1 Michael Lui
1 Miguel Pragier
1 Paul Taylor
1 Rajat Subhra Mukherjee
1 Ray Zhang
1 SGZW
1 Sam Albers
1 Slobodan Ilic
1 Spencer Nelson
1 Srinivas Lade
1 Tero Vuotila
1 Thomas Grainger
1 Tommy Setiawan
1 Val Gridnev
1 Vitalii Tverdokhlib
1 Yue
1 andrewchambers
1 hrishisd
1 ismail simsek
1 panbingkun
1 patrick
1 pegasas
1 rtpsw
1 yyang52
补丁提交者
以下 Apache 提交者将贡献的补丁合并到存储库中。
$ git shortlog -sn --group=trailer:signed-off-by apache-arrow-13.0.0..apache-arrow-14.0.0
190 Sutou Kouhei
81 Antoine Pitrou
70 Kevin Gurney
46 Matt Topol
40 David Li
35 Nic Crane
31 Raúl Cumplido
28 Joris Van den Bossche
19 Jacob Wujciak-Jens
14 Dewey Dunnington
12 AlenkaF
12 Weston Pace
11 Benjamin Kietzman
4 Gang Wu
3 Dominik Moritz
2 Eric Erhardt
2 Jonathan Keane
1 Li Jin
1 Will Jones
变更日志
Apache Arrow 14.0.0 (2023-10-31 07:00:00)
错误修复
- GH-15017 - [Python] 加强 test_memory.py 以便与 ARROW_USE_GLOG=ON 一起使用 (#36901)
- GH-15281 - [C++] 将 bytes_view 别名替换为 span (#36334)
- GH-31621 - [JS] 修复 Union 空位图 (#37122)
- GH-32439 - [Python] 修复分块嵌套结构时的差一错误 (#37376)
- GH-32483 - [文档][Python] 澄清您需要使用 conda-forge 安装 nightly conda 包 (#37948)
- GH-33807 - [R] 如果检测到在模拟下运行,则添加消息 (#37777)
- GH-34567 - [JS] 改进构建,不生成
bin/bin
目录 (#36607) - GH-34640 - [R] 当同时提供(非 Hive)分区和架构时,无法在 CSV 数据集中读取分区列 (#37658)
- GH-34909 - [C++] 避免大型整数输入的均值溢出 (#37243)
- GH-35095 - [C++] 防止在 arrow::ipc::IpcFormatWriter 关闭后写入 (#37783)
- GH-35167 - [文档][C++] 将新 API 用于 arrow::json::TableReader (#37301)
- GH-35292 - [发布] 重试“apt install” (#36836)
- GH-35328 - [Go][FlightSQL] 修复 FlightSql 驱动程序的测试不稳定问题 (#38044)
- GH-35450 - [C++] 当调用
RecordBatch::ToStructArray
时,如果列长度不匹配,则返回错误 (#36654) - GH-35581 - [C++] 将偏移量存储在标量中 (#36018)
- GH-35641 - [CI][C++] 禁用预编译头文件 (#37502)
- GH-35658 - [打包] 将 conda 配方与 feedstocks 同步 (#35637)
- GH-35770 - [Go][文档] 将 TimestampType 零值更新为注释中的秒 (#37905)
- GH-35942 - [C++] 提高 Decimal ToReal 的精度 (#36667)
- GH-36069 - [Java] 确保 S3 在关闭时最终化 (#36934)
- GH-36154 - [JS][CI] 在 CI 中使用
jest
缓存 (#36373) - GH-36189 - [C++][Parquet] StreamReader::SkipRows() 跳到多行组文件中不正确的位置 (#36191)
- GH-36318 - [Go] 仅解码现有值的长度,而不是所有 nvalues 的长度。 (#36322)
- GH-36323 - [Python] 修复 datetime 范围外值的 Timestamp 标量 repr 错误 (#36942)
- GH-36332 - [CI][Java] 与 Spark 的集成作业失败,并出现 NoSuchMethodError:io.netty.buffer.PooledByteBufAllocator
- GH-36371 - [Java] CycloneDX 无法加载 mojo ‘makeBom’
- GH-36379 - [C++] 捆绑的依赖项包含路径应覆盖系统包含目录 (#37612)
- GH-36502 - [C++] 将运行长度编码的数组支持添加到 ReferencedByteRanges (#36521)
- GH-36610 - [CI][C++] 默认情况下不启用 ARROW_ACERO (#36611)
- GH-36619 - [Python] Parquet 统计信息字符串表示具有误导性 (#36626)
- GH-36634 - [开发] 确保合并脚本在从 GitHub 请求信息时遍历所有页面 (#36637)
- GH-36638 - [R] 在 Windows 上使用 create_package_with_all_dependencies() 时出错 (#37226)
- GH-36645 - [Go] 在写入 parquet 时将 writer.Close 错误返回给调用者 (#36646)
- GH-36655 - [开发] 修复 fury 命令以上传 nightly wheels (#36657)
- GH-36663 - [C++] 修复枚举选项的默认值信息 (#36684)
- GH-36680 - [Python] 添加缺失的 pytest.mark.acero (#36683)
- GH-36685 - [R][C++] 修复使用 Homebrew 时的非法操作码失败 (#36705)
- GH-36688 - [C#] 修复取消引用错误 (#36691)
- GH-36692 - [CI][打包] 由于 faraday 依赖项的问题,将 gemfury 固定为 0.12.0 (#36693)
- GH-36708 - [C++] 完全计算空计数,以便 REE 分配有意义 (#36740)
- GH-36712 - [CI] 当更新时,也更新问题组件 (#36723)
- GH-36720 - [R] 字符串修饰符函数不能使用命名空间前缀调用 (#36758)
- GH-36726 - [R] 在 S3 连接上调用 read_parquet 会导致错误消息被忽略 (#37024)
- GH-36730 - [Python] 添加对 Cython 3.0.0 的支持 (#37097)
- GH-36771 - [R] 字符串助手函数在评估时会删除调用环境 (#36784)
- GH-36776 - [C++] 使 ListArray::FromArrays() 处理包含空值的切片偏移量数组 (#36780)
- GH-36787 - [R] lintr 更新导致主分支上的测试失败 (#36788)
- GH-36809 - [Python] 具有自定义字段名称的 MapScalar.as_py (#36830)
- GH-36819 - [R] 使用 RunWithCapturedR 读取 Parquet 文件 (#37274)
- GH-36828 - [C++][Parquet] 使用 BufferedPageWriter 制作缓冲的 RowGroupSerializer (#36829)
- GH-36850 - [Go] Arrow Concatenate 修复,确保释放分配的内存 (#36854)
- GH-36856 - [C++] 从 BasicDecimal256FromLE() 参数中删除不必要的花括号 (#36987)
- GH-36858 - [Go] 修复字典构建器泄漏 (#36859)
- GH-36860 - [C++] 当系统 Protobuf 存在但系统 gRPC 不存在时,报告 CMake 错误 (#36904)
- GH-36863 - [C#] 如果 .NET > 5.0,则删除不必要应用的修复,以不在 CDataInterfacePythonTests 上关闭 PythonEngine (#36872)
- GH-36863 - [C#][打包] 如果 .NET > 5.0,则不在 CDataInterfacePythonTests 上关闭 PythonEngine (#36868)
- GH-36883 - [R] 删除触发 CRAN 警告的版本号 (#36884)
- GH-36920 - [Java][文档] 将 ARROW_JSON 变量添加到 maven 构建配置文件 (#36921)
- GH-36922 - [CI][C++][Windows] 从 PATH 搜索 OpenSSL (#36923)
- GH-36935 - [Go] 修复 Timestamp 到 Time 日期 (#36964)
- GH-36939 - [C++][Parquet] 多次调用时,直接放置 BooleanArray 不正确 (#36972)
- GH-36941 - [CI][文档] 使用系统 Protobuf (#36943)
- GH-36949 - [C++] 修复 KeyColumnArray 的缓冲区数组边界断言。 (#36966)
- GH-36973 - [CI][Python] Archery linter 与 flake8==6.1.0 集成 (#36976)
- GH-36975 - [C++][FlightRPC] 跳过未知字段,不要崩溃 (#36979)
- GH-36981 - [Go] 修复 ipc 读取器泄漏 (#36982)
- GH-36983 - [Python] pyarrow.fs.S3FileSystem 和 s3fs 之间的 get_file_info 行为不同 (#37768)
- GH-36991 - [Python][打包] 跳过 Win 上需要 tz 数据库的测试 (#36996)
- GH-37017 - [C++] 防止意外使用 BMI2 指令 (#37610)
- GH-37022 - [CI][Java] 使用官方 Maven 下载 URL (#37119)
- GH-37050 - [Python][交换协议] 添加针对空数据帧的解决方法 (#38037)
- GH-37056 - [Java] 修复从 c-data 导入空数据数组的问题 (#37531)
- GH-37067 - [C++] 安装捆绑的 GoogleTest (#37483)
- GH-37099 - [C++] 修复 Flight-UCX 的构建 (#37105)
- GH-37102 - [Go][Parquet] 编码:当 ReserveBytes 时,使 BitWriter 进行预留 (#37112)
- GH-37106 - [C++] 删除溢出的整数舍入基准测试 (#37109)
- GH-37107 - [C++] 使用 GCC 7 抑制未使用变量警告 (#37240)
- GH-37110 - [C++] 表达式:Scalar 的 SmallestTypeFor 丢失时区 (#37135)
- GH-37111 - [C++][Parquet] 数据集:修复架构转换 (#37793)
- GH-37116 - [C++][ORC] 为 ABSL_DCHECK*() 链接到 absl::log_internal_check_op (#37117)
- GH-37120 - [CI][文档] 确保删除现有的 Node.js (#37121)
- GH-37129 - [CI][文档] 使用 Ubuntu 22.04 (#37132)
- GH-37129 - [CI][文档] 释放磁盘空间 (#37131)
- GH-37148 - [C++] 显式列出 Type::type 枚举的整数值 (#37149)
- GH-37173 - [C++][Go][格式] C 导出/导入 Run-End 编码数组 (#37174)
- GH-37208 - [R] 使用当前正在运行的 R 二进制文件来编译测试程序 (nix 安装) (#37225)
- GH-37213 - [C#] 更新由于 rebase/合并冲突而遗漏的 FlatBuffers 的引用 (#37214)
- GH-37217 - [Python] 将缺失的文档字符串添加到 Cython (#37218)
- GH-37239 - [Ruby] 更新了 ArrowTable#initialize 的文档,以阐明参数详细信息 (#37261)
- GH-37245 - [MATLAB] 当创建消息以显示抛出
arrow:proxy:ProxyNameMismatch
错误时,arrow.internal.proxy.validate
会抛出MATLAB:UndefinedFunction
(#37248) - GH-37266 - [CI][C++] 使用 ARROW_CMAKE_ARGS 而不是 CMAKE_ARGS (#37272)
- GH-37276 - [C++] 在单线程环境中跳过多线程测试 (#37327)
- GH-37294 - [C++] 为 HasSubstr 匹配器使用 std::string (#37314)
- GH-37299 - [C++] 修复 Homebrew 的 clang-format 导致的 clang-format 版本不匹配错误 (#37300)
- GH-37303 - [Python] 由于 CumulativeSumOptions 重构,更新 test_option_class_equality (#37305)
- GH-37308 - [C++][文档] 更改 CPP 教程的名称,并对作业进行小的修复 (#37311)
- GH-37325 - [R] 使用 13.0.0 的缺失更改更新 NEWS.md (#37326)
- GH-37329 - [Release][Homebrew] 遵循目录结构更改 (#37349)
- GH-37340 - [MATLAB] 如果
index
引用arrow.array.Time32Array
列,则arrow.tabular.RecordBatch
的column(index)
方法会出错 (#37347) - GH-37352 - [C++] 不要将所有依赖项放入 ArrowConfig.cmake/arrow.pc (#37399)
- GH-37373 - [CI] 使集成构建更精简一些 (#37366)
- GH-37373 - [CI][集成] 释放磁盘空间 (#37374)
- GH-37377 - [C#] 在 TimestampArray.ConvertTo() 中的溢出时抛出 OverflowException (#37388)
- GH-37386 - [R] 由于“无效的非字符版本规范”导致 CRAN 失败 (#37387)
- GH-37406 - [C++][FlightSQL] 添加缺失的 ArrowFlight::arrow_flight_{shared,static} 依赖项 (#37407)
- GH-37408 - [C++] 仅当 ARROW_COMPUTE=ON 时安装 arrow-compute.pc (#37409)
- GH-37410 - [C++][Gandiva] 添加对使用 LLVM 共享库的支持 (#37412)
- GH-37411 - [C++][Python] 添加字符串 -> 日期转换内核 (修复 python 标量转换) (#38038)
- GH-37414 - [Release][CI] 更新对错误的 apache-arrow Homebrew 公式路径的引用 (#37415)
- GH-37419 - [Go][Parquet] pqarrow 的 Decimal256 支持 (#37503)
-
GH-37431 - [R] 由于在测试中使用基本管道 ( >) 导致 R 版本 < 4.0 的测试失败 (#37432) - GH-37433 - [CI][Release] 增加 macOS 的超时时间 (#37530)
- GH-37437 - [C++] 修复具有大型字符串值类型的列表数组的 MakeArrayOfNull (#37467)
- GH-37453 - [C++][Parquet] WriteBatch 的性能修复 (#37454)
- GH-37456 - [R] 由于未记录的内部函数,CRAN 传入检查显示 NOTE (#37457)
- GH-37463 - [R] 由于测试运行时间过长导致 CRAN 传入检查失败 (#37464)
- GH-37466 - [C++][Parquet] 修复 DELTA_BYTE_ARRAY 解码器中的 Valgrind 失败 (#37471)
- GH-37470 - [Python][Parquet] 将缺失的参数添加到
ParquetFileWriteOptions
(#37469) - GH-37480 - [Python] 提高包含 pandas 问题 50127 回归的 pandas 版本 (#37481)
- GH-37485 - [C++][Skyhook] 不要使用已弃用的 BufferReader API (#37486)
- GH-37487 - [C++][Parquet] 数据集:实现同步的
ParquetFileFormat::GetReader
(#37514) - GH-37488 - [C++] 为 Azure SDK for C++ 禁用 unity 构建 (#37489)
- GH-37500 - [CI][C++] 默认禁用数据集和 Substrait (#37501)
- GH-37507 - [GLib] 不要使用隐式包含目录 (#37508)
- GH-37515 - [C++] 如果
ChunkedArray
可以有NaN
值,则从ChunkedArray::Equals(const std::shared_ptr<arrow::ChunkedArray>& other)
中删除内存地址优化 (#37579) - GH-37523 - [C++][CI][CUDA] 不要使用较新的 API 并添加缺失的 CUDA 依赖项 (#37497)
- GH-37535 - [C++][Parquet] 在 parquet.pc 中添加缺失的“thrift”依赖项 (#37603)
- GH-37539 - [C++][FlightRPC] 修复与 IPv6 地址的绑定 (#37552)
- GH-37555 - [Python] 更新 get_file_info_selector 以忽略基本目录 (#37558)
- GH-37560 - [Python][文档] 将令人困惑的批处理大小从 128Ki 替换为 128_000 (#37605)
- GH-37574 - [Python] 与 numpy 2.0 的兼容性 (#38040)
- GH-37576 - [R] 在分配失败后使用
SafeCallIntoR()
调用垃圾回收器 (#37565) - GH-37601 - [C++][Parquet] 添加缺失的 GoogleMock 依赖项 (#37602)
- GH-37608 - [C++][Gandiva] TO_DATE 函数支持 YYYY-MM 和 YYYY (#37609)
- GH-37614 - [R][CI] 由于 duckdb 仓库移动,更新 CI 作业 (#37615)
- GH-37621 - [Packaging][Conda] 将 conda 配方与 feedstocks 同步 (#37624)
- GH-37639 - [CI] 修复旧操作系统上的 checkout (#37640)
- GH-37648 - [Packaging][Linux] 修复 libarrow-glib-dev/arrow-glib-devel 依赖项 (#37714)
- GH-37650 - [Python] 在 FilterMetaFunction 中检查过滤器输入 (#38075)
- GH-37671 - [R] 旧时区符号链接导致 CRAN 失败 (#37672)
- GH-37712 - [Go][Parquet] 修复用于位图提取位的 ARM64 程序集 (#37785)
- GH-37715 - [Packaging][CentOS] 在 CentOS 9 Stream 上使用默认的 g++ (#37718)
- GH-37730 - [C#] 如果 fractionalPart 太大,则在 DecimalUtility 中抛出 OverflowException (#37731)
- GH-37735 - [C++][FreeBSD] 抑制将 64 位缩短为 32 位的警告 (#38004)
- GH-37738 - [Go][CI] 更新 Go 版本以进行验证 (#37745)
- GH-37750 - [R][C++] 添加与 IntelLLVM 的兼容性 (#37781)
- GH-37767 - [C++][CMake] 不要接触 .git/index (#38003)
- GH-37771 - [Go][基准测试] 更新 Conbench git 信息 (#37772)
- GH-37803 - [Python][CI] 锁定 setuptools_scm 以修复发布验证脚本 (#37930)
- GH-37803 - [CI][Dev][Python] 发布和合并脚本错误 (#37819)
- GH-37805 - [CI][MATLAB] 在 MATLAB CI 工作流中,为
matlab-actions/setup-matlab
操作将release
硬编码为R2023a
(#37808) - GH-37813 - [R] 向 open_delim_dataset() 添加 quoted_na 参数 (#37828)
- GH-37829 - [Java] 在追加可变长度向量时避免两次调整数据缓冲区大小 (#37844)
- GH-37834 - [Gandiva] 迁移到新的 LLVM PassManager API (#37867)
- GH-37845 - [Go][Parquet] 检查逻辑字段的数量而不是物理列 (#37846)
- GH-37858 - [文档][JS] 修复远程 URL 检查以生成 JS 文档 (#37870)
- GH-37893 - [Java] 将 Types.proto 移动到子文件夹中 (#37894)
- GH-37907 - [R] 缺少设置 rosetta 变量 (#37961)
- GH-37927 - [CI][Dev][Archery] Crossbow 作业的徽章始终显示“no status”,即使它们失败或成功
- GH-37936 - [CI] 修复 rc-verify 每夜构建中的集成测试 (#37933)
- GH-37950 - [R] 由于测试在未指定 stringsAsFactors=FALSE 的情况下调用 data.frame(),导致 R < 4.0 上的测试失败 (#37951)
- GH-37952 - [C++] 使 unique->shared 显式,以修复至少在一个编译器上的构建失败 (#38136)
- GH-37993 - [CI] 修复 conda-integration 构建 (#37990)
- GH-37999 - [CI][Archery] 在 ARM 作业上安装 python3-dev 以访问 Python.h (#38009)
- GH-38011 - [C++][数据集] 将强制关闭更改为倾向于在写入时关闭 (#38030)
- GH-38014 - [Python] pyarrow 扩展类型在 13.0.0 中未正确转换为 pandas
- GH-38034 - [Python] DataFrame 交换协议 - 更正分类列的 dtype 信息 (#38065)
- GH-38039 - [C++][Parquet] 修复获取 Parquet 列的压缩级别时发生的段错误 (#38025)
- GH-38049 - [R] 防止
on_rosetta()
发出警告 (#38052) - GH-38057 - [Python][CI] 修复不稳定的假设测试 (#38058)
- GH-38059 - [Python][CI] 将 CUDA 升级到 11.2.2 (#38081)
- GH-38060 - [Python][CI] 升级 Spark 版本 (#38082)
- GH-38068 - [C++][CI] 修复 Parquet 单元测试
arrow_reader_writer_test.cc
编译问题 (#38069) - GH-38074 - [C++] 修复哈希连接中切分大型字符串和二进制类型时的偏移量大小计算 (#38147)
- GH-38076 - [Java][CI][Java-Jars][MacOS] 用于 MacOS AARCH 64 的 C++ 库
- GH-38077 - [C++] 将捆绑的 GoogleTest 输出到 ${BUILD_DIR}/${CONFIG} (#38132)
- GH-38084 - [R] 显式检查文件删除时,不进行内存映射 (#38085)
- GH-38193 - [CI][Java] 为 “AMD64 manylinux2014 Java JNI” 释放磁盘空间 (#38194)
- GH-38197 - [R] 更新使用 setup-r@v1 的 actions 以使用 setup-r@v2 (#38218)
- GH-38200 - [CI][Release][Go] 确保移除所有模块缓存 (#38222)
- GH-38201 - [CI][Packaging] 在 conan 上使用 thrift 时,固定 zlib 版本为 1.2.13 (#38202)
- GH-38206 - [CI] 移除更多预安装的文件 (#38233)
- GH-38226 - [R] 从 test-r-versions 中移除 R 3.5 (#38230)
- GH-38227 - [R] 修复夜间构建中的非 Unicode 字符错误 (#38232)
- GH-38228 - [R] 使用
examplesIf
隔离需要数据集的示例 (#38229) - GH-38239 - [CI][Python] 临时禁用 Python CI 作业中的 -W 错误 (#38238)
- GH-38263 - [C++]:在需要 char 指针的地方,优先调用 string_view::data() 而不是 begin() (#38265)
- GH-38282 - [C++]:使用正确的类型签名实现 ReplaceString (#38283)
- GH-38286 - [CI][R] 清理 ubuntu-r-only-r 镜像的 GitHub runner 磁盘 (#38287)
- GH-38293 - [R] 修复不确定的 duckdb 测试 (#38294)
- GH-38295 - [CI][R] 为 Azure Pipelines 作业释放磁盘空间 (#38302)
- GH-38332 - [CI][Release] 在 RAT lint 中解析符号链接 (#38337)
新特性和改进
- GH-20086 - [C++] 在固定大小和可变大小列表之间进行转换 (#37292)
- GH-21815 - [JS] 添加对 Duration 类型的支持 (#37341)
- GH-24868 - [C++] 添加一个具有可变维度的张量逻辑值类型,使用 ExtensionType 实现 (#37166)
- GH-25659 - [Java] 为大型类型添加 DefaultVectorComparators (#37887)
- GH-29184 - [R] 读取使用逗号作为小数点的 CSV 文件 (#38002)
- GH-29238 - [C++][Dataset][Parquet] 在新的 Dataset API 中支持 parquet 模块化加密 (#34616)
- GH-29847 - [C++] 使用 Azure SDK for C++ 构建 (#36835)
- GH-32863 - [C++][Parquet] 将 DELTA_BYTE_ARRAY 编码器添加到 Parquet 写入器 (#14341)
- GH-33032 - [C#] 支持固定大小列表 (#35716)
- GH-33749 - [Ruby] 添加 Arrow::RecordBatch#each_raw_record (#37137)
- GH-33985 - [C++] 为表达式添加 substrait 序列化/反序列化 (#34834)
- GH-34031 - [Python] 使用 PyCapsule 在 Python 级别传递 C 数据接口指针
- GH-34105 - [R] 为失败的构建提供额外输出 (#37727)
- GH-34213 - [C++] 如果用户执行递归的 GetFileInfo,则在没有分隔符的情况下使用递归调用 (#35440)
- GH-34252 - [Java] 支持将 ScannerBuilder::Project 或 ScannerBuilder::Filter 作为 Substrait proto 扩展表达式 (#35570)
- GH-34588 - [C++][Python] 为 “dictionary_decode” 添加 MetaFunction (#35356)
- GH-34620 - [C#] 在 .NET 6.0+ 上支持 DateOnly 和 TimeOnly (#36125)
- GH-34950 - [C++][Parquet] 支持页面索引的加密 (#36574)
- GH-35116 - [CI][C++] 在某些 CI 平台上启用编译时 AVX2 (#36662)
- GH-35176 - [C++] 添加对为 emscripten 禁用线程的支持 (#35672)
- GH-35243 - [C#] 实现 MapType (#37885)
- GH-35273 - [C++] 添加整数舍入内核 (#36289)
- GH-35287 - [C++][Parquet] 添加 CodecOptions 以自定义压缩参数 (#35886)
- GH-35296 - [Go] 添加 arrow.Table.String() (#35580)
- GH-35409 - [Python][Docs] 澄清 EC2 的 S3FileSystem 凭证链 (#35312)
- GH-35531 - [Python] C 数据接口 PyCapsule 协议 (#37797)
- GH-35600 - [Python] 允许通过 Python API 设置时区数据库路径 (#37436)
- GH-35623 - [C++][Python] FixedShapeTensorType.ToString() 应该打印类型的参数 (#36496)
- GH-35627 - [Format][Integration] 将 string-view 添加到 arrow 格式 (#37526)
- GH-35698 - [C#] 更新 FlatBuffers (#35699)
- GH-35740 - 添加列表数组的 values 属性的文档 (#35865)
- GH-35775 - [Go][Parquet] 允许在写入行组后写入键值文件元数据 (#37786)
- GH-35903 - [C++] Azure Blob Storage 文件系统实现的框架 (#35701)
- GH-35916 - [Java][arrow-jdbc] 向 JdbcFieldInfo 添加额外字段 (#37123)
- GH-35934 - [C++][Parquet] PageIndex 读取基准测试 (#36702)
- GH-36078 - [C#] C# 的 Flight SQL 实现 (#36079)
- GH-36103 - [C++] 初始设备同步 API (#37040)
- GH-36111 - [C++] 重构 dict_internal.h 以使用 Result (#37754)
- GH-36124 - [C++] 默认导出 compile_commands.json (#37426)
- GH-36155 - [C++][Go][Java][FlightRPC] 添加对长时间运行查询的支持 (#36946)
- GH-36187 - [C++] 当返回状态 “Data type … is not supported in join non-key field” 用于 HashJoin 时,显示有问题字段的名称 (#36539)
- GH-36199 - [Python][CI][Spark] 更新夜间测试中使用的 spark 版本 (#36347)
- GH-36240 - [Python] 将 CumulativeSumOptions 重构为单独的类,以便独立弃用 (#36977)
- GH-36247 - [R] 添加 write_csv_dataset (#36436)
- GH-36326 - [C++] 移除 v9.0 或更早版本中已弃用的 API (#36675)
- GH-36363 - [MATLAB] 为 DataType 类层次结构创建代理类 (#36419)
- GH-36417 - [C++] 添加 Buffer::data_as, Buffer::mutable_data_as (#36418)
- GH-36420 - [C++] 为 SetLookup 选项添加枚举选项 (#36739)
- GH-36433 - [C++] 将 fast_float 版本更新到 3.10.1 (#36434)
- GH-36469 - [Java][Packaging] 使用 mavencentral jars 分发 linux aarch64 库 (#36487)
- GH-36488 - [C++] 导入/导出 ArrowDeviceArray (#36489)
- GH-36511 - [C++][FlightRPC] 摆脱 GRPCPP_PP_INCLUDE (#36679)
- GH-36512 - [C++][FlightRPC] 添加异步 GetFlightInfo 客户端调用 (#36517)
- GH-36546 - [Swift] swift arrow flight 的初始实现 (#36547)
- GH-36570 - [Dev] 为 PR 添加 “Component: Swift” 标签 (#36571)
- GH-36573 - [CI] 移除 Travis CI 相关文件和提及 (#36741)
- GH-36590 - [Docs] 支持 Pydata Sphinx 主题 0.14.0 (#36591)
- GH-36601 - [MATLAB] 添加 MATLAB “类型特征” 类层次结构 (#36653)
- GH-36614 - [MATLAB] 继承 arrow::Buffer 以保持 MATLAB 数据支持 arrow::Arrays 的活动状态 (#36615)
- GH-36618 - [C++] 为 ARROW_CHECK 有效负载的评估添加测试 (#36617)
- GH-36621 - [C++] 添加 ACERO_ALIGNMENT_HANDLING 的文档 (#36622)
- GH-36623 - [Go] csv 的 NullType 支持 (#36624)
- GH-36642 - [Python][CI] 在 pytest 期间将警告配置为错误 (#37018)
- GH-36643 - [C++][Parquet] 在 parquet 中使用嵌套命名空间 (#36647)
- GH-36652 - [MATLAB] 从现有代理 ID 初始化
arrow.array.Array
子类的Type
属性 (#36731) - GH-36666 - [Python][CI] 重新启用跳过的 dask test_pandas_timestamp_overflow_pyarrow 测试 (#38066)
- GH-36671 - [Go] BinaryMemoTable 优化 GetOrInsert 的分配 (#36811)
- GH-36672 - [Python][C++] 添加对向量函数 UDF 的支持 (#36673)
- GH-36674 - [C++] 在 arrow/ipc/reader.cc 中使用匿名命名空间 (#36937)
- GH-36696 - [Go] 改进 MapOf 和 ListOf 助手 (#36697)
- GH-36698 - [Go][Parquet] 添加 TimestampLogicalType 创建函数 … (#36699)
- GH-36709 - [Python] 允许在 Table.group_by 中指定 use_threads=False 以获得稳定的排序 (#36768)
- GH-36734 - [MATLAB] 在 ArrowType 而不是 CType 上模板化 arrow::matlab::proxy::NumericArray (#36738)
- GH-36735 - 将
TimeUnit
和TimeZone
添加到arrow.type.TimestampType
显示中 (#36871) - GH-36750 - [R] 修复 MacOS 上的 test-r-devdocs (#36751)
- GH-36752 - [Python] 在构建 wheels 时删除 AWS SDK 捆绑 (#36925)
- GH-36762 - [Dev] 仅在问题更新时删除组件标签 (#36763)
- GH-36765 - [Python][Dataset] 将读取 Parquet 文件的 pre_buffer 默认值更改为 True (#37854)
- GH-36767 - [C++][CI] 修复 i386 上的测试失败 (#36769)
- GH-36770 - [C++] 使用环境变量 AWS_ENDPOINT_URL 为 s3 使用自定义端点 (#36791)
- GH-36773 - [C++][Parquet] 避免多次计算预缓冲列位图 (#36774)
- GH-36789 - [C++] 支持 divide(duration, duration) (#36800)
- GH-36793 - [Go] 如果标记为 parquet:”-“,则允许 NewSchemaFromStruct 跳过字段 (#36794)
- GH-36795 - [C#] 实现对密集和稀疏联合的支持 (#36797)
- GH-36816 - [C#] 减少分配 (#36817)
- GH-36824 - [C++] 改进 if-else 内核测试中 CheckWithDifferentShapes 的测试跟踪 (#36825)
- GH-36837 - [CI][RPM] 使用多核安装 gems (#36838)
- GH-36843 - [Python][Docs] 将 dict 添加到文档字符串 (#36842)
- GH-36845 - [C++][Python] 允许在
pa.concat_tables
上进行类型提升 (#36846) - GH-36852 - [MATLAB] 添加
arrow.type.Field
类 (#36855) - GH-36853 - [MATLAB] 添加实用程序以从现有的
arrow::DataType
对象创建代理 (#36873) - GH-36867 - [C++] 添加一个接受 (name, type) 对向量的 struct_ 和 schema 重载 (#36915)
- GH-36874 - [MATLAB] 将类型构造函数从
arrow.type
包移动到arrow
包 (#36875) - GH-36882 - [C++][Parquet] 当数据页和版本均为 V2 时,使用 RLE 作为 BOOLEAN 的默认编码 (#38163)
- GH-36882 - [C++][Parquet] 在 parquet 版本 2.x 中,布尔值的默认 RLE (#36955)
- GH-36885 - [Java][Docs] 将 substrait 依赖项添加到 maven 构建配置文件 (#36899)
- GH-36886 - [C++] 配置
azurite
以准备测试 Azure C++ 文件系统 (#36988) - GH-36893 - [Go][Flight] 公开底层的 protobuf 定义 (#36895)
- GH-36905 - [C++] 添加对 SparseUnion 的选择函数支持 (#36906)
- GH-36927 - [Java][Docs] 启用 Gandiva 构建作为 Java maven 命令的一部分 (#36929)
- GH-36931 - [C++] 添加 cumulative_mean 函数 (#36932)
- GH-36933 - [Python] 数组 repr 中无意义的省略号 (#37168)
- GH-36936 - [Go] 使注册自定义函数成为可能 (#36959)
- GH-36944 - [C++] 统一构建 GCS 的 OpenSSL 检测 (#36945)
- GH-36950 - [C++] 将 std::vector<std::shared_ptr
> 更改为使用其别名:FieldVector (#37101) - GH-36952 - [C++][FlightRPC][Python] 添加发送标头的方法 (#36956)
- GH-36953 - [MATLAB] 添加网关
arrow.array
函数以从 MATLAB 数据创建 Arrow 数组 (#36978) - GH-36961 - [MATLAB] 添加
arrow.tabular.Schema
类和相关的arrow.schema
构造函数 (#37013) - GH-36970 - [C++][Parquet] 对 parquet 元数据的细微样式修复 (#36971)
- GH-36984 - [MATLAB] 创建
arrow.recordbatch
便利构造函数 (#37025) - GH-36990 - [R] 公开 Parquet ReaderProperties (#36992)
- GH-36994 - [Java] 在 CI 中使用 JDK 21 (#38219)
- GH-37012 - [MATLAB] 从
arrow.tabular.RecordBatch
中删除私有属性ArrowArrays
(#37015) - GH-37014 - [C++][Parquet] 合并统计信息时保留一些 Parquet 不同的计数 (#37016)
- GH-37021 - [Java][arrow-jdbc] 可插拔的 getConsumer (#37085)
- GH-37028 - [C++] 添加对 if_else 函数的持续时间类型支持 (#37064)
- GH-37041 - [MATLAB] 使用新的 MATLAB 接口 API 实现 Feather V1 Reader (#37044)
- GH-37042 - [MATLAB] 使用新的 MATLAB 接口 API 实现 Feather V1 Writer (#37043)
- GH-37045 - [MATLAB] 根据 arrow.internal.io.feather.Writer 实现 featherwrite (#37047)
- GH-37046 - [MATLAB] 根据
arrow.internal.io.feather.Reader
实现featherread
(#37163) - GH-37049 - [MATLAB] 更新 feather
Reader
和Writer
对象,使其直接与arrow.tabular.RecordBatch
而不是 MATLABtable
一起工作 (#37052) - GH-37051 - [Dev][JS] 为 npm 添加 Dependabot 配置 (#37053)
- GH-37073 - [Java] JDBC:仅在未提供令牌时使用用户名/密码身份验证 (#37083)
- GH-37093 - [Python] 添加带有 GetFlightInfo 的异步 Flight 客户端 (#36986)
- GH-37096 - [MATLAB] 添加一个实用程序,用于从任意字符串列表创建有效的 MATLAB 表变量名称 (#37098)
- GH-37124 - [MATLAB] 添加用于验证数字和字符串索引值的实用程序函数 (#37150)
- GH-37128 - [Java] 将 CI 作业从 JDK 18 升级到 JDK 20 (#37125)
- GH-37141 - [GLib][FlightRPC] 添加更多 ArrowFlight::ClientOptions 属性 (#37142)
- GH-37143 - [GLib][FlightSQL] 添加对预准备 INSERT 的支持 (#37196)
- GH-37144 - [C++] 添加 RecordBatchFileReader::To{RecordBatches,Table} (#37167)
- GH-37145 - [Python] 在 from_dataframe 中支持位大小为 1 的布尔列 (#37975)
- GH-37151 - [MATLAB] 在
RecordBatch
的table
方法实现中使用makeValidVariableNames
和makeValidDimensionNames
(#37152) - GH-37155 - [MATLAB] 在
arrow.tabular.RecordBatch
的column()
方法中使用arrow.internal.validate.index.numeric()
(#37156) - GH-37157 - [MATLAB] 在
arrow.tabular.Schema
的field()
方法中使用arrow.internal.validate.index.numericOrString()
(#37162) - GH-37160 - [MATLAB] 如果给定一个零字符的字符串,
arrow.internal.validate.index.string()
不应出错 (#37161) - GH-37170 - [C++] 支持 RecordBatch 的架构重写 (#37171)
- GH-37175 - [MATLAB] 支持从
arrow.array.Array
值的列表创建arrow.tabular.RecordBatch
实例 (#37176) - GH-37179 - [MATLAB] 添加一个测试实用程序,该实用程序创建一个包含所有支持类型的 MATLAB
table
(#37191) - GH-37181 - [MATLAB] 删除过时的测试类
tArrowCppCall.m
(#37185) - GH-37182 - [MATLAB] 向 MATLAB
arrow.tabular.RecordBatch
类添加公共Schema
属性 (#37184) - GH-37187 - [MATLAB] 根据新的内部 Feather Reader 和 Writer 对象重新实现
tfeathermex.m
测试 (#37189) - GH-37188 - [MATLAB] 将
test/util/featherRoundTrip.m
移动到打包的测试实用程序函数中 (#37190) - GH-37203 - [MATLAB] 删除未使用的 feather V1 MEX 基础设施和代码 (#37204)
- GH-37209 - [CI][Docs][MATLAB] 从 CMake 构建系统中删除对
MATLAB_ARROW_INTERFACE
标志的支持,并默认构建新的 MATLAB 接口代码 (#37211) - GH-37210 - [Docs][MATLAB] 更新 MATLAB
README.md
以提及对新的 MATLAB API 的支持 (例如,RecordBatch
、Field
、Schema
等) (#37215) - GH-37212 - [C++] IO:向 ::arrow::io::BufferReader 添加 FromString (#37360)
- GH-37216 - [Docs] 添加文档以处理未发布的分配器 (#37498)
- GH-37222 - [Docs][MATLAB] 将
arrow.recordbatch
(全小写) 重命名为arrow.recordBatch
(驼峰式) (#37223) - GH-37228 - [MATLAB] 添加 C++
ARROW_MATLAB_EXPORT
符号导出宏 (#37233) - GH-37229 - [MATLAB] 添加
arrow.type.Date32Type
类和arrow.date32
构造函数 (#37348) - GH-37230 - [MATLAB] 添加
arrow.type.Date64Type
类和arrow.date64
构造函数 (#37578) - GH-37231 - [MATLAB] 添加
arrow.type.Time32Type
类和arrow.time32
构造函数 (#37250) - GH-37232 - [MATLAB] 添加
arrow.type.Time64Type
类和arrow.time64
构造函数 (#37287) - GH-37234 - [MATLAB] 创建一个抽象的
arrow.type.TemporalType
类 (#37236) - GH-37237 - [C++] 将提取时间设置为所有下载内容的创建时间 (#37238)
- GH-37244 - [Python] 删除对 pickle5 的支持 (#37644)
- GH-37246 - [Java] 公开 VectorAppender 类以提供对附加向量值的支持 (#37247)
- GH-37251 - [MATLAB] 将
arrow.type.TemporalType
作为“标签”类 (#37256) - GH-37252 - [MATLAB] 添加
arrow.type.DateUnit
枚举类 (#37280) - GH-37253 - [MATLAB] 添加测试用例,以验证
NumFields
、BitWidth
和ID
属性不能修改为hFixedWidth
测试类 (#37316) - GH-37254 - [Python] 参数化所有 pickling 测试以同时使用 pickle 和 cloudpickle 模块 (#37255)
- GH-37257 - [Ruby][FlightSQL] 对自动预准备语句关闭请求使用相同的选项 (#37258)
- GH-37259 - [Ruby] 添加显式 csv gem 依赖项 (#37506)
- GH-37262 - [MATLAB] 添加一个名为
arrow.type.TimeType
的抽象类 (#37279) - GH-37268 - [C++] 在 fs 和 dataset 的某些 ctor 中添加 move (#37264)
- GH-37273 - [C++] 升级 vendored xxhash 版本 (#37275)
- GH-37290 - [MATLAB] 添加
arrow.array.Time32Array
类 (#37315) - GH-37293 - [C++][Parquet] 编码:为 DELTA_BYTE_ARRAY 添加基准测试 (#37641)
- GH-37306 - [Go] 添加二进制字典统一器 (#37309)
- GH-37307 - [Python][CI] 对于 nightly dask 集成测试,手动跳过带有 skip_with_pyarrow_strings 标记的测试 (#37324)
- GH-37330 - [文档][CI] 增加 Sphinx 构建的超时时间 (#37331)
- GH-37334 - [打包][发布][RPM] 不要删除旧的 repodata/* (#37351)
- GH-37337 - [MATLAB] 添加
arrow.array.Time64Array
类 (#37368) - GH-37345 - [MATLAB] 将函数句柄添加到
TypeTraits
类的fromMATLAB
静态构造方法中 (#37370) - GH-37364 - [C++][GPU] 添加设备事件/流的 CUDA 实现 (#37365)
- GH-37367 - [MATLAB] 添加
arrow.array.Date32Array
类 (#37445) - GH-37379 - [C++][Parquet] Thrift: 生成可移动类型 (#37461)
- GH-37384 - [R] 在 CI 上设置 R_CHECK_STOP_ON_INVALID_NUMERIC_VERSION_INPUTS = TRUE (#37385)
- GH-37391 - [MATLAB] 在
arrow.array.Array
上实现isequal()
方法 (#37446) - GH-37392 - [JS] 移除 lerna (#37393)
- GH-37394 - [C++][S3] 使用 AWS_SDK_VERSION_* 而不是 try_compile() (#37395)
- GH-37416 - [Go] 允许访问字典构建器的底层索引构建器 (#37417)
- GH-37434 - [C++] IO: 重构小输入的 BufferedInputStream::Read (#37460)
- GH-37440 - [C#][文档] 将 Flight SQL 支持的函数添加到 status.rst (#37441)
- GH-37447 - [C++][文档] 文档化
ARROW_SUBSTRAIT
CMake 标志 (#37451) - GH-37448 - [MATLAB] 添加
arrow.array.ChunkedArray
类 (#37525) - GH-37465 - [Go] 向 BooleanBuilder 添加 Value 方法 (#37459)
- GH-37472 - [MATLAB] 在
arrow.type.Type
上实现isequal()
方法 (#37474) - GH-37473 - [MATLAB] 添加对通过
Field
名称索引RecordBatch
列的支持 (#37475) - GH-37477 - [MATLAB] 向 arrow.internal.validate.index.* 验证函数添加
AllowNonScalar
名称-值对 (#37482) - GH-37510 - [C++] 不要为 C++ 安装捆绑的 Azure SDK (#38176)
- GH-37532 - [CI][文档][MATLAB] 从 MATLAB 接口的 CMake 构建系统中删除
GoogleTest
支持 (#37784) - GH-37537 - [集成][C++] 添加 C 数据接口集成测试 (#37769)
- GH-37553 - [Java] 允许 FlightInfo#Schema 对于长时间运行的查询为可空 (#37528)
- GH-37562 - [Ruby] 添加对 table.each_raw_record.to_a 的支持 (#37600)
- GH-37567 - [C++] 将 JSON 集成代码迁移到 Result<> (#37573)
- GH-37568 - [MATLAB] 为
arrow.tabular.Schema
MATLAB 类实现isequal
(#37619) - GH-37569 - [MATLAB] 为
arrow.type.Field
MATLAB 类实现isequal
(#37617) - GH-37570 - [MATLAB] 为
arrow.tabular.RecordBatch
MATLAB 类实现isequal
(#37627) - GH-37571 - [MATLAB] 添加
arrow.tabular.Table
MATLAB 类 (#37620) - GH-37572 - [MATLAB] 添加
arrow.array.Date64Array
类 (#37581) - GH-37584 - [Go] 向字符串数组添加值长度函数 (#37586)
- GH-37587 - [C++] 将集成机制移动到它自己的目录和命名空间中 (#37588)
- GH-37591 - [MATLAB] 使
arrow.type.Type
继承自matlab.mixin.Heterogeneous
(#37593) - GH-37597 - [MATLAB] 向
arrow.array.ChunkedArray
类添加toMATLAB
方法 (#37613) - GH-37628 - [MATLAB] 为
arrow.tabular.Table
MATLAB 类实现isequal
(#37629) - GH-37635 - [格式][C++][Go] 向 FlightInfo 和 FlightEndpoint 添加 app_metadata (#37679)
- GH-37636 - [Go] 提升最低 Go 版本 (#37637)
- GH-37643 - [C++] 增强 arrow::Datum::ToString (#37646)
- GH-37651 - [C#] 公开 ArrowArrayConcatenator.Concatenate (#37652)
- GH-37653 - [MATLAB] 添加
arrow.array.StructArray
MATLAB 类 (#37806) - GH-37654 - [MATLAB] 向
arrow.type.Type
MATLAB 类添加Fields
属性 (#37725) - GH-37670 - [C++] IO FileInterface 继承自 enable_shared_from_this (#37713)
- GH-37681 - [R] 更新 13.0.0.1 的 NEWS.md (#37682)
- GH-37687 - [Go] 当容量足够时,不要在重新分配时复制 (#37688)
- GH-37694 - [Go] 向数组构建器添加 SetNull (#37695)
- GH-37701 - [Java] 为更多类型添加默认比较器 (#37748)
- GH-37702 - [Java] 添加与 C++ 一致的向量验证 (#37942)
- GH-37703 - [Java] 用于设置 ListVector 中确切记录数的方法 (#37838)
- GH-37704 - [Java] 添加 schema IPC 序列化方法 (#37778)
- GH-37705 - [Java] VarChar 写入器的额外输入方法 (#37883)
- GH-37705 - [Java] 二进制写入器的额外输入方法 (#37791)
- GH-37706 - [Java] VarCharWriter 应该支持从 `Text` 和 `String` 写入
- GH-37722 - [Java][FlightRPC] 弃用有状态的登录方法 (#37833)
- GH-37724 - [MATLAB] 添加
arrow.type.StructType
MATLAB 类 (#37749) - GH-37742 - [Python] 启用 Cython 3 (#37743)
- GH-37744 - [Swift] 为 arrow flight doGet FlightData 添加测试 (#37746)
- GH-37770 - [MATLAB] 添加 CSV
TableReader
和TableWriter
MATLAB 类 (#37773) - GH-37779 - [Go] 链接到 pkg.go.dev 站点以获取 Go 参考文档 (#37780)
- GH-37782 - [C++] 向
arrow::StructArray
添加CanReferenceFieldsByNames
方法 (#37823) - GH-37789 - [集成][Go] Go C 数据接口集成测试 (#37788)
- GH-37795 - [Java][FlightSQL] 添加模拟 FlightSqlProducer 和测试 (#37837)
- GH-37799 - [C++] Compute: CommonTemporal 支持 time32 和 time64 转换 (#37949)
- GH-37825 - [MATLAB] 改进
arrow.type.Field
显示 (#37826) - GH-37835 - [MATLAB] 改进
arrow.tabular.Schema
显示 (#37836) - GH-37842 - [R] 实现 infer_schema.data.frame() (#37843)
- GH-37849 - [C++] 将 cpp/src/*/*.cmake 添加到 cmake-format 目标 (#37850)
- GH-37851 - [C++] IPC: ArrayLoader 样式增强 (#37872)
- GH-37863 - [Java] 为 StructVector 添加类型化的 getter (#37916)
- GH-37864 - [Java] 从 OrcReader 中删除不必要的抛出 (#37913)
- GH-37873 - [C++][Parquet] DELTA_BYTE_ARRAY:尽可能避免复制数据 (#37874)
- GH-37876 - [格式] 将列表视图规范添加到 arrow 格式 (#37877)
- GH-37880 - [CI][Python][打包] 添加对 Python 3.12 的支持 (#37901)
- GH-37906 - [集成][C#] 为 C# 实现 C 数据接口集成测试 (#37904)
- GH-37917 - [Parquet] 为 FileSource 添加 OpenAsync (#37918)
- GH-37923 - [R] 将 macOS 构建系统移动到 nixlibs.R (#37684)
- GH-37934 - [文档][集成] 文档化 C 数据接口测试 (#37935)
- GH-37939 - [C++] 当编码 DELTA_BINARY_PACKED 时,对参考帧使用有符号算术 (#37940)
- GH-37941 - [R][CI][发布] 为预编译的二进制文件添加校验和验证 (#38115)
- GH-37945 - [R] 更新开发者文档 (#38220)
- GH-37971 - [CI][Java] 不要为夜间上传使用缓存 (#37980)
- GH-37978 - [C++] 添加为
arrow::PrettyPrintOptions
指定自定义数组元素分隔符的支持 (#37981) - GH-37984 - [发布] 为 YAML 日期值使用 ISO 8601 格式 (#37985)
- GH-37994 - [R] 为 CSV*Options 类创建包装函数 (#37995)
- GH-37996 - [MATLAB] 向
arrow.array.StructArray
添加一个名为fromMATLAB
的静态构造方法 (#37998) - GH-38005 - [Java] 在运行 Java 测试时禁用调试日志 (#38006)
- GH-38015 - [MATLAB] 将
arrow.buffer.Buffer
类添加到 MATLAB 接口 (#38020) - GH-38017 - [Go][FlightSQL] 增加内部转换器处理的类型 (#38028)
- GH-38043 - [R] 在 macOS 上默认启用所有功能 (#38195)
- GH-38053 - [C++][Go] 从 Schema.fbs 重新生成源代码 (#38054)
- GH-38055 - [C++] 当 ARROW_ENABLE_THREADING=OFF 时,不查找/使用 Threads::Threads (#38056)
- GH-38063 - [C++] 对外部项目的 ar/ranlib 使用绝对路径 (#38064)
- GH-38071 - [C++][CI] 修复预缓冲的列块范围重叠的问题 (#38073)
- GH-38088 - [R] 删除对 brew 和 autobrew 的过时引用 (#38089)
- GH-38138 - [R] 为使用
skip_if_offline()
添加 curl 到 suggests (#38140) - GH-38142 - [R] 为 14.0.0 添加 NEWS (#38143)
- GH-38145 - [文档][Python] 在 Python 安装文档中添加 Windows 上的 tzdata 小节 (#38146)
- GH-38159 - [CI][发布] 在集成测试模式下仅运行集成测试 (#38177)
- GH-38172 - [CI][C++] 在 Ubuntu 22.04 上使用系统 GoogleTest (#38173)
- GH-38174 - [C++] 将捆绑的 Azure C++ SDK 更新到 1.10.3 版本 (#38175)
- GH-38209 - [文档] 减小头部项目宽度,并在较小屏幕上保持头部高度为默认值(小)(#38148)
- GH-38240 - [文档] version_match 应该匹配 versions.json 中的版本 (#38241)
- GH-38243 - [CI][Python] 为数据集加密测试添加缺失的数据集标记 (#38244)
- GH-38285 - [Go] 轻微的依赖项和文档更新 (#38284)
- GH-38312 - [文档] 将 Arrow C 设备数据接口页面添加到侧边栏目录 (#38313)
- PARQUET-2323 - [C++] 使用位图存储预缓冲的列块 (#36649)