Apache Arrow 14.0.0 (2023 年 11 月 1 日)
这是一个包含超过 2 个月开发的重大发布。
下载
贡献者
此版本包含来自 116 位不同贡献者的 612 个提交。
$ git shortlog -sn apache-arrow-13.0.0..apache-arrow-14.0.0
69 Sutou Kouhei
59 dependabot[bot]
52 sgilmore10
34 Nic Crane
28 mwish
27 Raúl Cumplido
25 Kevin Gurney
19 Antoine Pitrou
19 Dewey Dunnington
17 Alenka Frim
16 Dane Pitkin
16 Matt Topol
13 Joris Van den Bossche
12 Jin Shang
11 David Li
11 Felipe Oliveira Carvalho
10 James Duong
8 Curt Hagenlocher
7 Jacob Wujciak-Jens
6 Benjamin Kietzman
6 Weston Pace
5 Frederic Branczyk
5 david dali susanibar arce
4 Ben Harkins
4 Thor
3 Bryce Mecum
3 Chris Jordan-Squire
3 Diego Fernández Giraldo
3 Francis
3 Ian Cook
3 Jonathan Keane
3 Junming Chen
3 Tim Schaub
3 h-vetinari
3 takuya kodama
2 Abe Tomoaki
2 Adam Reeve
2 Dominik Moritz
2 Elliott Brossard
2 Fokko Driesprong
2 Gang Wu
2 Mark Wolfe
2 Matthias Loibl
2 Rok Mihevc
2 Thomas Newton
2 Timothy Meehan
2 Vibhatha Lakmal Abeykoon
2 Will Jones
2 abandy
2 davidhcoe
2 jeremyosterhoudt
2 lambda
2 谢天
1 0x26res
1 Alex Shcherbakov
1 Alexander Grueneberg
1 Angela Li
1 Anja Kefala
1 Arkadiusz Rudny
1 Ashish Bailkeri
1 Austin Dickey
1 Bruno Tremblay
1 Chelsea Jones
1 Christian Lorentzen
1 Danyaal Khan
1 David Greiss
1 DenisTarasyuk
1 Donald Tolley
1 Ed Seidl
1 Edward Visel
1 Eero Lihavainen
1 Erik McKelvey
1 Fernando Mayer
1 František Nečas
1 George Godik
1 Hirokazu SUZUKI
1 Hyunseok Seo
1 Ikko Eltociear Ashimine
1 Ivan Chesnov
1 Jacek Stania
1 James Henderson
1 Jinpeng
1 Joe Marshall
1 Jonathan Swenson
1 Judah Rand
1 Justin Heesemann
1 KarateSnowMachine
1 Kevin Liu
1 Kuba Martin
1 Kyle Barron
1 Laurent Goujon
1 Li Jin
1 Michael Lui
1 Miguel Pragier
1 Paul Taylor
1 Rajat Subhra Mukherjee
1 Ray Zhang
1 SGZW
1 Sam Albers
1 Slobodan Ilic
1 Spencer Nelson
1 Srinivas Lade
1 Tero Vuotila
1 Thomas Grainger
1 Tommy Setiawan
1 Val Gridnev
1 Vitalii Tverdokhlib
1 Yue
1 andrewchambers
1 hrishisd
1 ismail simsek
1 panbingkun
1 patrick
1 pegasas
1 rtpsw
1 yyang52
补丁提交者
以下 Apache 提交者将贡献的补丁合并到仓库中。
$ git shortlog -sn --group=trailer:signed-off-by apache-arrow-13.0.0..apache-arrow-14.0.0
190 Sutou Kouhei
81 Antoine Pitrou
70 Kevin Gurney
46 Matt Topol
40 David Li
35 Nic Crane
31 Raúl Cumplido
28 Joris Van den Bossche
19 Jacob Wujciak-Jens
14 Dewey Dunnington
12 AlenkaF
12 Weston Pace
11 Benjamin Kietzman
4 Gang Wu
3 Dominik Moritz
2 Eric Erhardt
2 Jonathan Keane
1 Li Jin
1 Will Jones
更新日志
Apache Arrow 14.0.0 (2023-10-31 07:00:00)
错误修复
- GH-15017 - [Python] 增强 test_memory.py 以用于 ARROW_USE_GLOG=ON (#36901)
- GH-15281 - [C++] 将 bytes_view 别名替换为 span (#36334)
- GH-31621 - [JS] 修复 Union null bitmaps (#37122)
- GH-32439 - [Python] 修复 chunking nested structs 时的 off-by-one 错误 (#37376)
- GH-32483 - [文档][Python] 澄清安装 nightly conda package 需要使用 conda-forge (#37948)
- GH-33807 - [R] 如果检测到在仿真下运行,则添加一条消息 (#37777)
- GH-34567 - [JS] 改进构建并移除
bin/bin
目录生成 (#36607) - GH-34640 - [R] 在同时提供(非 hive)分区和 schema 时,无法在 CSV 数据集中读取分区列 (#37658)
- GH-34909 - [C++] 避免大整数输入时平均值溢出 (#37243)
- GH-35095 - [C++] 防止 arrow::ipc::IpcFormatWriter 在关闭后写入 (#37783)
- GH-35167 - [文档][C++] 对 arrow::json::TableReader 使用新 API (#37301)
- GH-35292 - [发布] 重试 “apt install” (#36836)
- GH-35328 - [Go][FlightSQL] 修复 FlightSql 驱动的 flaky 测试 (#38044)
- GH-35450 - [C++] 当调用
RecordBatch::ToStructArray
时列长度不匹配则返回错误 (#36654) - GH-35581 - [C++] 在标量中存储偏移量 (#36018)
- GH-35641 - [CI][C++] 禁用预编译头文件 (#37502)
- GH-35658 - [打包] 同步 conda recipes 和 feedstocks (#35637)
- GH-35770 - [Go][文档] 更新 TimestampType zero value 在注释中作为秒 (#37905)
- GH-35942 - [C++] 提高 Decimal ToReal 精度 (#36667)
- GH-36069 - [Java] 确保 S3 在关闭时完成 finalization (#36934)
- GH-36154 - [JS][CI] 在 CI 中使用
jest
缓存 (#36373) - GH-36189 - [C++][Parquet] StreamReader::SkipRows() 在多行组文件中跳到错误的位置 (#36191)
- GH-36318 - [Go] 只对现有值的数量进行长度解码,而不是对所有 nvalues 进行 (#36322)
- GH-36323 - [Python] 修复 Timestamp scalar repr 对于 datetime 范围外的值的错误 (#36942)
- GH-36332 - [CI][Java] 与 Spark 的集成作业因 NoSuchMethodError:io.netty.buffer.PooledByteBufAllocator 而失败
- GH-36371 - [Java] CycloneDX 无法加载 mojo ‘makeBom’
- GH-36379 - [C++] Bundled dependency include paths 应覆盖 system include dirs (#37612)
- GH-36502 - [C++] 为 ReferencedByteRanges 添加 run-end encoded 数组支持 (#36521)
- GH-36610 - [CI][C++] 默认不启用 ARROW_ACERO (#36611)
- GH-36619 - [Python] Parquet 统计信息字符串表示具有误导性 (#36626)
- GH-36634 - [Dev] 确保 merge 脚本请求 GitHub 信息时遍历所有页面 (#36637)
- GH-36638 - [R] 在 Windows 上使用 create_package_with_all_dependencies() 出错 (#37226)
- GH-36645 - [Go] 在写入 parquet 时向调用者返回 writer.Close 错误 (#36646)
- GH-36655 - [Dev] 修复 fury 命令以上传 nightly wheels (#36657)
- GH-36663 - [C++] 修复 enum 选项的默认值信息 (#36684)
- GH-36680 - [Python] 添加缺失的 pytest.mark.acero (#36683)
- GH-36685 - [R][C++] 修复 Homebrew 导致的 illegal opcode 失败 (#36705)
- GH-36688 - [C#] 修复 dereference 错误 (#36691)
- GH-36692 - [CI][打包] 由于 faraday 依赖问题,将 gemfury 锁定到 0.12.0 (#36693)
- GH-36708 - [C++] 完整计算 null-counts 以使 REE 分配有意义 (#36740)
- GH-36712 - [CI] 在更新问题时也更新 issue components (#36723)
- GH-36720 - [R] stringr modifier functions 无法使用命名空间前缀调用 (#36758)
- GH-36726 - [R] 在 S3 连接上调用 read_parquet 会导致错误消息被忽略 (#37024)
- GH-36730 - [Python] 添加对 Cython 3.0.0 的支持 (#37097)
- GH-36771 - [R] stringr helper functions 在评估时丢失调用环境 (#36784)
- GH-36776 - [C++] 使 ListArray::FromArrays() 处理包含 null 的 sliced offsets Arrays (#36780)
- GH-36787 - [R] lintr 更新导致 main 分支上的测试失败 (#36788)
- GH-36809 - [Python] MapScalar.as_py 使用自定义字段名 (#36830)
- GH-36819 - [R] 使用 RunWithCapturedR 读取 Parquet 文件 (#37274)
- GH-36828 - [C++][Parquet] 使用 BufferedPageWriter 使 buffered RowGroupSerializer 生效 (#36829)
- GH-36850 - [Go] 修复 Arrow Concatenate,确保分配被释放 (#36854)
- GH-36856 - [C++] 移除 BasicDecimal256FromLE() 参数中不必要的花括号 (#36987)
- GH-36858 - [Go] 修复 dictionary builder 内存泄露 (#36859)
- GH-36860 - [C++] 当系统 Protobuf 存在但系统 gRPC 不存在时报告 CMake 错误 (#36904)
- GH-36863 - [C#] 如果 .NET > 5.0,移除 CDataInterfacePythonTests 中不需要的应用修复,以不关闭 PythonEngine (#36872)
- GH-36863 - [C#][打包] 如果 .NET > 5.0,不在 CDataInterfacePythonTests 中关闭 PythonEngine (#36868)
- GH-36883 - [R] 移除导致 CRAN 警告的版本号 (#36884)
- GH-36920 - [Java][文档] 在 maven 构建配置中添加 ARROW_JSON 变量 (#36921)
- GH-36922 - [CI][C++][Windows] 从 PATH 中搜索 OpenSSL (#36923)
- GH-36935 - [Go] 修复 Timestamp 到 Time 日期 (#36964)
- GH-36939 - [C++][Parquet] BooleanArray 的 Direct put 在多次调用时 incorrect (#36972)
- GH-36941 - [CI][文档] 使用系统 Protobuf (#36943)
- GH-36949 - [C++] 修复 KeyColumnArray 的 buffers 数组越界断言 (#36966)
- GH-36973 - [CI][Python] Archery linter 与 flake8==6.1.0 集成 (#36976)
- GH-36975 - [C++][FlightRPC] 跳过未知字段,避免崩溃 (#36979)
- GH-36981 - [Go] 修复 ipc reader 内存泄露 (#36982)
- GH-36983 - [Python] pyarrow.fs.S3FileSystem 和 s3fs 之间的 get_file_info 行为差异 (#37768)
- GH-36991 - [Python][打包] 跳过 Windows 上需要时区数据库的测试 (#36996)
- GH-37017 - [C++] 保护意外使用 BMI2 指令 (#37610)
- GH-37022 - [CI][Java] 使用官方 Maven 下载 URL (#37119)
- GH-37050 - [Python][Interchange protocol] 为空 dataframes 添加 workaround (#38037)
- GH-37056 - [Java] 修复从 c-data 导入空数据数组的问题 (#37531)
- GH-37067 - [C++] 安装 bundled GoogleTest (#37483)
- GH-37099 - [C++] 修复 Flight-UCX 的构建 (#37105)
- GH-37102 - [Go][Parquet] Encoding: 在 ReserveBytes 时使 BitWriter Reserve (#37112)
- GH-37106 - [C++] 移除溢出整数 rounding 的 benchmark (#37109)
- GH-37107 - [C++] 使用 GCC 7 时抑制未使用的变量警告 (#37240)
- GH-37110 - [C++] Expression: SmallestTypeFor 丢失 Scalar 的 tz (#37135)
- GH-37111 - [C++][Parquet] Dataset: 修复 Schema Cast (#37793)
- GH-37116 - [C++][ORC] 链接到 absl::log_internal_check_op 用于 ABSL_DCHECK*() (#37117)
- GH-37120 - [CI][文档] 确保移除现有 Node.js (#37121)
- GH-37129 - [CI][文档] 使用 Ubuntu 22.04 (#37132)
- GH-37129 - [CI][文档] 释放磁盘空间 (#37131)
- GH-37148 - [C++] 显式列出 Type::type 枚举的整数值 (#37149)
- GH-37173 - [C++][Go][Format] C-export/import Run-End Encoded Arrays (#37174)
- GH-37208 - [R] 使用当前运行的 R 二进制文件编译测试程序 (nix 安装) (#37225)
- GH-37213 - [C#] 由于 rebase/merge 冲突,遗漏了对 FlatBuffers 的引用更新 (#37214)
- GH-37217 - [Python] 为 Cython 添加缺失的 docstrings (#37218)
- GH-37239 - [Ruby] 更新 ArrowTable#initialize 文档,澄清参数详情 (#37261)
- GH-37245 - [MATLAB]
arrow.internal.proxy.validate
在构建消息以显示arrow:proxy:ProxyNameMismatch
错误时,抛出MATLAB:UndefinedFunction
错误 (#37248) - GH-37266 - [CI][C++] 使用 ARROW_CMAKE_ARGS 而非 CMAKE_ARGS (#37272)
- GH-37276 - [C++] 在单线程环境下跳过多线程测试 (#37327)
- GH-37294 - [C++] 对 HasSubstr matcher 使用 std::string (#37314)
- GH-37299 - [C++] 修复 Homebrew 的 clang-format 导致的 clang-format 版本不匹配错误 (#37300)
- GH-37303 - [Python] 由于 CumulativeSumOptions 重构,更新 test_option_class_equality (#37305)
- GH-37308 - [C++][文档] 更改 CPP tutorial 的名称并对 job 进行微小修复 (#37311)
- GH-37325 - [R] 更新 NEWS.md 中缺失的 13.0.0 更改 (#37326)
- GH-37329 - [发布][Homebrew] 跟随目录结构更改 (#37349)
- GH-37340 - [MATLAB] 如果
index
指向arrow.array.Time32Array
列,则arrow.tabular.RecordBatch
的column(index)
方法出错 (#37347) - GH-37352 - [C++] 不要将所有依赖项放到 ArrowConfig.cmake/arrow.pc 中 (#37399)
- GH-37373 - [CI] 使集成构建更精简一些 (#37366)
- GH-37373 - [CI][集成] 释放磁盘空间 (#37374)
- GH-37377 - [C#] 在 TimestampArray.ConvertTo() 中溢出时抛出 OverflowException (#37388)
- GH-37386 - [R] 由于“invalid non-character version specification”导致 CRAN 失败 (#37387)
- GH-37406 - [C++][FlightSQL] 添加缺失的 ArrowFlight::arrow_flight_{shared,static} 依赖项 (#37407)
- GH-37408 - [C++] 仅当 ARROW_COMPUTE=ON 时安装 arrow-compute.pc (#37409)
- GH-37410 - [C++][Gandiva] 添加对使用 LLVM 共享库的支持 (#37412)
- GH-37411 - [C++][Python] 添加 string -> date cast kernel (修复 python scalar cast) (#38038)
- GH-37414 - [发布][CI] 更新引用错误的 apache-arrow Homebrew formula 路径 (#37415)
- GH-37419 - [Go][Parquet] pqarrow 的 Decimal256 支持 (#37503)
-
GH-37431 - [R] 由于在测试中使用了 base pipe ( >>) 导致 R 版本 < 4.0 的测试失败 (#37432) - GH-37433 - [CI][发布] 增加 macOS 的超时时间 (#37530)
- GH-37437 - [C++] 修复包含 large string values type 的 list array 的 MakeArrayOfNull (#37467)
- GH-37453 - [C++][Parquet] 修复 WriteBatch 的性能问题 (#37454)
- GH-37456 - [R] CRAN incoming checks 由于未文档化的内部函数显示 NOTE (#37457)
- GH-37463 - [R] CRAN incoming checks 由于测试运行时间过长而失败 (#37464)
- GH-37466 - [C++][Parquet] 修复 DELTA_BYTE_ARRAY 解码器中的 Valgrind 失败 (#37471)
- GH-37470 - [Python][Parquet] 为
ParquetFileWriteOptions
添加缺失的参数 (#37469) - GH-37480 - [Python] Bump pandas 版本,其中包含针对 pandas issue 50127 的回归 (#37481)
- GH-37485 - [C++][Skyhook] 不使用已弃用的 BufferReader API (#37486)
- GH-37487 - [C++][Parquet] Dataset: 实现 sync
ParquetFileFormat::GetReader
(#37514) - GH-37488 - [C++] 为 Azure SDK for C++ 禁用 unity build (#37489)
- GH-37500 - [CI][C++] 默认禁用 Dataset 和 Substrait (#37501)
- GH-37507 - [GLib] 不使用隐式 include 目录 (#37508)
- GH-37515 - [C++] 如果
ChunkedArray
可以有NaN
值,则移除ChunkedArray::Equals(const std::shared_ptr<arrow::ChunkedArray>& other)
中的内存地址优化 (#37579) - GH-37523 - [C++][CI][CUDA] 不使用较新的 API 并添加缺失的 CUDA 依赖项 (#37497)
- GH-37535 - [C++][Parquet] 在 parquet.pc 中添加缺失的 “thrift” 依赖项 (#37603)
- GH-37539 - [C++][FlightRPC] 修复绑定到 IPv6 地址的问题 (#37552)
- GH-37555 - [Python] 更新 get_file_info_selector 以忽略基本目录 (#37558)
- GH-37560 - [Python][文档] 将令人困惑的 batch size 从 128Ki 替换为 128_000 (#37605)
- GH-37574 - [Python] 与 numpy 2.0 的兼容性 (#38040)
- GH-37576 - [R] 使用
SafeCallIntoR()
在分配失败后调用垃圾收集器 (#37565) - GH-37601 - [C++][Parquet] 添加缺失的 GoogleMock 依赖项 (#37602)
- GH-37608 - [C++][Gandiva] TO_DATE 函数支持 YYYY-MM 和 YYYY (#37609)
- GH-37614 - [R][CI] 由于 duckdb 仓库移动,更新 CI 作业 (#37615)
- GH-37621 - [打包][Conda] 同步 conda recipes 和 feedstocks (#37624)
- GH-37639 - [CI] 修复在较旧 OS 上的 checkout (#37640)
- GH-37648 - [打包][Linux] 修复 libarrow-glib-dev/arrow-glib-devel 依赖项 (#37714)
- GH-37650 - [Python] 在 FilterMetaFunction 中检查 filter 输入 (#38075)
- GH-37671 - [R] legacy timezone symlinks 导致 CRAN 失败 (#37672)
- GH-37712 - [Go][Parquet] 修复 ARM64 assembly 用于 bitmap extract bits (#37785)
- GH-37715 - [打包][CentOS] 在 CentOS 9 Stream 上使用默认 g++ (#37718)
- GH-37730 - [C#] 如果 fractionalPart 过大,则在 DecimalUtility 中抛出 OverflowException (#37731)
- GH-37735 - [C++][FreeBSD] 抑制 shorten-64-to-32 警告 (#38004)
- GH-37738 - [Go][CI] 更新 Go 版本进行验证 (#37745)
- GH-37750 - [R][C++] 添加与 IntelLLVM 的兼容性 (#37781)
- GH-37767 - [C++][CMake] 不触碰 .git/index (#38003)
- GH-37771 - [Go][Benchmarking] 更新 Conbench git 信息 (#37772)
- GH-37803 - [Python][CI] Pin setuptools_scm 以修复 release verification scripts (#37930)
- GH-37803 - [CI][Dev][Python] Release 和 merge 脚本错误 (#37819)
- GH-37805 - [CI][MATLAB] 在 MATLAB CI workflows 中硬编码
release
为R2023a
用于matlab-actions/setup-matlab
action (#37808) - GH-37813 - [R] 为 open_delim_dataset() 添加 quoted_na 参数 (#37828)
- GH-37829 - [Java] 在追加 variable length vectors 时避免两次调整数据 buffer 大小 (#37844)
- GH-37834 - [Gandiva] 迁移到新的 LLVM PassManager API (#37867)
- GH-37845 - [Go][Parquet] 检查逻辑字段数量而非物理列数量 (#37846)
- GH-37858 - [文档][JS] 修复检查远程 URL 以生成 JS 文档 (#37870)
- GH-37893 - [Java] 将 Types.proto 移动到子文件夹中 (#37894)
- GH-37907 - [R] rosetta 变量设置缺失 (#37961)
- GH-37927 - [CI][Dev][Archery] crossbow 作业的徽章即使失败或成功也总是显示 `no status`
- GH-37936 - [CI] 修复 nightly build 的 rc-verify 中的集成测试 (#37933)
- GH-37950 - [R] R < 4.0 的测试因调用 data.frame() 未指定 stringsAsFactors=FALSE 而失败 (#37951)
- GH-37952 - [C++] 使 unique->shared 显式,以修复至少在一个编译器上的构建失败 (#38136)
- GH-37993 - [CI] 修复 conda-integration build (#37990)
- GH-37999 - [CI][Archery] 在 ARM 作业上安装 python3-dev 以访问 Python.h (#38009)
- GH-38011 - [C++][Dataset] 将 force close 改为 tend to close on write (#38030)
- GH-38014 - [Python] pyarrow 扩展类型在 13.0.0 中无法正确转换为 pandas
- GH-38034 - [Python] DataFrame Interchange Protocol - 分类列的正确 dtype 信息 (#38065)
- GH-38039 - [C++][Parquet] 修复获取 Parquet 列压缩级别时的 segfault (#38025)
- GH-38049 - [R] 阻止
on_rosetta()
发出警告 (#38052) - GH-38057 - [Python][CI] 修复 flaky hypothesis 测试 (#38058)
- GH-38059 - [Python][CI] 升级 CUDA 到 11.2.2 (#38081)
- GH-38060 - [Python][CI] 升级 Spark 版本 (#38082)
- GH-38068 - [C++][CI] 修复 Parquet unittest
arrow_reader_writer_test.cc
编译 (#38069) - GH-38074 - [C++] 修复 Hash Join 中 Slicing Large String 和 Binary Types 的 Offset Size 计算 (#38147)
- GH-38076 - [Java][CI][Java-Jars][MacOS] 适用于 MacOS AARCH 64 的 C++ 库
- GH-38077 - [C++] 将 bundled GoogleTest 输出到 ${BUILD_DIR}/${CONFIG} (#38132)
- GH-38084 - [R] 在明确检查文件删除时不要进行内存映射 (#38085)
- GH-38193 - [CI][Java] 释放 "AMD64 manylinux2014 Java JNI" 的磁盘空间 (#38194)
- GH-38197 - [R] 将使用 setup-r@v1 的 action 更新为使用 setup-r@v2 (#38218)
- GH-38200 - [CI][发布][Go] 确保移除所有模块缓存 (#38222)
- GH-38201 - [CI][打包] 在 conan 上使用 thrift 时,将 zlib 锁定到 1.2.13 (#38202)
- GH-38206 - [CI] 移除更多预安装的文件 (#38233)
- GH-38226 - [R] 从 test-r-versions 中移除 R 3.5 (#38230)
- GH-38227 - [R] 修复 nightly build 中的非 unicode 字符错误 (#38232)
- GH-38228 - [R] 使用
examplesIf
围住需要 dataset 的示例 (#38229) - GH-38239 - [CI][Python] 暂时在 Python CI 作业上禁用 -W error (#38238)
- GH-38263 - [C++] : 在需要 char 指针的地方优先调用 string_view::data() 而非 begin() (#38265)
- GH-38282 - [C++] : 使用正确的类型签名实现 ReplaceString (#38283)
- GH-38286 - [CI][R] 清理 ubuntu-r-only-r 镜像的 GitHub runner 磁盘 (#38287)
- GH-38293 - [R] 修复非确定性 duckdb 测试 (#38294)
- GH-38295 - [CI][R] 释放 Azure Pipelines 作业的磁盘空间 (#38302)
- GH-38332 - [CI][发布] 在 RAT lint 中解析 symlink (#38337)
新特性和改进
- GH-20086 - [C++] 在固定大小和可变大小列表之间进行类型转换 (#37292)
- GH-21815 - [JS] 添加对 Duration 类型的支持 (#37341)
- GH-24868 - [C++] 添加具有可变维度的 Tensor 逻辑值类型,通过 ExtensionType 实现 (#37166)
- GH-25659 - [Java] 为 Large 类型添加 DefaultVectorComparators (#37887)
- GH-29184 - [R] 读取以逗号为小数标记的 CSV (#38002)
- GH-29238 - [C++][Dataset][Parquet] 在新的 Dataset API 中支持 parquet 模块化加密 (#34616)
- GH-29847 - [C++] 构建时带上 Azure SDK for C++ (#36835)
- GH-32863 - [C++][Parquet] 为 Parquet writer 添加 DELTA_BYTE_ARRAY 编码器 (#14341)
- GH-33032 - [C#] 支持固定大小列表 (#35716)
- GH-33749 - [Ruby] 添加 Arrow::RecordBatch#each_raw_record (#37137)
- GH-33985 - [C++] 为表达式添加 substrait 序列化/反序列化 (#34834)
- GH-34031 - [Python] 在 Python 层面使用 PyCapsule 进行 C Data Interface 指针通信
- GH-34105 - [R] 为构建失败提供额外输出 (#37727)
- GH-34213 - [C++] 如果用户正在进行递归 GetFileInfo,则使用不带分隔符的递归调用 (#35440)
- GH-34252 - [Java] 支持将 ScannerBuilder::Project 或 ScannerBuilder::Filter 作为 Substrait proto extended expression (#35570)
- GH-34588 - [C++][Python] 为 "dictionary_decode" 添加 MetaFunction (#35356)
- GH-34620 - [C#] 在 .NET 6.0+ 上支持 DateOnly 和 TimeOnly (#36125)
- GH-34950 - [C++][Parquet] 支持页面索引加密 (#36574)
- GH-35116 - [CI][C++] 在某些 CI 平台上启用编译时 AVX2 (#36662)
- GH-35176 - [C++] 添加对 emscripten 禁用线程的支持 (#35672)
- GH-35243 - [C#] 实现 MapType (#37885)
- GH-35273 - [C++] 添加整数 round kernels (#36289)
- GH-35287 - [C++][Parquet] 添加 CodecOptions 以自定义压缩参数 (#35886)
- GH-35296 - [Go] 添加 arrow.Table.String() (#35580)
- GH-35409 - [Python][文档] 澄清 EC2 的 S3FileSystem Credentials chain (#35312)
- GH-35531 - [Python] C Data Interface PyCapsule Protocol (#37797)
- GH-35600 - [Python] 允许通过 python API 设置时区数据库路径 (#37436)
- GH-35623 - [C++][Python] FixedShapeTensorType.ToString() 应打印类型的参数 (#36496)
- GH-35627 - [Format][集成] 向 arrow format 添加 string-view (#37526)
- GH-35698 - [C#] 更新 FlatBuffers (#35699)
- GH-35740 - 添加 list arrays' values property 的文档 (#35865)
- GH-35775 - [Go][Parquet] 允许在写入行组后写入 key value file metadata (#37786)
- GH-35903 - [C++] Azure Blob Storage 文件系统实现的骨架 (#35701)
- GH-35916 - [Java][arrow-jdbc] 向 JdbcFieldInfo 添加额外字段 (#37123)
- GH-35934 - [C++][Parquet] PageIndex Read benchmark (#36702)
- GH-36078 - [C#] C# 的 Flight SQL 实现 (#36079)
- GH-36103 - [C++] 初步设备同步 API (#37040)
- GH-36111 - [C++] 重构 dict_internal.h 以使用 Result (#37754)
- GH-36124 - [C++] 默认导出 compile_commands.json (#37426)
- GH-36155 - [C++][Go][Java][FlightRPC] 添加对长时间运行查询的支持 (#36946)
- GH-36187 - [C++] 在 HashJoin 返回状态“Data type … is not supported in join non-key field”时显示问题字段的名称 (#36539)
- GH-36199 - [Python][CI][Spark] 更新夜间测试中使用的 Spark 版本 (#36347)
- GH-36240 - [Python] 将 CumulativeSumOptions 重构为单独的类以便独立弃用 (#36977)
- GH-36247 - [R] 添加 write_csv_dataset (#36436)
- GH-36326 - [C++] 移除在 v9.0 或更早版本中弃用的 API (#36675)
- GH-36363 - [MATLAB] 为 DataType 类层次结构创建代理类 (#36419)
- GH-36417 - [C++] 添加 Buffer::data_as, Buffer::mutable_data_as (#36418)
- GH-36420 - [C++] 为 SetLookup Options 添加一个 Enum 选项 (#36739)
- GH-36433 - [C++] 更新 fast_float 版本到 3.10.1 (#36434)
- GH-36469 - [Java][Packaging] 在 mavencentral jar 包中分发 linux aarch64 库 (#36487)
- GH-36488 - [C++] 导入/导出 ArrowDeviceArray (#36489)
- GH-36511 - [C++][FlightRPC] 移除 GRPCPP_PP_INCLUDE (#36679)
- GH-36512 - [C++][FlightRPC] 添加异步 GetFlightInfo 客户端调用 (#36517)
- GH-36546 - [Swift] Swift Arrow Flight 的初步实现 (#36547)
- GH-36570 - [Dev] 为 PR 添加“Component: Swift”标签 (#36571)
- GH-36573 - [CI] 移除 Travis CI 相关文件和提及 (#36741)
- GH-36590 - [Docs] 支持 Pydata Sphinx Theme 0.14.0 (#36591)
- GH-36601 - [MATLAB] 添加 MATLAB“类型特性”类层次结构 (#36653)
- GH-36614 - [MATLAB] 子类化 arrow::Buffer 以保持支持 arrow::Arrays 的 MATLAB 数据存活 (#36615)
- GH-36618 - [C++] 添加 ARROW_CHECK 有效载荷评估的测试 (#36617)
- GH-36621 - [C++] 添加 ACERO_ALIGNMENT_HANDLING 的文档 (#36622)
- GH-36623 - [Go] CSV 的 NullType 支持 (#36624)
- GH-36642 - [Python][CI] 在 pytest 期间将警告配置为错误 (#37018)
- GH-36643 - [C++][Parquet] 在 parquet 中使用嵌套命名空间 (#36647)
- GH-36652 - [MATLAB] 从现有代理 ID 初始化
arrow.array.Array
子类的Type
属性 (#36731) - GH-36666 - [Python][CI] 重新启用跳过的 dask test_pandas_timestamp_overflow_pyarrow 测试 (#38066)
- GH-36671 - [Go] BinaryMemoTable 优化 GetOrInsert 的分配 (#36811)
- GH-36672 - [Python][C++] 添加对向量函数 UDF 的支持 (#36673)
- GH-36674 - [C++] 在 arrow/ipc/reader.cc 中使用匿名命名空间 (#36937)
- GH-36696 - [Go] 改进 MapOf 和 ListOf 助手函数 (#36697)
- GH-36698 - [Go][Parquet] 添加 TimestampLogicalType 创建函数 … (#36699)
- GH-36709 - [Python] 允许在 Table.group_by 中指定 use_threads=False 以获得稳定排序 (#36768)
- GH-36734 - [MATLAB] 在 ArrowType 而非 CType 上模板化 arrow::matlab::proxy::NumericArray (#36738)
- GH-36735 - 将
TimeUnit
和TimeZone
添加到arrow.type.TimestampType
显示 (#36871) - GH-36750 - [R] 修复 MacOS 上的 test-r-devdocs (#36751)
- GH-36752 - [Python] 构建 wheel 包时移除 AWS SDK 捆绑 (#36925)
- GH-36762 - [Dev] 更新议题时仅移除组件标签 (#36763)
- GH-36765 - [Python][Dataset] 读取 Parquet 文件时将 pre_buffer 的默认值更改为 True (#37854)
- GH-36767 - [C++][CI] 修复 i386 上的测试失败 (#36769)
- GH-36770 - [C++] 使用环境变量 AWS_ENDPOINT_URL 为 s3 使用自定义端点 (#36791)
- GH-36773 - [C++][Parquet] 避免多次计算 prebuffer 列位图 (#36774)
- GH-36789 - [C++] 支持 divide(duration, duration) (#36800)
- GH-36793 - [Go] 允许 NewSchemaFromStruct 在字段使用 parquet:"-" 标签时跳过 (#36794)
- GH-36795 - [C#] 实现对密集和稀疏 union 的支持 (#36797)
- GH-36816 - [C#] 减少分配 (#36817)
- GH-36824 - [C++] 改进 if-else kernel 测试中 CheckWithDifferentShapes 的测试跟踪 (#36825)
- GH-36837 - [CI][RPM] 使用多核安装 gems (#36838)
- GH-36843 - [Python][Docs] 将 dict 添加到 docstring (#36842)
- GH-36845 - [C++][Python] 允许在
pa.concat_tables
上进行类型提升 (#36846) - GH-36852 - [MATLAB] 添加
arrow.type.Field
类 (#36855) - GH-36853 - [MATLAB] 添加从现有
arrow::DataType
对象创建代理的实用函数 (#36873) - GH-36867 - [C++] 添加采用 (name, type) 对向量的 struct_ 和 schema 重载 (#36915)
- GH-36874 - [MATLAB] 将类型构造函数从
arrow.type
包移动到arrow
包 (#36875) - GH-36882 - [C++][Parquet] 当数据页和版本均为 V2 时,使用 RLE 作为 BOOLEAN 的默认编码 (#38163)
- GH-36882 - [C++][Parquet] Parquet 2.x 版本中布尔值的默认 RLE (#36955)
- GH-36885 - [Java][Docs] 将 substrait 依赖项添加到 maven 构建配置文件 (#36899)
- GH-36886 - [C++] 配置
azurite
以准备测试 Azure C++ 文件系统 (#36988) - GH-36893 - [Go][Flight] 暴露底层 protobuf 定义 (#36895)
- GH-36905 - [C++] 为 selection 函数添加 SparseUnion 支持 (#36906)
- GH-36927 - [Java][Docs] 将 Gandiva 构建作为 Java maven 命令的一部分启用 (#36929)
- GH-36931 - [C++] 添加 cumulative_mean 函数 (#36932)
- GH-36933 - [Python] array repr 中无意义的省略号 (#37168)
- GH-36936 - [Go] 使注册自定义函数成为可能 (#36959)
- GH-36944 - [C++] 统一用于构建 GCS 的 OpenSSL 检测 (#36945)
- GH-36950 - [C++] 将 std::vector<std::shared_ptr
>> 更改为使用其别名: FieldVector (#37101) - GH-36952 - [C++][FlightRPC][Python] 添加发送 headers 的方法 (#36956)
- GH-36953 - [MATLAB] 添加 gateway
arrow.array
函数以从 MATLAB 数据创建 Arrow Arrays (#36978) - GH-36961 - [MATLAB] 添加
arrow.tabular.Schema
类和相关的arrow.schema
构造函数 (#37013) - GH-36970 - [C++][Parquet] Parquet 元数据的细微样式修复 (#36971)
- GH-36984 - [MATLAB] 创建
arrow.recordbatch
便利构造函数 (#37025) - GH-36990 - [R] 暴露 Parquet ReaderProperties (#36992)
- GH-37012 - [MATLAB] 从
arrow.tabular.RecordBatch
中移除私有属性ArrowArrays
(#37015) - GH-37014 - [C++][Parquet] 合并统计信息时保留部分 Parquet 唯一计数 (#37016)
- GH-37021 - [Java][arrow-jdbc] 可插拔的 getConsumer (#37085)
- GH-37028 - [C++] 为 if_else 函数添加 duration 类型的支持 (#37064)
- GH-37041 - [MATLAB] 使用新的 MATLAB 接口 API 实现 Feather V1 Reader (#37044)
- GH-37042 - [MATLAB] 使用新的 MATLAB 接口 API 实现 Feather V1 Writer (#37043)
- GH-37045 - [MATLAB] 使用 arrow.internal.io.feather.Writer 实现 featherwrite (#37047)
- GH-37046 - [MATLAB] 使用
arrow.internal.io.feather.Reader
实现featherread
(#37163) - GH-37049 - [MATLAB] 更新 feather
Reader
和Writer
对象,使其直接使用arrow.tabular.RecordBatch
而不是 MATLABtable
(#37052) - GH-37051 - [Dev][JS] 添加 npm 的 Dependabot 配置 (#37053)
- GH-37073 - [Java] JDBC: 仅在未提供 token 时使用用户名/密码认证 (#37083)
- GH-37093 - [Python] 添加带有 GetFlightInfo 的异步 Flight 客户端 (#36986)
- GH-37096 - [MATLAB] 添加从任意字符串列表生成有效 MATLAB 表变量名的实用函数 (#37098)
- GH-37124 - [MATLAB] 添加用于验证数字和字符串索引值的实用函数 (#37150)
- GH-37128 - [Java] 将 CI 作业的 JDK 版本从 18 提升到 20 (#37125)
- GH-37141 - [GLib][FlightRPC] 添加更多 ArrowFlight::ClientOptions 属性 (#37142)
- GH-37143 - [GLib][FlightSQL] 添加对 prepared INSERT 的支持 (#37196)
- GH-37144 - [C++] 添加 RecordBatchFileReader::To{RecordBatches,Table} (#37167)
- GH-37145 - [Python] 在 from_dataframe 中支持位大小为 1 的布尔列 (#37975)
- GH-37151 - [MATLAB] 在
RecordBatch
的table
方法实现中使用makeValidVariableNames
和makeValidDimensionNames
(#37152) - GH-37155 - [MATLAB] 在
arrow.tabular.RecordBatch
的column()
方法中使用arrow.internal.validate.index.numeric()
(#37156) - GH-37157 - [MATLAB] 在
arrow.tabular.Schema
的field()
方法中使用arrow.internal.validate.index.numericOrString()
(#37162) - GH-37160 - [MATLAB] 如果给定的字符串包含零个字符,
arrow.internal.validate.index.string()
不应出错 (#37161) - GH-37170 - [C++] 支持 RecordBatch 的 schema 重写 (#37171)
- GH-37175 - [MATLAB] 支持从
arrow.array.Array
值列表创建arrow.tabular.RecordBatch
实例 (#37176) - GH-37179 - [MATLAB] 添加一个创建包含所有支持类型的 MATLAB
table
的测试实用函数 (#37191) - GH-37181 - [MATLAB] 移除过时的测试类
tArrowCppCall.m
(#37185) - GH-37182 - [MATLAB] 为 MATLAB
arrow.tabular.RecordBatch
类添加公共Schema
属性 (#37184) - GH-37187 - [MATLAB] 使用新的内部 Feather Reader 和 Writer 对象重新实现
tfeathermex.m
测试 (#37189) - GH-37188 - [MATLAB] 将
test/util/featherRoundTrip.m
移动到打包的测试实用函数中 (#37190) - GH-37203 - [MATLAB] 移除未使用的 feather V1 MEX 基础设施和代码 (#37204)
- GH-37209 - [CI][Docs][MATLAB] 从 CMake 构建系统中移除对
MATLAB_ARROW_INTERFACE
标志的支持,并默认构建新的 MATLAB 接口代码 (#37211) - GH-37210 - [Docs][MATLAB] 更新 MATLAB
README.md
以提及对新 MATLAB API (例如RecordBatch
,Field
,Schema
等) 的支持 (#37215) - GH-37212 - [C++] IO: 向 ::arrow::io::BufferReader 添加 FromString (#37360)
- GH-37216 - [Docs] 添加处理未释放分配器的文档 (#37498)
- GH-37222 - [Docs][MATLAB] 将
arrow.recordbatch
(全小写) 重命名为arrow.recordBatch
(驼峰命名) (#37223) - GH-37228 - [MATLAB] 添加 C++
ARROW_MATLAB_EXPORT
符号导出宏 (#37233) - GH-37229 - [MATLAB] 添加
arrow.type.Date32Type
类和arrow.date32
构造函数 (#37348) - GH-37230 - [MATLAB] 添加
arrow.type.Date64Type
类和arrow.date64
构造函数 (#37578) - GH-37231 - [MATLAB] 添加
arrow.type.Time32Type
类和arrow.time32
构造函数 (#37250) - GH-37232 - [MATLAB] 添加
arrow.type.Time64Type
类和arrow.time64
构造函数 (#37287) - GH-37234 - [MATLAB] 创建一个抽象
arrow.type.TemporalType
类 (#37236) - GH-37237 - [C++] 将提取时间设置为所有已下载内容的 timestamp (#37238)
- GH-37244 - [Python] 移除对 pickle5 的支持 (#37644)
- GH-37246 - [Java] 暴露 VectorAppender 类以提供追加向量值的支持 (#37247)
- GH-37251 - [MATLAB] 将
arrow.type.TemporalType
设为“标签”类 (#37256) - GH-37252 - [MATLAB] 添加
arrow.type.DateUnit
枚举类 (#37280) - GH-37253 - [MATLAB] 向
hFixedWidth
测试类添加测试用例,验证NumFields
、BitWidth
和ID
属性不可修改 (#37316) - GH-37254 - [Python] 参数化所有 pickling 测试以使用 pickle 和 cloudpickle 模块 (#37255)
- GH-37257 - [Ruby][FlightSQL] 对自动预处理语句关闭请求使用相同的选项 (#37258)
- GH-37259 - [Ruby] 添加显式 csv gem 依赖 (#37506)
- GH-37262 - [MATLAB] 添加一个名为
arrow.type.TimeType
的抽象类 (#37279) - GH-37268 - [C++] 在 fs 和 dataset 的某些 ctor 中添加 move (#37264)
- GH-37273 - [C++] 提升 vendored xxhash 版本 (#37275)
- GH-37290 - [MATLAB] 添加
arrow.array.Time32Array
类 (#37315) - GH-37293 - [C++][Parquet] 编码: 添加 DELTA_BYTE_ARRAY 的基准测试 (#37641)
- GH-37306 - [Go] 添加二进制字典合并器 (#37309)
- GH-37307 - [Python][CI] 手动跳过夜间 dask 集成测试中使用 skip_with_pyarrow_strings 标记的测试 (#37324)
- GH-37330 - [Docs][CI] 增加 Sphinx 构建的超时时间 (#37331)
- GH-37334 - [Packaging][Release][RPM] 不要删除旧的 repodata/* (#37351)
- GH-37337 - [MATLAB] 添加
arrow.array.Time64Array
类 (#37368) - GH-37345 - [MATLAB] 为
TypeTraits
类的fromMATLAB
静态构造方法添加函数句柄 (#37370) - GH-37364 - [C++][GPU] 添加 Device Event/Stream 的 CUDA 实现 (#37365)
- GH-37367 - [MATLAB] 添加
arrow.array.Date32Array
类 (#37445) - GH-37379 - [C++][Parquet] Thrift: 生成可移动类型 (#37461)
- GH-37384 - [R] 在 CI 上设置 R_CHECK_STOP_ON_INVALID_NUMERIC_VERSION_INPUTS = TRUE (#37385)
- GH-37391 - [MATLAB] 在
arrow.array.Array
上实现isequal()
方法 (#37446) - GH-37392 - [JS] 移除 lerna (#37393)
- GH-37394 - [C++][S3] 使用 AWS_SDK_VERSION_* 而非 try_compile() (#37395)
- GH-37416 - [Go] 允许访问字典构建器的底层索引构建器 (#37417)
- GH-37434 - [C++] IO: 重构 BufferedInputStream::Read 以处理小输入 (#37460)
- GH-37440 - [C#][Docs] 将 Flight SQL 支持的函数添加到 status.rst (#37441)
- GH-37447 - [C++][Docs] 文档化
ARROW_SUBSTRAIT
CMake 标志 (#37451) - GH-37448 - [MATLAB] 添加
arrow.array.ChunkedArray
类 (#37525) - GH-37465 - [Go] 向 BooleanBuilder 添加 Value 方法 (#37459)
- GH-37472 - [MATLAB] 在
arrow.type.Type
上实现isequal()
方法 (#37474) - GH-37473 - [MATLAB] 添加按
Field
名称索引RecordBatch
列的支持 (#37475) - GH-37477 - [MATLAB] 向 arrow.internal.validate.index.* 验证函数添加
AllowNonScalar
名称-值对 (#37482) - GH-37510 - [C++] 不安装捆绑的 Azure SDK for C++ (#38176)
- GH-37532 - [CI][Docs][MATLAB] 从 MATLAB 接口的 CMake 构建系统中移除
GoogleTest
支持 (#37784) - GH-37537 - [Integration][C++] 添加 C Data Interface 集成测试 (#37769)
- GH-37553 - [Java] 允许 FlightInfo#Schema 对于长时间运行的查询可为空 (#37528)
- GH-37562 - [Ruby] 添加对 table.each_raw_record.to_a 的支持 (#37600)
- GH-37567 - [C++] 将 JSON 集成代码迁移到 Result<> (#37573)
- GH-37568 - [MATLAB] 为
arrow.tabular.Schema
MATLAB 类实现isequal
(#37619) - GH-37569 - [MATLAB] 为
arrow.type.Field
MATLAB 类实现isequal
(#37617) - GH-37570 - [MATLAB] 为
arrow.tabular.RecordBatch
MATLAB 类实现isequal
(#37627) - GH-37571 - [MATLAB] 添加
arrow.tabular.Table
MATLAB 类 (#37620) - GH-37572 - [MATLAB] 添加
arrow.array.Date64Array
类 (#37581) - GH-37584 - [Go] 向 string array 添加 value len 函数 (#37586)
- GH-37587 - [C++] 将集成机制移到自己的目录和命名空间 (#37588)
- GH-37591 - [MATLAB] 使
arrow.type.Type
继承自matlab.mixin.Heterogeneous
(#37593) - GH-37597 - [MATLAB] 向
arrow.array.ChunkedArray
类添加toMATLAB
方法 (#37613) - GH-37628 - [MATLAB] 为
arrow.tabular.Table
MATLAB 类实现isequal
(#37629) - GH-37635 - [Format][C++][Go] 向 FlightInfo 和 FlightEndpoint 添加 app_metadata (#37679)
- GH-37636 - [Go] 提升最低 Go 版本 (#37637)
- GH-37643 - [C++] 增强 arrow::Datum::ToString (#37646)
- GH-37651 - [C#] 暴露 ArrowArrayConcatenator.Concatenate (#37652)
- GH-37653 - [MATLAB] 添加
arrow.array.StructArray
MATLAB 类 (#37806) - GH-37654 - [MATLAB] 向
arrow.type.Type
MATLAB 类添加Fields
属性 (#37725) - GH-37670 - [C++] IO FileInterface 继承自 enable_shared_from_this (#37713)
- GH-37681 - [R] 更新 13.0.0.1 的 NEWS.md (#37682)
- GH-37687 - [Go] 容量充足时不要在 realloc 中复制 (#37688)
- GH-37694 - [Go] 向 array builders 添加 SetNull (#37695)
- GH-37701 - [Java] 为更多类型添加默认比较器 (#37748)
- GH-37702 - [Java] 添加与 C++ 一致的向量验证 (#37942)
- GH-37703 - [Java] 设置 ListVector 中精确记录数的方法 (#37838)
- GH-37704 - [Java] 添加 schema IPC 序列化方法 (#37778)
- GH-37705 - [Java] VarChar writers 的额外输入方法 (#37883)
- GH-37705 - [Java] 二进制 writers 的额外输入方法 (#37791)
- GH-37706 - [Java] VarCharWriter 应该支持从
Text
和String
写入 - GH-37722 - [Java][FlightRPC] 弃用有状态登录方法 (#37833)
- GH-37724 - [MATLAB] 添加
arrow.type.StructType
MATLAB 类 (#37749) - GH-37742 - [Python] 启用 Cython 3 (#37743)
- GH-37744 - [Swift] 添加 arrow flight doGet FlightData 的测试 (#37746)
- GH-37770 - [MATLAB] 添加 CSV
TableReader
和TableWriter
MATLAB 类 (#37773) - GH-37779 - [Go] 链接到 pkg.go.dev 站点以获取 Go 参考文档 (#37780)
- GH-37782 - [C++] 向
arrow::StructArray
添加CanReferenceFieldsByNames
方法 (#37823) - GH-37789 - [Integration][Go] Go C Data Interface 集成测试 (#37788)
- GH-37795 - [Java][FlightSQL] 添加 mock FlightSqlProducer 和测试 (#37837)
- GH-37799 - [C++] Compute: CommonTemporal 支持 time32 和 time64 强制转换 (#37949)
- GH-37825 - [MATLAB] 改进
arrow.type.Field
显示 (#37826) - GH-37835 - [MATLAB] 改进
arrow.tabular.Schema
显示 (#37836) - GH-37842 - [R] 实现 infer_schema.data.frame() (#37843)
- GH-37849 - [C++] 将 cpp/src/*/.cmake 添加到 cmake-format 目标 (#37850)
- GH-37851 - [C++] IPC: ArrayLoader 样式增强 (#37872)
- GH-37863 - [Java] 为 StructVector 添加类型化的 getter (#37916)
- GH-37864 - [Java] 从 OrcReader 中移除不必要的 throws (#37913)
- GH-37873 - [C++][Parquet] DELTA_BYTE_ARRAY: 在可能的情况下避免复制数据 (#37874)
- GH-37876 - [Format] 向 arrow format 添加 list-view 规范 (#37877)
- GH-37880 - [CI][Python][Packaging] 添加对 Python 3.12 的支持 (#37901)
- GH-37880 - [CI][Python][Packaging] 添加对 Python 3.12 的支持 (#37901)
- GH-37906 - [集成][C#] 为 C# 实现 C 数据接口集成测试 (#37904)
- GH-37917 - [Parquet] 为 FileSource 添加 OpenAsync 方法 (#37918)
- GH-37923 - [R] 将 macOS 构建系统迁移到 nixlibs.R (#37684)
- GH-37934 - [文档][集成] 文档化 C 数据接口测试 (#37935)
- GH-37939 - [C++] 在编码 DELTA_BINARY_PACKED 时,对参考帧使用有符号算术 (#37940)
- GH-37941 - [R][CI][发布] 为预编译二进制文件添加校验和验证 (#38115)
- GH-37945 - [R] 更新开发者文档 (#38220)
- GH-37971 - [CI][Java] 夜间上传时不要使用缓存 (#37980)
- GH-37978 - [C++] 添加对
arrow::PrettyPrintOptions
指定自定义 Array 元素分隔符的支持 (#37981) - GH-37984 - [发布] 对 YAML 日期值使用 ISO 8601 格式 (#37985)
- GH-37994 - [R] 为 CSV*Options 类创建包装函数 (#37995)
- GH-37996 - [MATLAB] 为
arrow.array.StructArray
添加一个名为fromMATLAB
的静态构造方法 (#37998) - GH-38005 - [Java] 运行 Java 测试时禁用调试日志 (#38006)
- GH-38015 - [MATLAB] 将
arrow.buffer.Buffer
类添加到 MATLAB 接口 (#38020) - GH-38017 - [Go][FlightSQL] 增加内部转换器处理的类型 (#38028)
- GH-38043 - [R] 在 macOS 上默认启用所有特性 (#38195)
- GH-38053 - [C++][Go] 从 Schema.fbs 重新生成源文件 (#38054)
- GH-38055 - [C++] 当 ARROW_ENABLE_THREADING=OFF 时,不查找/使用 Threads::Threads (#38056)
- GH-38063 - [C++] 为外部项目的 ar/ranlib 使用绝对路径 (#38064)
- GH-38071 - [C++][CI] 修复预缓冲的列块范围重叠问题 (#38073)
- GH-38088 - [R] 删除对 brew 和 autobrew 的过时引用 (#38089)
- GH-38138 - [R] 将 curl 添加到 suggests 中,以便使用
skip_if_offline()
(#38140) - GH-38142 - [R] 添加 14.0.0 的 NEWS (#38143)
- GH-38145 - [文档][Python] 在 Python 安装文档中添加 Windows 上 tzdata 的子章节 (#38146)
- GH-38159 - [CI][发布] 在集成测试模式下只运行集成测试 (#38177)
- GH-38172 - [CI][C++] 在 Ubuntu 22.04 上使用系统 GoogleTest (#38173)
- GH-38174 - [C++] 更新捆绑的 Azure SDK for C++ 到 1.10.3 (#38175)
- GH-38209 - [文档] 在小屏幕上减小页眉项宽度并保持页眉高度默认 (小) (#38148)
- GH-38240 - [文档] version_match 应与 versions.json 中的版本匹配 (#38241)
- GH-38243 - [CI][Python] 为数据集加密测试添加缺失的数据集标记 (#38244)
- GH-38285 - [Go] 小幅更新依赖和文档 (#38284)
- GH-38312 - [文档] 将 Arrow C Device 数据接口页面添加到侧边栏 TOC (#38313)
- PARQUET-2323 - [C++] 使用位图存储预缓冲的列块 (#36649)