Apache Arrow 12.0.0 (2023年5月2日)
这是一个涵盖超过3个月开发的大版本发布。
下载
贡献者
本次发布包含来自97位不同贡献者的531次提交。
$ git shortlog -sn apache-arrow-11.0.0..apache-arrow-12.0.0
62 Sutou Kouhei
44 Weston Pace
26 Gang Wu
26 Matt Topol
23 Nic Crane
23 mwish
22 Joris Van den Bossche
22 Raúl Cumplido
20 Alenka Frim
19 David Li
19 Felipe Oliveira Carvalho
15 Will Jones
11 Jin Shang
11 rtpsw
9 Rok Mihevc
9 Yevgeny Pats
8 Ben Harkins
7 Fokko Driesprong
7 Jacob Wujciak-Jens
7 eitsupi
6 Bryce Mecum
6 Neal Richardson
6 dependabot[bot]
5 Li Jin
4 Adam Reeve
4 Dewey Dunnington
4 Hirokazu SUZUKI
4 rtadepalli
3 Abe Tomoaki
3 Antoine Pitrou
3 Carlos O'Ryan
3 Danyaal Khan
3 Davide Pasetto
3 Diego Fernández Giraldo
3 Dominik Moritz
3 Fatemah Panahi
3 Haocheng Liu
3 Igor Izvekov
3 Patrick Hoefler
3 Sanjiban Sengupta
3 Vibhatha Lakmal Abeykoon
2 Dinir Imameev
2 Herman Schaaf
2 Min-Young Wu
2 Noah Treuhaft
2 Sven Rebhan
2 Yibo Cai
2 coldWater
1 0x26res
1 Aaron Gorenstein
1 Alexander Diemand
1 Aliaksei Makarau
1 Andrew Lamb
1 Andy Chang
1 Brett Buddin
1 Carl Boettiger
1 Chris Chua
1 Christopher Akiki
1 Curt Hagenlocher
1 Dane Pitkin
1 David Sisson
1 Dmitry Kolmakov
1 Dongjoon Hyun
1 Edward Visel
1 Hongze Zhang
1 Ian Cook
1 Igor Suhorukov
1 Jacob Marble
1 Jie Zhang
1 Jinpeng
1 Judah Rand
1 Junming Chen
1 Laurent Quérel
1 Leo Shklovskii
1 Lubo Slivka
1 Marco Edward Gorelli
1 Martin Hilton
1 Matthijs Brobbel
1 Michael Hancock
1 Michael Lui
1 NoahFournier
1 Rob Sharp
1 Sagnik Dutta
1 Shaheer Ahmad
1 Simon Perkins
1 Theodore Tsirpanis
1 Twice
1 Zaharid
1 abandy
1 cluster
1 david dali susanibar arce
1 flynn
1 gf2121
1 h-vetinari
1 lafiona
1 sunpeng
1 zagto
补丁提交者
以下 Apache 提交者将贡献的补丁合并到仓库中。
$ git shortlog -sn --group=trailer:signed-off-by apache-arrow-11.0.0..apache-arrow-12.0.0
123 Sutou Kouhei
77 Weston Pace
71 Matt Topol
50 Joris Van den Bossche
43 Will Jones
35 David Li
22 Jacob Wujciak-Jens
19 Nic Crane
17 Antoine Pitrou
17 Raúl Cumplido
12 Dewey Dunnington
5 Alenka Frim
5 Eric Erhardt
5 Yibo Cai
4 Rok Mihevc
3 Li Jin
3 Neal Richardson
2 Dominik Moritz
2 Micah Kornfield
1 Matthew Topol
1 dependabot[bot]
更新日志
Apache Arrow 12.0.0 (2023-04-30 07:00:00)
Bug 修复
- GH-14779 - [C++] 在 Mac M1 上编译失败
- GH-14917 - [C++] 当 GTest 使用低于 C++17 标准编译时报错 (#34765)
- GH-14923 - [C++][Parquet] 修复在读取最后一个具有错误位宽的块时 DELTA_BINARY_PACKED 的问题 (#15241)
- GH-15054 - [C++] 将 s3 的最终化操作改在 arrow 线程结束后进行,添加 pyarrow 退出钩子 (#33858)
- GH-15098 - [C++] 修复 util::EqualityComparable 在 clang 15 上的编译问题 (#33940)
- GH-15102 - [C++] 无法解压从 Java arrow SDK 发送的 arrow 流 (#15194)
- GH-15109 - [Python] 允许创建带有零字段的非空结构体数组 (#33764)
- GH-15137 - [C++][CI] 修复流式 JSON 读取器测试中的 ASAN 错误 (#33772)
- GH-15139 - [C++] 改进 arrow.pc 对 bzip2 静态库路径的检测 (#33712)
- GH-15173 - [C++][Parquet] 修复 ByteStreamSplit Standard 损坏的问题 (#34140)
- GH-15212 - [C++] 修复在 ORC 中写入切片列表数组的问题 (#15213)
- GH-15247 - [R] 尝试保存列名为 NULL 的 data.frame 时出错 (#34798)
- GH-15256 - [C++][Dataset] 添加对使用 Partitioning::Default() 写入的支持 (#33674)
- GH-28074 - [C++][Dataset] 在 Parquet 谓词下推中正确处理 NaNs (#15125)
- GH-31880 - [Python] 在 use_threads=True 时,Table.filter 使用表达式现在能保持顺序 (#34766)
- GH-31905 - [DevTools] 为 Cython 文件添加 linting (#14662)
- GH-32512 - [Docs][R] 更新 conda 安装命令 (#34298)
- GH-32954 - [Java][FlightRPC] 移除 FlightTestUtil#getStartedServer 并直接绑定到端口 0 (#34357)
- GH-33287 - [R] 无法对 http URL 使用 read_parquet (#34708)
- GH-33336 - [C++][Parquet] 避免未对齐加载时的未定义行为 (UB) (#14488)
- GH-33466 - [Go][Parquet] 在 pqarrow 中添加对字典数组的支持 (#34342)
- GH-33501 - [Packaging][Release] 添加一个发布后脚本,用于向 conan 添加新版本 (#34022)
- GH-33566 - [C++] 添加对无参和 n 元聚合函数的支持 (#15083)
- GH-33600 - [Go][Parquet] bitmap writer 发生 Panic (#14989)
- GH-33616 - [C++] 重新排序 group_by,使键/段键位于聚合之前 (#34551)
- GH-33689 - [Python][CI] 在 dask nightly 测试中重新启用 fsspec 测试 (#34925)
- GH-33697 - [CI][Python] PySpark 3.2.0 的 Nightly 测试因 numpy.bool 的 AttributeError 而失败 (#33714)
- GH-33699 - [C++] 增加在 valgrind 下运行 C++ 测试的超时时间,并缩短长时测试 (#33886)
- GH-33701 - [C++] 添加对 LTO (链接时优化) 构建的支持 (#33847)
- GH-33709 - [R] 从 semi_join 和 anti_join 中移除 suffix 参数 (#34030)
- GH-33717 - [Go] Flight SQL 服务器处理 StreamChunk 错误 (#33718)
- GH-33721 - [CI][R] 在 test-r-install-local macOS 上禁用 sccache (#34713)
- GH-33726 - [CI][Go] 在 Go 基准测试中设置主机名 (#33728)
- GH-33727 - [Python] 当 pandas 分类列的字典为 string 而非 object 时 array() 报错 (#34289)
- GH-33754 - [CI] 为 M1 上的验证任务安装 brewfile 依赖项 (#33755)
- GH-33767 - [Go] 清除 ArrowArrayStream.get_next 中的参数 (#33768)
- GH-33777 - [R] 由于在没有数据集模块的构建中未跳过数据集测试,Nightly 构建失败 (#33778)
- GH-33779 - [R] Nightly 构建 (R 3.5 和 3.6) 因字段引用测试而失败 (#33780)
- GH-33782 - [Release] 投票邮件的问题数量查询 JIRA 并产生错误数字 (#33791)
- GH-33783 - [C#] 更新发布验证以使用 .NET 7.0 (#33799)
- GH-33786 - [C++] 忽略旧的系统 xsimd (#33811)
- GH-33796 - [C++] 修复使用系统 GoogleTest 时错误的 arrow-testing.pc 配置 (#33812)
- GH-33801 - [Python] 在 pyarrow 中暴露 C++ ExtensionTypes/ExtensionArrays (#33802)
- GH-33813 - [CI][GLib] 使用 Ruby 3.2 更新捆绑的 MSYS2 (#33815)
- GH-33816 - [CI][Conan] 使用 TARGET_FILE 以提高可移植性 (#33817)
- GH-33820 - [CI][Release] 不在 Ubuntu 20.04 上安装 libxsimd-dev (#33821)
- GH-33824 - [C++] 改进发现失败时的错误消息 (#33848)
- GH-33830 - 澄清 REE 编码中对 Null 值的处理 (#33831)
- GH-33849 - [C++] 修复使用 ARROW_BUILD_SHARED=OFF 和 ARROW_BUILD_EXAMPLES=ON 时的构建问题 (#34350)
- GH-33864 - [Go] 不要将 cgo.Handle 直接强制转换为 unsafe.Pointer (#33865)
- GH-33876 - [C++][Windows] 为每个配置使用不同的 .pc 路径 (#33907)
- GH-33882 - [C++] 在 ARROW_BUILD_STATIC=OFF 时不查找 .pc 文件 (#34019)
- GH-33887 - [Go] cdata 包句柄泄漏,调试困难 (#33889)
- GH-33904 - [R] 改进 s3_bucket 的行为 - 临时解决方案 (#34009)
- GH-33911 - [C++] 为 Result::ValueOrElse 添加缺失的 std::forward (#33912)
- GH-33914 - [Release] 强制 brew install build-from-source 不从 API 安装 (#33915)
- GH-33920 - [C++][CI] 在 sanitizer 作业中禁用 Flight SQL (#34014)
- GH-33932 - [Go] 修复 RecordBuilder 在处理不可为空的 map 字段时的构建问题 (#33906)
- GH-33934 - [Packaging][Linux] 为 arm64 启用 Flight (#34717)
- GH-33953 - [Java] 在每个请求中传递自定义头 (#33967)
- GH-33954 - [C++][Parquet] 保留嵌套类型的 field-id (#33955)
- GH-33963 - [C++] 添加缺失的 arrow/engine 头文件 (#33964)
- GH-33970 - [C#] 使 schema 字段名大小写敏感 (#33978)
- GH-33971 - [C++] 修复 AdaptiveIntBuilder 以始终填充数据缓冲区 (#33994)
- GH-33973 - [Python][Docs] 更新 Parquet filter 关键字的文档 (#33974)
- GH-34023 - [Docs] 查看旧文档的版本警告对 >= 10 的版本无效 (#34178)
- GH-34029 - [Docs] 将 Ninja 添加到待安装的软件包列表中 (#34040)
- GH-34035 - [C++] 内部头文件被公共头文件包含导致外部项目构建失败 (#34036)
- GH-34037 - [Python][Docs] 修复 Table.drop 的 docstring (#34038)
- GH-34044 - [Go] 修复使用 noasm 标签时的构建问题 (#34045)
- GH-34047 - [C++][FlightRPC] 使 DoAction 警告不那么显眼 (#34182)
- GH-34076 - [C#] 允许 schema 字段有重复名称 (#34125)
- GH-34080 - [Python] 为 python 添加 round_binary 支持 (#34084)
- GH-34082 - [Packaging][deb] 遵循 Debian bookworm 镜像变更 (#34091)
- GH-34086 - [C++][Parquet] 修复向 data page v2 写入 num_rows 的问题 (#34096)
- GH-34088 - [Python] : 修复 get_writer 中的拼写错误 (#34089)
- GH-34092 - [R] 当提供 schema 且 col_names 保持为 TRUE (默认值) 时,open_csv_dataset() 报错 (#34217)
- GH-34098 - [Python][Docs] 修复 dataset 的 docstring (#34099)
- GH-34101 - [Go][Parquet] NewSchemaManifest 创建了错误的 schema 字段 (#34127)
- GH-34104 - [Python] 更新文档中 deduplicate_objects 的默认值以匹配实现 (#34128)
- GH-34106 - [C++][Parquet] 修复更新 WriteArrowDictionary 的页面统计信息问题 (#34107)
- GH-34138 - [C++][Parquet] 修复从 min_value/max_value 解析统计信息的问题 (#34112)
- GH-34143 - [Python][Docs] 将 fill_null 添加回 API 参考 (#34144)
- GH-34148 - [C++] 将 zstd 恢复到 1.5.2 版本 (#34190)
- GH-34150 - [C++] 修复因转换选项默认值初始化不当导致的错误 (#34209)
- GH-34150 - [C++][Python] 修复 ConversionOptions 初始化不当的问题 (#34156)
- GH-34163 - [C++][CI] 确保与捆绑的 ORC 使用相同的 Zstandard (#34164)
- GH-34165 - [Python] 如果未实现 to_pandas_dtype,扩展数组的数据类型应默认为存储类型 (#34559)
- GH-34175 - [Docs] 从 .github/CONTRIBUTING.md 中移除 Jira (#34205)
- GH-34188 - [C++][Benchmark] 为捆绑的 gbenchmark 添加缺失的 BENCHMARK_STATIC_DEFINE (#34194)
- GH-34191 - [C++] 确保在捆绑的 ORC 中使用相同的 ProtoBuf (#34192)
- GH-34206 - [C++] 不让 jemalloc 的定义影响 unity 构建 (#34185)
- GH-34210 - [C++] 当 TimeUnit 匹配时,使时间戳和持续时间的转换成为零拷贝操作 (#34270)
- GH-34211 - [R] 在尝试访问底层的 ChunkedArray 之前,确保 Arrow 数组是未物化的 (#34489)
- GH-34214 - [C++] 将 OPENSSL_ROOT_HINT 传递给捆绑 AWS 的 CMAKE_PREFIX_PATH (#34215)
- GH-34228 - [R] 当通过 pkg-config 找到 Arrow 时添加 LIB_DIR (#34229)
- GH-34230 - [Java] 在 BaseAllocator#wrapForeignAllocation 上调用分配监听器 (#34231)
- GH-34238 - [C++][Python] 在对块未对齐的表调用 groupby 时发生段错误
- GH-34241 - [C++] 修复 ExecSpanIterator 以正确初始化空字典数组 (#34246)
- GH-34244 - [Go][FlightRPC] SQLite 示例报告事务支持 (#34245)
- GH-34256 - [Dev] 更新发布脚本,将 main 作为新的默认分支 (#34413)
- GH-34269 - [C++] 修复 include 文件名 (#34285)
- GH-34271 - [C++] 移除 Thrift 的 GitHub 存档源 url (#34273)
- GH-34283 - [Python] 为 to_pandas 的索引添加 types_mapper 支持 (#34445)
- GH-34284 - [Java][FlightRPC] 修复了预备语句被发送两次的问题 (#34358)
- GH-34296 - [C++][CI] 强制 appveyor 构建使用 conda-forge 并忽略 defaults channel (#34297)
- GH-34301 - [CI][Packaging][RPM][arm64] 使用 closer.lua 下载 KEYS (#34302)
- GH-34303 - [CI][Packaging][deb] 在 Debian GNU/Linux bookworm 上使用系统 Meson (#34304)
- GH-34306 - [CI][Packaging][RPM] 不在 CentOS Stream 8 上安装 utf8proc-devel (#34307)
- GH-34308 - [CI][C++] 对旧版 g++ 使用 str("") 来重置 std::stringstream (#34317)
- GH-34309 - [C++] 为 aws_lc 和 s2n-tls 禁用 LTO (#34349)
- GH-34324 - [CI][C++] 为旧版 g++ 显式指定 set 元素类型 (#34325)
- GH-34326 - [C++][Parquet] 如果禁用统计信息,页面 null_count 不正确 (#34327)
- GH-34366 - [R] 不要 getFromNamespace() dplyr:::check_name() 辅助函数 (#34369)
- GH-34367 - [Java] 修复因顺序合并导致的构建错误 (#34368)
- GH-34381 - [Dev] 从 arrow-site 的 committers.yml 中检索提交者,而不是依赖 author_association (#34557)
- GH-34385 - [Go] 读取启用了压缩但包含未压缩缓冲区的 IPC 文件 (#34476)
- GH-34395 - [Python] 添加对符号链接的 Arrow 相关 include 目录的支持 (#34674)
- GH-34404 - [Python] 由于 pandas.Index 现在可以存储所有数值类型(不仅仅是64位版本),测试失败 (#34498)
- GH-34410 - [Python] 允许使用大于默认值的块大小 (#34435)
- GH-34432 - [Java] NoCompressionCodec 对不支持的编解码器类型抛出异常 (#34580)
- GH-34446 - [C++][Parquet] 修复 RecordReaderPrimitveTypeTests 测试 (#34447)
- GH-34464 - [R] 缺少 rlang 导入 - inform (#34465)
- GH-34467 - [R] 在 R 版本 < 4.0.0 上禁用 DuckDB 测试 (#34468)
- GH-34472 - [Go][FlightRPC] 在 Flight SQL 客户端中清空 DoAction 的结果 (#34473)
- GH-34474 - [C++] 检测并报错,如果 join 需要过多的键数据 (#35087)
- GH-34479 - [Java] java-jars 因 slf4j 绑定冲突而失败 (#34480)
- GH-34492 - [Go] 修复缺失的布尔 plain 编码器状态更新 (#34493)
- GH-34496 - [C++][Parquet] 修复当 num_values = 0 时 `MakePages` 中的 parquet 单元测试 (#34497)
- GH-34513 - [CI][Python] 从 _acero.pyx 中移除未使用的导入以修复 linting 失败 (#34514)
- GH-34519 - [C++][R] 修复投影与字段同名的数据集扫描 (#34576)
- GH-34539 - [C++] 修复带节流的调度器以避免在数据集写入器中出现堆栈溢出 (#35075)
- GH-34540 - [C++] 移除了已设置但未使用的变量 (#34541)
- GH-34546 - [C++] 支持从 large string 标量转换为 string 标量 (#34549)
- GH-34568 - [C++][Python] 在 Python Arrow 中暴露 Run-End Encoded 数组 (#34570)
- GH-34579 - [Python][Docs] TableGroupBy.aggregate 选项 (#34759)
- GH-34597 - [Packaging][RPM] 不使用 glog (#34598)
- GH-34603 - [Go][Parquet] 写入带空字符串的字典时出现问题 (#34709)
- GH-34605 - [C++] 向命名表传递 shared_ptr 时不使用 std::move (#34606)
- GH-34619 - [C++] 在 ArraySpan 转换中添加扩展数组处理 (#34684)
- GH-34621 - [GLib] 不使用 "g_strdup(XXX->ToString().c_str())" (#34624)
- GH-34622 - [CI][GLib] 使用 "meson setup ..." (#34623)
- GH-34629 - [Go] 修复 transpose_ints 使其能在 riscv64-freebsd 上工作 (#34647)
- GH-34633 - [C++][Parquet] 修复 StreamReader 以读取 decimals (#34720)
- GH-34639 - [C++] 支持 RecordBatch::FromStructArray,即使结构体数组有空值/偏移量 (#34691)
- GH-34641 - [CI][Python] 将 test_acero.py 中的 test_scan 标记为需要 dataset (#34642)
- GH-34643 - [CI] 修复用于测试不可压缩数据的文件 (#34646)
- GH-34653 - [CI][C++] 修复 alpine-linux-cpp 上 arrow-dataset-file-json-test 的段错误 (#35047)
- GH-34655 - [CI][C++] arrow-compute-internals-test 在 test-cuda-cpp 上因 `No function registered with name: equal` 失败
- GH-34661 - [CI][C#] 更新 Ubuntu C# 作业以使用带有 .NET 7.0 的镜像 (#34662)
- GH-34667 - [C++][Parquet] 使用无效输入测试 DeltaLengthByteArrayDecoder (#34668)
- GH-34670 - [Packaging][C++] 添加对自定义 GDB 插件安装目录的支持 (#34672)
- GH-34696 - [C++] 在 Validate() 中检查 REE 数组没有 null 缓冲区 (#34697)
- GH-34731 - [Python] 创建 RecordBatchReader 时释放 GIL (#34732)
- GH-34743 - [Python] 放宽不稳定的 Flight 测试中的条件 (#34747)
- GH-34753 - [C++] Nightly 构建因 EnsureAlignment 而失败 (#34754)
- GH-34771 - [C++] 添加在 FreeBSD/amd64 上编译的支持 (#34772)
- GH-34786 - [C++] 修复 Substrait 消费者为 AggregateRel 计算的输出 schema (#34904)
- GH-34801 - [C++] 从 arrow.pc 中移除不必要的 "Requires.private: libcurl openssl" (#34810)
- GH-34807 - [Go] 在读取 parquet footer 大小和魔术字节时处理 `io.EOF` (#34808)
- GH-34823 - [C++][ORC] 修复 ORC CHAR 类型映射 (#34836)
- GH-34831 - [C++] 在其他检查之前检查 REE 子缓冲区是否有效 (#34833)
- GH-34843 - [R] 修复因 Acero 重构导致的 R 构建失败 (#34844)
- GH-34862 - [C++] 修复 ArrowDataset 依赖项 (#34866)
- GH-34869 - [C++] 配置 alpine linux nightly 作业以从源码构建 gtest (#34870)
- GH-34871 - [C++] 修复了 add_dataset_test 函数以正确引用测试文件 (#34872)
- GH-34906 - [C++] 从已关闭的 ArrayStreamBatchReader 读取时返回无效状态而不是段错误 (#35016)
- GH-34933 - [Python] 提高 cython 最低版本要求 (#34935)
- GH-34937 - [R] 最小构建因依赖 snappy 安装的新测试而失败 (#34938)
- GH-34944 - [Python] 修复在 pa.array() 中转换带有 getitem 的非序列对象时崩溃的问题 (#34958)
- GH-34953 - [Ruby] 将 `Table.slice` 中的 null 选择行为更改为 `:drop` (#34954)
- GH-34960 - [C++] 测试工具:修复 arrow Random Generator 丢失可空信息的问题 (#34961)
- GH-34973 - [CI][Packaging] 修复 wheel-clean 中的脚本路径 (#34974)
- GH-34977 - [C++] 修复 arrow-dataset.pc 中的 "Requires" 格式 (#34978)
- GH-34983 - [C++] 在 C 数据接口导入时保留 map 值的可空性 (#35013)
- GH-34988 - [C#] 修复 CDataSchemaPythonTest 中特定于 Windows 的测试问题 (#34989)
- GH-34995 - [C++] 改进 SYSTEM 情况下对可用 GTest 的检查 (#34997)
- GH-35008 - [C++] 添加 REETestData 和 PageIndexReaderParam 的打印器以安抚 Valgrind (#35011)
- GH-35014 - [Python] 确保单元测试可以在没有 acero 的情况下运行 (#35017)
- GH-35018 - [CI][Java][C++] 为 LLVM 使用 ARROW_ZSTD_USE_SHARED=OFF (#35023)
- GH-35021 - [Python][CI] 在 test-conda-python 中使用 conda 的 gdb (#35024)
- GH-35029 - [CI][C#] 在 ubuntu-csharp 镜像上安装 python 以修复 nuget CI 构建 (#35030)
- GH-35038 - [R] arrow_table 中的参数顺序影响对象返回类型 (#35039)
- GH-35056 - [Python][CI] 不在 Windows 上安装 gdb (#35057)
- GH-35060 - [C#][CI] 更新 dotnet 下载链接的正则表达式 (#35061)
- GH-35062 - [Go][CI] 修复验证失败 (#35077)
- GH-35063 - [CI] 修复 C# 测试中的 Python 依赖要求 (#35091)
- GH-35066 - [CI][Packaging][Linux] 释放更多磁盘空间 (#35128)
- GH-35069 - [Archery][Release] 在 Archery release 的迁移评论中移除检索 ARROW issue 的功能 (#35070)
- GH-35073 - [R] 最小构建失败 (acero 符号未定义) (#35074)
- GH-35086 - [Java][CI] 升级 CycloneDX Maven 插件版本 (#35092)
- GH-35089 - [CI][C++][Flight] macos release verification nightlies 中的测试失败 (#35090)
- GH-35115 - [C++] 将 util_avx2.cc 从 acero 移到 compute (#35117)
- GH-35133 - [Go] 修复 32 位架构中 `math.MaxUint32 overflows int` 错误 (#35159)
- GH-35143 - [R][C++] Fixed shape tensor 导致在 OSX 上构建失败 (#35154)
- GH-35170 - [CI][Packaging][Conan] 构建 grpc-proto (#35203)
- GH-35181 - [R] 在 versions.json 中增加 R 包版本号 (#35132)
- GH-35186 - [CI][C++] 改进在 Windows + vcpkg 上的 GoogleTest 检测 (#35200)
- GH-35187 - [CI][C++] 使用最新的 arrow-testing (#35227)
- GH-35192 - [Docs] 从 `logo` 切换到 `logo_url` 以支持 sphinx >= 6 (#35194)
- GH-35205 - [C++][Gandiva] 当使用捆绑的 Zstandard 时,不查找系统 Zstandard (#35220)
- GH-35206 - [C++] 在 Windows 验证中查找 Conda OpenSSL (#35225)
- GH-35235 - [CI][Python] Pandas upstream_devel 和 nightlies 构建失败 (#35248)
- GH-35252 - [C++] 使用 ArrowTesting 的 FindGTestAlt.cmake (#35253)
新功能和改进
- GH-14863 - [C++] 向数组构建器添加可接受 optional 的 appender 函数 (#24372)
- GH-14866 - [C++] 移除内部 GroupBy 实现 (#14867)
- GH-14912 - [Java] 在 arrow-vector、arrow-jdbc 和 arrow-algorithm 中移除 PlatformDependent 的使用 (#14913)
- GH-14939 - [C++] 支持在 FieldRef 和 FieldPath 中进行表查找 (#34537)
- GH-15059 - [C++][Acero] 从表达式而不是 fragment 填充保证列 (#15129)
- GH-15070 - [Python][CI] 更新 pandas 测试以适应 pandas 2.0.1 中空列 dtype 的变化 (#35031)
- GH-15070 - [Python][CI] 兼容 pandas 2.0 (#34878)
- GH-15107 - [C++][Parquet] Parquet 编码器:支持布尔值的 RLE (#34526)
- GH-15164 - [C++][Parquet] 实现当前版本的 BloomFilter 规范 (#33776)
- GH-15171 - [C++] 按值传递 std::string_view (#33684)
- GH-15193 - [C++][Parquet] Parquet FuzzReader 添加一些固定批次大小 (#33942)
- GH-15195 - [C++][FlightRPC][Python] 为 Flight 类型添加 ToString/Equals (#15196)
- GH-15203 - [Java] 实现写入压缩文件 (#15223)
- GH-15209 - [C++][Gandiva] 添加 abs 函数 (#15208)
- GH-15231 - [C++][Benchmarking] 添加新的内存池指标并在基准测试中跟踪 (#33731)
- GH-15280 - [C++][Python][GLib] 添加 libarrow_acero,包含之前在 compute/exec 中的所有内容 (#34711)
- GH-15280 - [C++] 重构以重新组织依赖关系,为将 acero 从 libarrow 中移出做准备 (#34518)
- GH-15284 - [C++] 在 Acero 计划测试中使用 DeclarationToExecBatches (#15288)
- GH-15285 - [GLib] 添加 GArrowMatchSubstringOptions (#34725)
- GH-15286 - [GLib] 添加 GArrowIndexOptions (#34679)
- GH-15287 - [Ruby] 在 Table#join 中合并列并添加后缀 (#33654)
- GH-15483 - [C++] 添加一个固定形状张量 (Fixed Shape Tensor) 的规范扩展类型 (#8510)
- GH-18481 - [C++] 优先转换字面量而不是字段引用 (#15180)
- GH-18487 - [R] 从字符向量中读取文本 (CSV/JSON) (#33968)
- GH-18818 - [R] 创建一个指向结构体中字段的字段引用 (#19706)
- GH-20117 - [Dev] 请求 INFRA 将默认分支切换为 main
- GH-20272 - [C++] 提升捆绑的 AWS SDK 版本 (#33808)
- GH-20351 - [C++] 用于行程长度编码类型的内核输入类型匹配器 (#34503)
- GH-20407 - [Go] REE 数组的数组构建器 (#14114)
- GH-20408 - [Go] 为 REE 实现 Encode 和 Decode 函数 (#34534)
- GH-20415 - [Go] RLE 的内核输入类型 (#14146)
- GH-20484 - [Swift] Arrow 的初始实现 (#14561)
- GH-21429 - [GLib] 添加 GArrowDenseUnionArrayBuilder (#34981)
- GH-21430 - [GLib] GArrowSparseUnionArrayBuilder (#34992)
- GH-25163 - [C#] 支持半精度浮点数组。(#34618)
- GH-25986 - [C++] 启用加密密钥的外部材料和轮换 (#34181)
- GH-29705 - [Python] 移除已弃用的 pyarrow.serialization 功能 (#34926)
- GH-30774 - [Python] 移除已弃用的 `use_async` (#34034)
- GH-31148 - [Dev] 更新仓库中的 URL 以指向 main (#34218)
- GH-31506 - [Python] 完善流和文件访问 (工厂函数) 的 docstrings (#33609)
- GH-31507 - [Python] 完善流和文件访问 (流类) 的 docstrings (#33698)
- GH-31548 - [Python] 测试在类型推断期间是否接受 zoneinfo 时区 (#34394)
- GH-31715 - [Python] 改进类和方法的 Docstrings - 流和文件访问
- GH-31809 - [Docs] 添加关于如何收集产生的遥测数据的说明 (#33873)
- GH-31868 - [C++] 支持连接扩展数组 (#14463)
- GH-31910 - [C++] 添加对 Substrait cast 表达式的支持 (#34050)
- GH-32050 - [C++] 在分块数组上实现 Rank 内核 (#33846)
- GH-32104 - [C++] 为 Arrow 添加 Run-End 编码数据的支持 (#33641)
- GH-32105 - [C++] 编码和解码 Run-End 编码向量 (#34195)
- GH-32240 - [C#] 添加新的 Apache.Arrow.Compression 包以实现 IPC 解压缩 (#33893)
- GH-32240 - [C#] 从 ReadOnlyMemory 读取 IPC 流时支持解压缩 (#34108)
- GH-32240 - [C#] 支持解压缩 IPC 格式缓冲区 (#33603)
- GH-32292 - [R][Packaging] 对 Ubuntu < 22.04 使用在 CentOS 7 上构建的二进制文件 (#34048)
- GH-32338 - [C++] 添加对 Run-End 编码数组的 IPC 支持 (#34550)
- GH-32613 - [C++] 简化密集联合体的 IPC 写入器 (#33822)
- GH-32619 - [Python][Docs] 明确包含 PyArrow 的构建选项 (#34463)
- GH-32653 - [C++] 清理执行引擎中的错误处理 (#15253)
- GH-32747 - [C++] Substrait To Arrow Emit 功能测试 (#14174)
- GH-32801 - [C++][Docs] 删除过时的 .md 文件 (#33829)
- GH-32804 - [Dev] 在迁移到 "main" 作为默认 Git 分支后,从 core.py 的 Target 类的 default_branch 属性中移除 "master"
- GH-32916 - [C++][Python] 用户定义的表格函数 (#14682)
- GH-32946 - [Go] 实现 REE 数组和比较 (#14111)
- GH-32947 - [Go] 为 REE 数组实现 Concatenate (#14126)
- GH-32949 - [Go] REE 数组的 IPC 读/写 (#14223)
- GH-33024 - [C++][Parquet] 向 Parquet 写入器添加 DELTA_LENGTH_BYTE_ARRAY 编码器 (#14293)
- GH-33115 - [C++] Parquet 实现 DATA_PAGE (v1) 页读写中的 crc (#14351)
- GH-33143 - [C++] local_time 计算内核的命名和文档/测试更改 (#34263)
- GH-33143 - [C++] 内核将带时区的时间戳转换成本地时间 (#34208)
- GH-33209 - [C++] 支持读取 JSON 数据集 (#33732)
- GH-33215 - [Dev] 在默认分支迁移后,将 dev/archery/archery/crossbow/core.py 中的硬编码字符串 "master" 替换为 "main"
- GH-33243 - [Plasma] 移除 (#34718)
- GH-33317 - [C++] 用于确保数组对象满足对齐要求的实用方法 (#14758)
- GH-33377 - [Python] Table.drop 应支持传递单个列 (#33810)
- GH-33439 - [CI] Substrait 集成测试 (#14596)
- GH-33580 - [C++] 在 Substrait extension-multi 和 AsOfJoin 中支持 emit 信息 (#14799)
- GH-33588 - [Substrait] 为 round 操作添加 Substrait→Acero 映射 (#33775)
- GH-33596 - [C++][Parquet] Parquet 页面索引读取支持 (#14964)
- GH-33621 - [Documentation][Developer Tools] 添加 CODEOWNERS 文件 (#33622)
- GH-33631 - [R] 将 pkgdown 文档中的 Jira ticket 编号重写为 GitHub issue 编号 (#34260)
- GH-33640 - [C++] 为 asof join 节点添加背压机制 (#33648)
- GH-33652 - [C++][Parquet] 添加 total_compressed_bytes_written 接口 (#33897)
- GH-33655 - [C++][Parquet] 修复 TestArrowReadWrite.MultithreadedWrite 中的偶发性失败 (#33739)
- GH-33655 - [C++][Parquet] 并行写入 parquet 列 (#33656)
- GH-33659 - [Developer Tools] 添加 Breaking Change 和 Critical Fix 的定义 (#33660)
- GH-33673 - [C++] 规范化 as-of-join 对于过去和未来容差的约定 (#33676)
- GH-33679 - [JS] 更新依赖项 (#33680)
- GH-33681 - [JS] 更新 flatbuffers (#33682)
- GH-33723 - [C++] 必须检查 re2::RE2::RE2() 的结果 (#33806)
- GH-33724 - [Doc] 更新 substrait 一致性文档以反映最新支持情况 (#33725)
- GH-33734 - [Go] 兼容 grpc < 1.45 (#33735)
- GH-33737 - [C++] 简化 exec plan 追踪 (#33738)
- GH-33741 - [Python] 完善数据类型工厂函数的 docstrings (#33785)
- GH-33742 - [Python] 完善数据类型类的 docstrings (#34380)
- GH-33746 - [R] 为 11.0.0 更新 NEWS.md (#33748)
- GH-33750 - [GLib] 添加 garrow_table_batch_reader_set_max_chunk_size() (#34601)
- GH-33760 - [R][C++] 在 scanner 中处理嵌套字段引用 (#33770)
- GH-33787 - [C++] 在 s390x 上抑制 LinuxParseCpuFlags() 的 unused-value 警告 (#33828)
- GH-33789 - [Go] 为 RecordReader 添加 Err() (#33792)
- GH-33794 - [Go] 为 PreparedStatement 添加 SetRecordReader (#33795)
- GH-33800 - [Packaging] 放弃对 Ubuntu 18.04 的支持 (#34020)
- GH-33825 - [Python] 公开 pyarrow.dataset.get_partition_keys (从分区表达式中获取键/值) (#33862)
- GH-33835 - [Doc][Release] 改进发布指南说明 (#33836)
- GH-33840 - [Go] 改进 SQLite Flight SQL 示例并提供 mainprog (#33841)
- GH-33850 - [C++] 允许配置 Substrait 的默认扩展提供程序 (修复) (#34075)
- GH-33850 - [C++] 允许配置 Substrait 的默认扩展提供程序 (#34042)
- GH-33851 - [C++] 更新捆绑的 boost 版本 (#33890)
- GH-33852 - [Go] 从 Flight SQL 示例服务器返回 catalog/schema (#33853)
- GH-33859 - [C++][Java] 将 Apache ORC 升级到 v1.8.2 (#33860)
- GH-33867 - [Go][FlightSQL] 允许向 PreparedStatement 方法传递 grpc 调用选项 (#33868)
- GH-33872 - [C++] 移除 AppendScalar 中冗余的 shared_ptr 构造 (#33866)
- GH-33874 - [Java] 确保在 JDBC 认证握手期间包含自定义头 (#33946)
- GH-33875 - [Go] 处理 LargeString 和 LargeBinary 类型的写入 (#33965)
- GH-33892 - [R] 将 `dplyr::n()` 映射到 `count_all` 内核 (#33917)
- GH-33895 - [Release] 添加一个脚本以添加我们的 RubyGems 的新所有者 (#33896)
- GH-33899 - [C++] 添加 NamedTapRel 关系作为 Substrait 扩展 (#33909)
- GH-33901 - [Go] 添加一个基于 malloc 的分配器 (#33902)
- GH-33923 - [Docs] 张量 (Tensor) 规范扩展类型规范 (#33925)
- GH-33924 - [Format] 固定形状张量作为规范扩展类型
- GH-33926 - [Python] pyarrow.RecordBatch 的 DataFrame 交换协议 (#34294)
- GH-33935 - [Go][FlightRPC] 实现 Flight SQL 扩展 (#34039)
- GH-33936 - [Go] C 数据接口:为 nil 缓冲区导出虚拟缓冲区 (#33951)
- GH-33957 - [C++] 添加 Rank 分块数组基准测试 (#34602)
- GH-33972 - [C++] 将元数据传入 ParquetReader (#34015)
- GH-33977 - [Dev] PR 工作流自动化机器人 (#34161)
- GH-33990 - [C++] 我知道 NAN != NAN,但 literal(NAN) == literal(NAN) 不应该成立吗?
- GH-33993 - [Java] 在创建 Flight 服务器时让操作系统在测试中分配端口 (#33992)
- GH-33998 - [R] 更新 vignette 以引用新的 open_*_dataset 函数 (#34710)
- GH-34003 - [C++][nodiscard] (#34006)
- GH-34004 - [C++] 添加一个 benchmarks-maximal CMake 预设 (#34005)
- GH-34007 - [C++] 向 ExecResult 添加 array_span_mutable 接口 (#34008)
- GH-34011 - [Doc] 确保在完整文档构建时启用 substrait (#34024)
- GH-34011 - [Python][Doc] 将 pyarrow.substrait 添加到 pyarrow 的 API 参考文档中 (#34012)
- GH-34051 - [C++] GcsFileSystem 延迟启动顺序读取 (#34052)
- GH-34053 - [C++][Parquet] 写入 parquet 页面索引 (#34054)
- GH-34055 - [Go][CI] 在 CI 中添加使用 noasm 标签的测试运行 (#34167)
- GH-34056 - [C++] 添加实用函数以简化将任何基于行的结构转换为 `arrow::RecordBatchReader` 或 `arrow::Table` 的过程 (#34057)
- GH-34059 - [C++] 添加一个基于批次索引的 fetch 节点 (#34060)
- GH-34063 - [C++] 避免 `GcsFileSystem::ReadAt()` 中的浪费 (#34065)
- GH-34074 - [GLib][FlightRPC] 添加认证支持 (#34090)
- GH-34077 - [Go] 实现 RunEndEncoded 标量 (#34079)
- GH-34078 - [C++][Parquet] BloomFilter 的次要 API 改进 (#33995)
- GH-34094 - [C++] 对 clang >= 16 提高 Boost 最低版本要求 (#34100)
- GH-34113 - [C++][Thirdparty] 将 zstd 升级到 v1.5.4 (#34114)
- GH-34118 - [C++][Python] 使 S3 事件循环线程数可配置 (#34134)
- GH-34119 - [C#] 为 Schema 添加运算符 (#34126)
- GH-34122 - [C++] 允许调用函数注册表函数而无需 Substrait 映射 (#34288)
- GH-34136 - [C++] 向 ExecPlan 添加排序概念 (#34137)
- GH-34142 - [C++][Parquet] 修复记录不跨越多页的问题 (#34193)
- GH-34147 - [C++][Parquet] 支持 DICTIONARY_PAGE 上的 crc 计数和检查 (#34254)
- GH-34154 - [Python] 为 Array 和 Expression 添加 `is_nan` 方法 (#34184)
- GH-34157 - [C++] 配置捆绑的 AWS SDK 使用 aws-lc 而不是 OpenSSL (#34159)
- GH-34171 - [Go][Compute] 实现 "Unique" 内核 (#34172)
- GH-34174 - [Docs][Release] 将 Twitter 添加到发布后任务中 (#34202)
- GH-34186 - [Go] 添加 arrow.MapOfWithMetadata 以支持元数据 (#34207)
- GH-34197 - [R][CI] 将之前的 R 包版本添加到向后兼容性 CI 作业中 (#34198)
- GH-34199 - [R] 在 NEWS.md 中递增 R 包版本号 (#34200)
- GH-34219 - [Go][FlightRPC] 向 Sqlite FlightSQL 示例添加事务支持 (#34220)
- GH-34242 - [C++][Parquet] 优化 parquet schema 中 shared_ptr 的注释和移动 (#34243)
- GH-34248 - [Python] 暴露 order_by 节点 (#34654)
- GH-34248 - [C++] 添加 order_by 节点 (#34249)
- GH-34257 - [Docs] 更新外部项目的 git 链接/分支,从 master 改为 main (#34502)
- GH-34262 - [C++][ORC] 支持 union 类型 (#34416)
- GH-34266 - [C++] 添加 pivot_longer 节点 (#34267)
- GH-34278 - [C++] 在命名表提供程序中暴露 schema (#34279)
- GH-34280 - [C++][Python] 阐明 row_group_size 的含义并将默认值更改为 1Mi (#34281)
- GH-34322 - [C++][Parquet] ByteArray 的编码微基准测试 (#34323)
- GH-34330 - [Go][Parquet] : 添加扩展类型支持 (#34631)
- GH-34332 - [Go][FlightRPC] 为 `database/sql` 框架添加驱动 (#34331)
- GH-34334 - [Go][CSV] 支持 list 字段 (#34343)
- GH-34335 - [C++][Parquet] 优化 DELTA_LENGTH_BYTE_ARRAY 的解码 (#34955)
- GH-34339 - [R] 向 `read_csv_arrow` 的选项中添加 `skip_rows_after_names` 选项 (#34340)
- GH-34359 - [Python] 为 pyarrow.RecordBatch 添加 select 方法 (#34360)
- GH-34361 - [C++] 修复对没有位图的类型(如 Unions 和 Run-End Encoded)的逻辑空值的处理 (#34408)
- GH-34382 - [C++] 在 run_end_encode 和 run_end_decode 函数中支持更多类型 (#34761)
- GH-34388 - [C++] 无条件构建核心计算内核 (#34295)
- GH-34398 - [R] 为 11.0.0.3 更新 NEWS.md (#34399)
- GH-34405 - [C++] 在 QueryOptions 中添加对自定义名称的支持。将其连接到 Substrait (#34406)
- GH-34411 - [Python] 更改数组构造函数以接受 pyarrow 数组 (#34275)
- GH-34417 - [C++][Flight] 升级 OpenTelemetry SemanticConventions 头文件 (#34419)
- GH-34421 - [R] 让 GcsFileSystem 接受一个 json_credentials 的路径 (#34524)
- GH-34422 - [R] 暴露 GcsFileSystem$options (#34477)
- GH-34425 - [GLib] 添加 GArrowRankOptions (#34458)
- GH-34428 - [Python][Docs] 为 `make_fragment` 添加文档字符串 (#34429)
- GH-34437 - [R] 使用 FetchNode 和 OrderByNode (#34685)
- GH-34440 - [Ruby] 添加对不带代码块的 `RecordBatch{File,Stream}Reader#each` 的支持 (#34441)
- GH-34442 - [Ruby][FlightRPC] 添加 `ArrowFlight::RecordBatchReader#each` (#34444)
- GH-34453 - [Go] 支持用户自定义扩展的 Builders (#34454)
- GH-34481 - [CI] 将 ARM 作业从 Travis 迁移到自托管的 runners (#34482)
- GH-34499 - [R] 发布后在 NEWS.md 中增加版本号 (#34500)
- GH-34536 - [Parquet][C++] 覆盖 DeltaBitPackEncoder 的默认配置 (#34632)
- GH-34543 - [CI] 自托管 ARM 工作流改进 (#34512)
- GH-34547 - [C++][ORC] 移除已弃用的 ORC_UNIQUE_PTR (#34548)
- GH-34552 - [C++][Parquet] 从上游同步 parquet.thrift (#34553)
- GH-34561 - [C++] 实现 RunEndEncodedBuilder::AppendEmptyValues() (#34562)
- GH-34564 - [Python][C++] 更新代码以使用 cython 3 编译 (#34726)
- GH-34565 - [C++] 让 dataset_writer 接受自定义文件名函子 (#34984)
- GH-34572 - [Go][CSV] 为 CSV 添加二进制支持 (#34558)
- GH-34581 - [C++][Java] 将 Apache ORC 升级到 v1.8.3 (#34582)
- GH-34584 - [Go][CSV] 添加对扩展类型的支持 (#34585)
- GH-34590 - [C++][ORC] 修复 ORC 和 Arrow 之间的时间戳类型映射问题 (#34591)
- GH-34595 - [C++] 将 google-cloud-cpp 更新至 v2.8.0 (#34707)
- GH-34615 - [CI][C++] 为无 ARROW_COMPUTE 的基本格式支持添加 CI 作业 (#34617)
- GH-34626 - [C++] 添加有序/分段聚合的 Substrait 扩展 (#34627)
- GH-34630 - [C++] 第二阶段重构,将 acero 从 libarrow 中移出 (#34575)
- GH-34638 - [C++][文档] 为最小化构建标志添加文档 (#34693)
- GH-34644 - [C++] 在 Substrait 中默认倾向于使用不安全的类型转换 (#34645)
- GH-34650 - [GLib] 添加 GArrowFilterNodeOptions (#34663)
- GH-34659 - [C++] 审查行程长度编码(Run-End Encoded)数组的验证过程以改进 Python 集成 (#34628)
- GH-34665 - [Parquet][C++] 允许读取布隆过滤器(BloomFilter)(#34728)
- GH-34669 - [打包][Conda] 更新 arrow feedstock 的依赖项 (#34652)
- GH-34673 - [C++][Parquet] 为 Parquet 添加布尔值编码的基准测试 (#34676)
- GH-34686 - [Python] 添加 RunEndEncodedScalar 类 (#34924)
- GH-34687 - [CI][Python] 创建一个作业以从 gemfury 中删除旧的 nightly wheels (#34705)
- GH-34692 - [Java] 暴露 Location.toSocketAddress (#34648)
- GH-34700 - [打包][RPM] 在 AlmaLinux 8+ 上使用 lz4-libs 代替 lz4 (#34716)
- GH-34703 - [Python] 在创建 pandas Series 时显式设置 copy=False (#34593)
- GH-34737 - [C#] 为 Schema 和 Type 提供 C 数据接口 (#34133)
- GH-34742 - [Java] 拆分 flight-sql-jdbc-driver 以便于重用 (#34678)
- GH-34768 - [C++][Gandiva] 取消对 LLVM<16 的版本限制 (#34922)
- GH-34768 - [C++][Gandiva] 接受 LLVM 16 (#34916)
- GH-34778 - [Java] 仅将 ServerInterceptorAdapter 逻辑应用于 Flight 服务请求 (#34815)
- GH-34790 - [Go] : 添加 array.Edits.UnifiedDiff (#34827)
- GH-34790 - [Go] : 添加 array.Diff() (#34806)
- GH-34796 - [C++] 为 FixedShapeTensorArray 添加 FromTensor、ToTensor 和 strides 方法 (#34797)
- GH-34802 - [C++][Parquet] 允许向解码器传递内存池(pool)(#34803)
- GH-34805 - [CI][Python] Conda 打包构建中的 Cython 测试失败
- GH-34812 - [打包][Python] 使用自托管的 arm64 Linux runner 代替 Travis CI 来构建 Linux arm64 wheels (#34835)
- GH-34813 - [C++] 改进 GoogleTest 的检测 (#34920)
- GH-34819 - [Ruby] 添加 Slicer::ColumnCondition#match_substring (#34902)
- GH-34821 - [文档][ORC] 更新 ORC 的文档 (#34822)
- GH-34832 - [Go] 为 Record 添加 SetColumn 方法 (#34794)
- GH-34837 - [GLib][Ruby] 添加 Arrow::{Sparse,Dense}UnionArray#get_value (#34838)
- GH-34839 - [Go] 对于非 amd64 的 GOARCH,构建 compute 时不使用 noasm (#34840)
- GH-34853 - [Go] 添加 TotalRecordSize, TotalArraySize (#34854)
- GH-34855 - [Go] 为 Metadata 添加 GetValue 函数 (#34856)
- GH-34863 - [Go] Decimal 数据类型的 Pow 方法 (#34864)
- GH-34879 - [Python][CI] 与最新 dask 的 nightly 集成测试失败 (test_null_partition_pyarrow)
- GH-34880 - [Python][CI] 修复因最新 pandas 2.0 导致失败的 Windows 测试 (#34881)
- GH-34882 - [Python] 为 FixedShapeTensorType 提供绑定 (#34883)
- GH-34888 - [C++][Parquet] Writer 支持添加额外的键值元数据 (#34889)
- GH-34893 - [C++] 修复在反向迭代时出现的行程长度编码数组迭代器问题 (#34896)
- GH-34899 - [C++] 依赖项:将 zstd 升级到 v1.5.5 (#34900)
- GH-34914 - [打包][Linux] 添加对 Acero 的支持 (#34915)
- GH-34945 - [C++][文档] 在示例中添加缺失的 cmake_minimum_required() (#34969)
- GH-34946 - [Ruby] 移除与 DictionaryArrayBuilder 相关的遗漏项 (#34947)
- GH-34951 - [Ruby] 添加使用 MatchSubStringFamilyCondition 的方法 (#34952)
- GH-34956 - [文档][Python] 在文档中添加 FixedShapeTensorType 的用法 (#34957)
- GH-34962 - [Go] 将 Array 接口上的 GetOneForMarshal 设为公共方法 (#34964)
- GH-34968 - [C++] 为 RecordBatch 添加 Equal Options (#34970)
- GH-35025 - [Python] 移除已弃用的 pandas.Categorical fastpath 关键字的使用 (#35026)
- GH-35042 - [Go][FlightSQL driver] 添加 TLS 配置 (#35051)
- GH-35078 - [Python][CI] Windows 上的测试运行非常缓慢
- GH-35218 - [R] 为 R 组件更新 NEWS 文件/版本 12.0.0 (#35219)
- PARQUET-2201 - [parquet-cpp] 为 RecordReader 的 ReadRecords 和 SkipRecords 添加压力测试 (#14879)
- PARQUET-2225 - [C++][Parquet] 允许通过 RecordReader 读取稠密数据(dense)(#17877)
- PARQUET-2232 - [C++] 向 ColumnChunkMetaData 添加一个 API,以指示列块是否使用布隆过滤器 (#33736)
- PARQUET-2250 - [C++][Parquet] 通过 RecordReader 暴露列描述符 (#34318)