Apache Arrow 10.0.0 (2022年10月26日)
这是一个涵盖超过 2 个月开发工作的重大版本。
下载
贡献者
此版本包含来自 100 位不同贡献者的 536 次提交。
$ git shortlog -sn apache-arrow-9.0.0..apache-arrow-10.0.0
68 Sutou Kouhei
52 Matt Topol
32 David Li
31 Antoine Pitrou
19 Alenka Frim
19 Jacob Wujciak-Jens
19 Weston Pace
18 Miles Granger
18 Nic Crane
17 Jin Shang
17 Raúl Cumplido
14 Neal Richardson
14 eitsupi
12 Will Jones
12 david dali susanibar arce
11 Dewey Dunnington
10 Vibhatha Lakmal Abeykoon
7 Igor Suhorukov
7 Larry White
7 Rok Mihevc
6 rtpsw
5 Kshiteej K
5 octalene
4 Krisztián Szűcs
4 Yibo Cai
3 Ben Harkins
3 Bryce Mecum
3 Dominik Moritz
3 George Godik
3 Joris Van den Bossche
3 LouisClt
3 Percy Camilo Triveño Aucahuasi
3 Philipp Moritz
3 Todd Farmer
3 Wes McKinney
2 0x26res
2 Anja Kefala
2 Dragoș Moldovan-Grünfeld
2 François Michonneau
2 Gang Wu
2 Hongze Zhang
2 Joost Hoozemans
2 Kae S
2 Nishanth Thimmegowda
2 Pavel Solodovnikov
2 SHIMA Tatsuya
2 Sam Albers
2 Ziheng Wang
1 Aleksei Smirnov
1 Andrea Giudiceandrea
1 Ankit Gehlot
1 Artavazd Balaian
1 Benson Muite
1 Christopher Dunderdale
1 Corey Kosak
1 Dhruv Vats
1 Duncan MacQuarrie
1 Egill Fridgeirsson
1 Eng Zer Jun
1 Felix Yan
1 Gajo Petrovic
1 Gil Forsyth
1 Ivan Chau
1 Jacky Lee
1 James Bourbeau
1 James Duong
1 Jayjeet Chakraborty
1 Jeroen van Straten
1 Jie Zhang
1 Jin Chengcheng
1 Kai Fricke
1 Kevin Gurney
1 Kun Liu
1 Leo Gertsenshteyn
1 Liang-Chi Hsieh
1 Michael Chirico
1 Michał Pogoda
1 Mitch
1 Muthunagappan Muthuraman
1 Otegami
1 Quang Hoang
1 Quanlong Huang
1 Raphael Taylor-Davies
1 Rasmus Johansen
1 Sanjiban Sengupta
1 Theodore Tsirpanis
1 Wilhelm Ågren
1 William Hyun
1 Xianyang Liu
1 ZMZ91
1 andreoss
1 dependabot[bot]
1 emkornfield
1 fatemehp
1 lafiona
1 mgiessing
1 michalursa
1 mopcup
1 patrick
1 serge-sans-paille
补丁提交者
以下 Apache 提交者将贡献的补丁合并到代码库中。
$ git shortlog -sn --group=trailer:signed-off-by apache-arrow-9.0.0..apache-arrow-10.0.0
126 Sutou Kouhei
97 Antoine Pitrou
68 David Li
59 Matt Topol
41 Neal Richardson
26 Joris Van den Bossche
25 Weston Pace
21 Nic Crane
13 Dewey Dunnington
11 Yibo Cai
10 Alenka Frim
9 Krisztián Szűcs
4 Jonathan Keane
4 Rok
2 Eric Erhardt
2 Philipp Moritz
2 Wes McKinney
1 Alessandro Molina
1 Andrew Lamb
1 Benjamin Kietzman
1 Dominik Moritz
1 Ian Cook
1 Rok Mihevc
变更日志
Apache Arrow 10.0.0 (2022-10-26)
新功能和改进
- ARROW-3678 - [Go] 实现联合数组 (#13768)
- ARROW-6772 - [C++] 为具有 Equals() 方法的接口添加 operator== (#14038)
- ARROW-6858 - [C++] 简化传递构建选项依赖项 (#14224)
- ARROW-7744 - [Java][FlightRPC] 用于 Arrow Flight SQL 的 JDBC 驱动程序 (#13800)
- ARROW-8201 - [Python] 添加 FileFragment.open() 方法 (#14301)
- ARROW-8226 - [Go] 添加 64 位偏移量二进制构建器和字符串构建器 (#13719)
- ARROW-10600 - [Go] 实现 Decimal256 (#13792)
- ARROW-11699 - [R] 为 mutate() 实现 dplyr::across()
- ARROW-11841 - [R][C++] 允许取消长时间运行的命令 (#13635)
- ARROW-12105 - [R] 将 vars_select、vars_rename 替换为 eval_select、eval_rename (#14371)
- ARROW-12590 - [C++][R] 更新 Homebrew 文件副本以反映最近的更新 (#13769)
- ARROW-12693 - [R] 为 ArrowTabular、数据集添加 unique() 方法 (#13641)
- ARROW-12778 - [R] 在 dplyr 动词中支持 tidyselect where() 选择助手
- ARROW-12958 - [CI][开发者] 为 PR 分支构建 + 托管文档 (#13913)
- ARROW-13055 - [文档] 创建规范扩展类型文档 (#14167)
- ARROW-13454 - [C++][文档] 表与记录批次 (#14008)
- ARROW-13766 - [R] 添加 slice_*() 方法 (#14361)
- ARROW-14280 - [文档] R 包架构概述 (#14294)
- ARROW-14495 - [Python] 修复 DictionaryArray.from_buffers,不应该崩溃 (#13989)
- ARROW-14500 - [C++] 支持从存储类型转换为扩展类型
- ARROW-14958 - [C++][Python][FlightRPC] 为 OpenTelemetry 传播实现 Flight 中间件 (#11920)
- ARROW-15011 - [R] 为 dplyr 函数绑定生成文档 (#14014)
- ARROW-15260 - [R] open_dataset - 添加 file_name 作为列 (#12826)
- ARROW-15277 - [C++][Python] 将 ChunkedArray::Make 用于 chunked_array (#13950)
- ARROW-15479 - [C++] 将固定大小的列表转换为兼容的固定大小的列表类型(其他值类型,其他字段名称) (#14181)
- ARROW-15481 - [R][CI] 添加一个模拟 CRAN 旧 macOS 的 crossbow 作业 (#13925)
- ARROW-15540 - [C++] 允许 substrait 使用者接受带有提示和可为空文字的计划 (#14402)
- ARROW-15545 - [Python][C++] 支持转换为扩展类型 (#14106)
- ARROW-15582 - [C++] 添加对注册标准 Substrait 函数的支持 (#13613)
- ARROW-15584 - [C++] 添加对 Substrait 的 RelCommon::Emit 的支持 (#13914)
- ARROW-15678 - [C++] 添加对 -DCMAKE_BUILD_TYPE=MinSizeRel 的支持 (#14342)
- ARROW-15693 - [开发] 更新 crossbow 模板以使用 master 或 main (#13975)
- ARROW-15745 - [Java] 弃用冗余的 ScanTask 可迭代对象 (#14168)
- ARROW-15838 - [R] 在完全外部联接中合并联接键 (#14286)
- ARROW-15839 - [C++][Python] 在 ListArray.from_arrays 中接受有效性位图 (#13894)
- ARROW-15927 - [C++][Skyhook] 添加 skyhook 示例 (#12620)
- ARROW-16000 - [C++][Python] 数据集:为 CSV 扫描器添加转码函数选项的替代实现 (#13820)
- ARROW-16190 - [CI][R] 在 Apple M1 上为 R 实现 CI (#14099)
- ARROW-16226 - [C++] 为文件系统 tell 添加更好的覆盖范围。 (#14064)
- ARROW-16340 - [C++][Python] 将所有 Python 相关代码移至 PyArrow (#13311)
- ARROW-16356 - [Python] 公开 RandomAccessFile::GetStream (#13793)
- ARROW-16384 - [文档] 将 Flight SQL 添加到状态页面 (#14053)
- ARROW-16424 - [C++] 使用 Uri 解析 substrait ReadRel 文件路径 (#14071)
- ARROW-16431 - [C++][Python] 当模式不同时改进 AppendRowGroups 错误 (#14029)
- ARROW-16584 - [Java] 支持 S3 的 Java JNI (#13157)
- ARROW-16605 - [CI][R] 修复 revdep docker 作业 (#13483)
- ARROW-16690 - [R][FlightRPC] do_put 方法中的附加 max_chunksize 参数 (#13267)
- ARROW-16695 - [R][Python][C++] 联接中不支持扩展类型 (#13501)
- ARROW-16719 - [Python] 将路径/URI + 文件系统处理添加到 parquet.read_metadata (#13629)
- ARROW-16740 - [C++] 删除 IR 使用者 (#13301)
- ARROW-16855 - [C++] 添加读取关系 ToProto (#13401)
- ARROW-16870 - [C++] 修复 flight 示例中 ldd 和 clang 的链接问题 (#14077)
- ARROW-16879 - [R][CI] 使用 testbench 测试 R GCS 绑定 (#13542)
- ARROW-16894 - [C++] 为 Asof 联接节点添加基准测试 (#13426)
- ARROW-16949 - [文档] 将术语表添加到新贡献者指南 (#13951)
- ARROW-16981 - [C++] 公开 jemalloc 统计信息以进行日志记录 (#13516)
- ARROW-16988 - [C++] 引入 Substrait ToProto/FromProto 转换选项 (#13537)
- ARROW-17004 - [Java] 添加实用程序以将 Arrow 数据绑定到 JDBC 参数 (#13589)
- ARROW-17016 - [C++][Python] 将 Arrow Python C++ 测试移至 Cython (#14117)
- ARROW-17017 - [C++][Python] 启用 Arrow Python 的自动重建
- ARROW-17021 - [C++][R][CI] 允许在 crossbow 中使用 sccache (#13556)
- ARROW-17052 - [C++][Python][FlightRPC] 公开 flight 结构序列化 (#13986)
- ARROW-17079 - 显示未知 S3 错误的 HTTP 状态代码 (#14019)
- ARROW-17079 - [C++] 为 S3 错误引发正确的错误消息而不是错误代码 (#14001)
- ARROW-17079 - [C++] 改进 AWS S3 调用的错误消息 (#13979)
- ARROW-17081 - [Java][数据集] 将 JNI 构建配置从 cpp/ 移至 java/ (#13911)
- ARROW-17088 - [R] 使用
.arrow
作为数据集 IPC 文件的扩展名 (#13690) - ARROW-17089 - [Python] 使用
.arrow
作为 IPC 文件数据集的扩展名 (#13677) - ARROW-17092 - [文档] 将关于“Feather”的注释添加到 IPC 文件格式文档 (#13693)
- ARROW-17106 - [Python] 将初始化代码移至核心并仅公开 API (#13802)
- ARROW-17113 - [Java] 在静态初始化程序块中大声失败 (#13678)
- ARROW-17122 - [Python] 将 Python 相关代码移至 pyarrow 后的清理工作
- ARROW-17131 - [Python] 添加 StructType().field():按名称或索引返回字段 (#13652)
- ARROW-17154 - [C++] 将 cmake 项目名称从 arrow_python 更改为 pyarrow_cpp
- ARROW-17160 - [C++] 为 PyArrow CPP 头文件创建基目录 (#14275)
- ARROW-17172 - [C++][Python] test_cython_api 在 Windows 上失败 (#14133)
- ARROW-17175 - [CI][macOS] macos-10.15 已弃用,macos-latest 为 macos-11 (#13684)
- ARROW-17178 - [R] 在 arrow_dplyr_query 中支持 head() 并带有用户定义的函数 (#13706)
- ARROW-17181 - [文档][Python] 标量 UDF 实验文档 (#13687)
- ARROW-17205 - [开发][发布] 创建维护分支时,合并脚本应提示输入下一个版本 (#13708)
- ARROW-17214 - [C++] 为基于列表的类型添加对字符串类型的标量转换 (#13737)
- ARROW-17219 - [Go][IPC] 非原生字节序的字节序转换 (#13716)
- ARROW-17222 - [文档][Archery][集成] 记录 archery 涵盖的当前集成测试用例 (#13717)
- ARROW-17240 - [CI][发布] 在夜间 CI 中验证 wheel (#14319)
- ARROW-17243 - [网站] 将 ClickHouse 添加到“使用案例”
- ARROW-17247 - [C++][文档] 在 Acero 文档中包含 ExecPlan API 的可见性 (#13741)
- ARROW-17252 - [R] 间歇性 valgrind 失败 (#13773)
- ARROW-17266 - [文档] Java nightly 文件前缀已更改 (#13755)
- ARROW-17269 - [Java] 在 MapVector 中实现了 TransferPair 方法,以获取正确的 valuevector 为 mapvector 而不是 listvector (#13776)
- ARROW-17270 - [文档] 将 nightly 包指令移动到开发者文档 (#13766)
- ARROW-17273 - [Go][CSV] 为 csv.Writer 添加 Timestamp、Date32、Date64 格式支持 (#13772)
- ARROW-17274 - [GO] 从 parquet.file.RowGroupReader.Column(index int) 中移除 panic (#13767)
- ARROW-17275 - [Go][集成] 在 IPC 读/写中处理大偏移类型 (#13770)
- ARROW-17276 - [Go][集成] 为联合类型实现 IPC 处理 (#13806)
- ARROW-17277 - [Go][CSV] 为布尔值自定义 csv.Writer 格式化程序 (#13774)
- ARROW-17280 - [C++] 将 vendored flatbuffers 移至私有命名空间 (#13775)
- ARROW-17282 - [Python] flake8 更新导致 linter CI 失败 (#13778)
- ARROW-17287 - [C++] 创建不依赖于合并生成器的扫描节点 (#13782)
- ARROW-17289 - [C++] 添加类型类别成员资格检查 (#13783)
- ARROW-17293 - [Java][CI] 清理 Java nightly 构建 (#13839)
- ARROW-17297 - [Java][文档] 添加文档以说明如何通过 C 数据接口在 C++ 和 Java 之间进行交互 (#13788)
- ARROW-17299 - [C++][Python] 公开 Scanner 的 kDefaultBatchReadahead 和 kDefaultFragmentReadahead 参数 (#13799)
- ARROW-17303 - [Java][Dataset] 使用 NativeDatasetFactory 读取 Arrow IPC 文件 (#13760) (#13811)
- ARROW-17304 - [C++][Compute] 在聚合测试比较失败时打印实际值 (#13814)
- ARROW-17305 - [C++] 避免在 BitmapAnd 基准测试中浪费时间在 popcount 上 (#13794)
- ARROW-17306 - [C++] 为 `LocalFileSystem` 提供优化的 `GetFileInfoGenerator` 特化 (#13796)
- ARROW-17310 - [C++] 从 Iterator 中公开 RBR:Make()
(#13798) - ARROW-17317 - [发布][文档] 规范化以前的文档版本目录 (#14457)
- ARROW-17318 - [C++][Dataset] 支持用于获取 Dataset 中片段的异步流接口 (#13804)
- ARROW-17320 - [Python] 优化 pyarrow.parquet API 暴露 (#14096)
- ARROW-17321 - [JS] 更新依赖项 (#13758)
- ARROW-17322 - [文档] 记录 bug 和功能请求的问题生命周期 (#13781)
- ARROW-17323 - [Go] 清理和升级依赖项 (#13807)
- ARROW-17324 - [Go][CI] 添加 go1.18 作业和 -asan 标志 (#13867)
- ARROW-17326 - [Go][FlightSQL] 为 Go 添加 FlightSQL 支持 (#13828)
- ARROW-17340 - [Go] 使用 `T.TempDir` 创建临时测试目录 (#13816)
- ARROW-17348 - [C++] 添加对使用 Visual C++ 2019 或更高版本构建捆绑 LZ4 的支持 (#13817)
- ARROW-17349 - [C++] 允许转换 map 类型 (#14198)
- ARROW-17355 - [R] 重构 handle_* 实用函数以获得更好的开发体验 (#14030)
- ARROW-17357 - [CI][Conan] 启用 JSON (#13823)
- ARROW-17358 - [CI][C++] 为 Alpine Linux 添加一个作业 (#13825)
- ARROW-17359 - [Go][FlightSQL] 创建使用 SQLite 内存数据库的示例并用于测试 FlightSQL 服务器 (#13868)
- ARROW-17362 - [R] 在 summarise() 内部实现 dplyr::across() (#14042)
- ARROW-17364 - [R] 在 across() 内部实现 .names 参数
- ARROW-17366 - [R] 在 across() 的 .fns 参数中支持 purrr 风格的 lambda 函数 (#14327)
- ARROW-17367 - [C++] 修复 LZ4 的 CMake 目标名称 (#13831)
- ARROW-17368 - [C++] 添加对安装实用程序的支持 (#13832)
- ARROW-17370 - [C++] 向 SplitString() 添加限制 (#13833)
- ARROW-17371 - [R] 移除 as.factor 到 dictionary_encode 的映射
- ARROW-17377 - [C++][文档] 添加了关于基本 Arrow、文件访问、计算和数据集的教程 (#13859)
- ARROW-17385 - [集成] 重新启用 Rust 集成案例 (#13852) (#13858)
- ARROW-17385 - [集成] 还原“重新启用 Rust 集成案例” (#13856)
- ARROW-17387 - [R] 在 filter() 内部实现 dplyr::across() (#14281)
- ARROW-17390 - [Go] 添加联合标量类型 (#13860)
- ARROW-17394 - [C++][Parquet] 修复 parquet_static 依赖项 (#13863)
- ARROW-17395 - [CI][Conan] 找不到 grpc-proto/cci.20220627 包 (#13864)
- ARROW-17405 - [文档][Java] C 数据接口库可以使用 mvn 命令编译 (#13881)
- ARROW-17407 - [文档][FlightRPC] Flight/gRPC 最佳实践 (#13873)
- ARROW-17409 - [打包][RPM][GLib] *-glib-libs 应该包含 .typelib,*-glib-devel 应该包含 .gir (#13876)
- ARROW-17412 - [C++] AsofJoin 多个键和类型 (#13880)
- ARROW-17418 - [文档][Java] Dataset 库可以使用 mvn 命令编译 (#13889)
- ARROW-17420 - [C++][FlightRPC] 修复 Flight SQL 集成测试中的模式验证 (#13897)
- ARROW-17427 - [Java] 添加生成 DLL 的 Windows 构建脚本 (#14203)
- ARROW-17430 - [Java] ListBinder 将 Arrow List 类型绑定到数据库列 (#13906)
- ARROW-17431 - [Java] MapBinder 将 Arrow Map 类型绑定到数据库列 (#13941)
- ARROW-17434 - [Java][CI] 为 Java 添加构建 Windows 支持 (#13918)
- ARROW-17435 - [CI][Python][CUDA] 为 CUDA 互操作性测试安装 Numba (#13899)
- ARROW-17436 - [C++] 对 RELEASE 构建使用 -O2 而不是 -O3 (#13661)
- ARROW-17439 - [R] 更改 pull 的行为以进行计算而不是收集 (#14330)
- ARROW-17449 - [Python] 为 Buffer、MemoryPool、NativeFile 和 Codec 提供更好的 repr (#13921)
- ARROW-17451 - [CI][Java] 将 manylinux2014 镜像用于 JNI (#13920)
- ARROW-17455 - [Go] 函数和内核执行架构 (#13964)
- ARROW-17456 - [Go] 将计算模块标记为单独的子模块 (#13910)
- ARROW-17460 - [R] 如果我注册的新 UDF 与现有 UDF 相同,则不要发出警告 (#14436)
- ARROW-17463 - [R] 避免不必要的投影 (#13954)
- ARROW-17470 - [CI][GLib] 添加更多系统软件包以同步上游 PKGBUILD (#13917)
- ARROW-17475 - [Go] 函数接口和 Registry 实现 (#13924)
- ARROW-17476 - [发布][打包] 使二进制上传器可从 datafusion-c 重用 (#13923)
- ARROW-17479 - [Go] 添加 ArraySpan 和实用程序 (#13929)
- ARROW-17480 - [Java] 向 FieldVector 接口添加 setNull() (#14244)
- ARROW-17482 - [Go] 删除 ValueDescr 类型 (#13930)
- ARROW-17483 - [Python] 在非遗留 ParquetDataset/read_table 中支持表达式过滤器 (#14011)
- ARROW-17485 - [R] 允许对 `write_feather` (`write_ipc_file`) 的压缩选项使用 TRUE/FALSE (#13935)
- ARROW-17488 - [Python] 添加对 RelWithDebInfo 的支持
- ARROW-17489 - [R] 由于测试引用了未发布的 stringr 函数,导致 nightly 构建失败 (#13937)
- ARROW-17492 - [C++] 为大型 var-binary 类型提供 Hashing32/64 支持 (#13940)
- ARROW-17499 - [Go] 将 MakeArrayOfNull 移至 array 包 (#13944)
- ARROW-17500 - [Go] Kernel 和 KernelContext 接口 (#13946)
- ARROW-17510 - [CI][C++][Windows][MSVC] 使用 ccache (#13957)
- ARROW-17511 - [C++] 添加对 xsimd 9.0.0 的支持 (#13958)
- ARROW-17512 - [文档] 更新 crossbow 文档以提高清晰度 (#13993)
- ARROW-17519 - [R] RTools35 作业失败 (#14035)
- ARROW-17521 - [Python] 为 Substrait 使用者添加 NamedTableProvider 的 Python 绑定 (#14024)
- ARROW-17523 - [C++] 添加对 substrait 函数 is_null、is_not_null 和 count 的支持 (#13969)
- ARROW-17525 - [Java] 使用 NativeDatasetFactory 读取 ORC 文件 (#13973)
- ARROW-17527 - [Go] 实现转换为布尔函数 (#13974)
- ARROW-17532 - [Go][Compute] 实现数值转换函数 (#13992)
- ARROW-17536 - [打包][RPM][Gandiva] 修复 CentOS Stream 9 上的构建错误 (#13984)
- ARROW-17545 - [C++][CI]强制使用 C++17 而不是 C++11 (#13991)
- ARROW-17546 - [C++] 删除 C++17 之前的兼容性措施
- ARROW-17551 - [Go] 实现时间转换函数 (#14006)
- ARROW-17553 - [Go] 启用 flight.Server 注册其他 grpc 服务 (#13995)
- ARROW-17554 - [Python][打包] 停止生成 macOS Mavericks wheels (#13996)
- ARROW-17555 - [开发][CI] “ci/scripts/install_osx_sdk.sh” 未使用
- ARROW-17560 - [Java][Gandiva] 将 JNI 构建配置从 cpp/ 移至 java/ (#14159)
- ARROW-17561 - [Java][ORC] 将 JNI 构建配置从 cpp/ 移至 java/ (#14162)
- ARROW-17569 - [C++] 将 xsimd 版本 bumping 至 9.0.1 (#14005)
- ARROW-17575 - [文档][C++] 更新构建文档以遵循新的 CMake 包 (#14097)
- ARROW-17585 - [Java] 更新 GenerateSampleData.java (#14289)
- ARROW-17586 - [Go] 字符串到数字的转换函数 (#14015)
- ARROW-17587 - [Go] 从扩展类型转换 (#14016)
- ARROW-17588 - [Go] 转换为类二进制类型 (#14027)
- ARROW-17594 - [R][打包] 在 CentOS 7 上使用 devtoolset 8 构建二进制文件 (#14243)
- ARROW-17600 - [Go] 为嵌套类型实现转换 (#14056)
- ARROW-17603 - [C++][FlightRPC] 当 REQUIRE_TLSCREDENTIALSOPTIONS 启用时,详细说明失败原因 (#14034)
- ARROW-17604 - [文档][Java] 更明确地说明需要使用 –add-opens 参数 (#14066)
- ARROW-17617 - [文档] 移除 Flight 的实验性限定符 (#14055)
- ARROW-17621 - [持续集成] 审查工作流程 (#14155)
- ARROW-17628 - [持续集成][打包][Java] 使用 SNAPSHOT 版本发布最新的 nightly 版本 (#14135)
- ARROW-17629 - [Java] 在 JdbcToArrowUtils 中将数据库列绑定到 Arrow Map 类型 (#14134)
- ARROW-17630 - [Java] 在 JdbcToArrowTypeConverter 中引入列索引作为 JdbcFieldInfo.column
- ARROW-17631 - [Java] 将表/列注释传播到 Arrow Schema 中 (#14081)
- ARROW-17632 - [Python][C++] 添加构建期间 libarrow 位置的详细信息 (#14059)
- ARROW-17638 - [Go] 扩展 C 数据 API 对联合数组和 RecordReader 接口的支持 (#14057)
- ARROW-17646 - [Go][持续集成] 将 C 数据切换为使用 cgo.Handle(升级到 Go1.17) (#14067)
- ARROW-17647 - [C++] 在 Substrait 中使用 protobuf 时使用更好的命名空间风格 (#14121)
- ARROW-17649 - [Python] 删除 <= 1.0.0 中剩余的已弃用 API (#14401)
- ARROW-17659 - [Java] 当提供 config.shouldIncludeMetadata 时,填充 JDBC 模式名称元数据 (#14196)
- ARROW-17665 - [R] 记录 dplyr 和 compute 功能 (#14387)
- ARROW-17666 - [R] 记录 dplyr 语法支持的例外情况
- ARROW-17667 - [R] 记录函数绑定支持的例外情况
- ARROW-17669 - [Go] 为记录批次、表和分块数组获取函数内核 (#14214)
- ARROW-17670 - [Go] 为基本类型和固定大小类型实现 Filter 函数 (#14088)
- ARROW-17671 - [Go] 用于二进制/字符串的 Filter 内核 (#14098)
- ARROW-17673 - [R]
desc
在dplyr::arrange
中应允许dplyr::
前缀 (#14090) - ARROW-17674 - [R] 在 arrange() 中实现 dplyr::across() (#14092)
- ARROW-17677 - [Go] 用于列表和扩展类型的 Filter 函数 (#14141)
- ARROW-17678 - [Go] 用于记录批次和表的 Filter 内核 (#14156)
- ARROW-17688 - [C++][Java][FlightRPC] Flight SQL 的 Substrait、事务、取消 (#13492)
- ARROW-17689 - [R] 在 group_by() 中实现 dplyr::across() (#14122)
- ARROW-17690 - [R] 在 distinct() 中实现 dplyr::across() (#14154)
- ARROW-17691 - [Go] 为基本类型实现 Take (#14101)
- ARROW-17693 - [C++] 删除 string_view 向后兼容 (#14177)
- ARROW-17694 - [C++] 删除 std::optional 向后兼容 (#14105)
- ARROW-17695 - [C++] 删除 Variant 类 (#14136)
- ARROW-17698 - [R] 在 `across()` 中实现 `where()` 的使用
- ARROW-17701 - [C++][Gandiva] 添加对无类型节点的支持 (#14110)
- ARROW-17704 - [Java][FlightRPC] 更新到 Junit 5 (#14103)
- ARROW-17716 - [文档] 删除 IR 文档页面 (#14112)
- ARROW-17724 - [R] 允许在 dplyr::across 的 .fns 参数中使用包名称前缀 (#14279)
- ARROW-17730 - [Go] 为 FSB 和 VarBinary 实现 Take 内核 (#14127)
- ARROW-17734 - [Go] 为列表和密集联合实现 Take (#14130)
- ARROW-17736 - [C++] 为 Substrait 生产者添加了回退名称解析机制。 (#14143)
- ARROW-17741 - [打包] 在 java-jars 工件中包含 JDBC 驱动程序 (#14139)
- ARROW-17749 - [Go] 为结构体实现 Filter 和 Take (#14145)
- ARROW-17764 - [持续集成][C++] 缺少 "#include
" (#14161) - ARROW-17767 - [Java][ORC] 将 JNI 构建配置从 cpp/ 移动到 java/ (#14163)
- ARROW-17778 - [Go][CSV] 简单的 CSV 读取器模式和类型推断 (#14171)
- ARROW-17782 - [C++][R] R 包无法在 macOS 10.13 上使用 C++17 标准库构建 (#14178)
- ARROW-17786 - [Java] 使用 org.apache.arrow.dataset.jni.NativeDatasetFactory 读取 CSV 文件 (#14182)
- ARROW-17788 - [R][文档] 添加使用 Scanner 的示例 (#14184)
- ARROW-17789 - [Java][文档] 使用最新更改更新 Java Dataset 文档 (#14382)
- ARROW-17792 - [C++] 使用 lambda 捕获移动构造 (#14188)
- ARROW-17794 - [Java] 在 JVM 退出时强制删除 jni 库文件 (#14189)
- ARROW-17803 - [C++][nodiscard] (#14193)
- ARROW-17804 - [Go][CSV] 添加 Date32 和 Time32 解析器 (#14192)
- ARROW-17810 - [Java] 使用 jacoco-maven-plugin 0.8.8 支持 Java 18 (#14197)
- ARROW-17811 - [Java][文档] 为 Java 中的字典编码添加了高级文档 (#14213)
- ARROW-17814 - [C++] 修复样式 (#14218)
- ARROW-17814 - [C++] 删除 make_unique 重新实现 (#14204)
- ARROW-17815 - [Python] 当 SetSignalStopSource 失败时发出警告,而不是报错 (#14205)
- ARROW-17817 - [C++] 如果已激活,则允许 ORC 在 MSVC 上编译 (#14208)
- ARROW-17823 - [C++] 为 CUDA 恢复 std::make_shared 更改 (#14233)
- ARROW-17823 - [C++] 优先使用 std::make_shared/std::make_unique 而不是使用 new 的构造函数 (#14216)
- ARROW-17824 - [C++][Gandiva] 为可变长度输出缓冲区实现预分配 (#14230)
- ARROW-17826 - [Python] 在从计算内核创建表达式时允许标量 (#14360)
- ARROW-17834 - [Python] 允许通过 pa.array(..) 构造函数创建 ExtensionArray (#14253)
- ARROW-17840 - [Java] 禁用不稳定的 JaCoCo 覆盖率检查 (#14231)
- ARROW-17844 - [C++] 删除原子 shared_ptr 兼容性函数 (#14239)
- ARROW-17845 - [持续集成][Conan] 在 Conan 持续集成检查中重新启用 Flight (#14240)
- ARROW-17846 - [C++] 在 CSV 子系统中使用
if constexpr
(#14241) - ARROW-17847 - [C++] 在 JSON 解析器中支持不带引号的十进制数 (#14242)
- ARROW-17849 - [R][文档] 为 CentOS 7 用户记录由于 C++17 导致的更改 (#14440)
- ARROW-17854 - [持续集成][开发者] 在 S3 上托管预览文档 (#14247)
- ARROW-17856 - [持续集成][Archery] 添加新的 Archery 命令以删除 crossbow 存储库上的旧分支和标签 (#14248)
- ARROW-17857 - [C++] 修复 Table::CombineChunksToBatch 中的段错误 (#14249)
- ARROW-17860 - [Plasma] 弃用 Plasma
- ARROW-17861 - [C++] 弃用 Plasma (#14305)
- ARROW-17862 - [Plasma][GLib] 弃用 Plasma C GLib 绑定 (#14259)
- ARROW-17863 - [Python] 弃用 Plasma Python 绑定 (#14343)
- ARROW-17864 - [Plasma][Ruby] 弃用 Plasma Ruby 绑定 (#14258)
- ARROW-17865 - [Java] 弃用 Java Plasma JNI 绑定 (#14262)
- ARROW-17868 - [C++][Python] 恢复 ARROW_PYTHON CMake 选项 (#14273)
- ARROW-17872 - [C++][持续集成] 减少 macOS 持续集成依赖项 (#14310)
- ARROW-17875 - [C++] 删除各种 C++17 之前的兼容性措施 (#14263)
- ARROW-17878 - [网站] 将 Ballista 文档排除在删除范围之外
- ARROW-17880 - [Go] 为 CSV 写入器添加对 Decimal128 和 Decimal256 的支持 (#14278)
- ARROW-17882 - [Java][文档] 为 Windows 用户添加生成 JNI DLL 的步骤 (#14379)
- ARROW-17883 - [Java] 实现不可变表 (#14316)
- ARROW-17888 - [文档] 将 cookbook contrib 页面的引用添加到新贡献者指南中 (#14283)
- ARROW-17889 - [持续集成] 删除 Kartothek 集成测试 (#14274)
- ARROW-17891 - [文档][Python] 更新并同步 developers/python 页面的 Win 部分 (#14350)
- ARROW-17903 - [JS] 更新依赖项 (#14285)
- ARROW-17911 - [R] 在
transmute()
中实现across()
(#14290) - ARROW-17924 - [文档][格式] 阐明 C 数据接口中的不可变性假设 (#14304)
- ARROW-17929 - [C#] 改进 NuGet 包。 (#14312)
- ARROW-17934 - [R] 对数据集测试使用临时文件而不是工作目录 (#14315)
- ARROW-17936 - [R] ExecPlanReader 测试崩溃中止
- ARROW-17939 - [文档][Python] 在 PyArrow C++ 测试变更后更新 Python 开发页面 (#14322)
- ARROW-17940 - [Java][Gandiva] 为 JavaBuffer 实现 Reserve 方法 (#14323)
- ARROW-17942 - [网站] 一些链接可以从 http 更改为 https
- ARROW-17944 - [Python] substrait.run_query 接受 bytes/Buffer 并且不发生段错误 (#14331)
- ARROW-17945 - [网站][发布] 为 search.maven.org 使用 https:// (#14329)
- ARROW-17950 - [文档][Python] 添加更多关于 PyArrow C++ API 变更的信息 (#14333)
- ARROW-17952 - [Archery][CI] 修复运行 ubuntu-cuda-cpp 时 archery 的错误 (#14335)
- ARROW-17954 - [R] 更新 10.0 的新闻 (#14337)
- ARROW-17955 - [文档][Java] Table 的教程文档 (#14344)
- ARROW-17962 - [Java] 删除 try-with-resources 中未使用的 schema 创建 (#14346)
- ARROW-17965 - [C++] ExecBatch 支持 ChunkedArray 值 (#14348)
- ARROW-17969 - [CI][C++] 不要在 Ubuntu 18.04 上使用 LLVM 14 或更高版本 (#14356)
- ARROW-17971 - [格式][文档] 添加 ADBC (#14079)
- ARROW-17972 - [CI] 更新 CUDA Docker 任务
- ARROW-17976 - [C++] 在 arrow/compare.cc 中使用泛型 lambda (#14363)
- ARROW-17982 - [C++][Java] 将 ORC 更新到 1.8.0 (#14367)
- ARROW-17988 - [C++] 删除 index_sequence_for 和 aligned_union 向后兼容 (#14372)
- ARROW-17992 - [CI][C++][Conda] 删除不必要的 clangdev/llvmdev 固定版本 (#14376)
- ARROW-17993 - [CI][发布] 对 verify-rc-source-*-conda-* 使用 Node.js 16 LTS (#14377)
- ARROW-17997 - [Ruby] 添加从原始嵌套 Ruby 数组构建 Arrow::Tensor 的支持 (#14381)
- ARROW-18010 - [Go] 为类型转换添加 ARM64 Neon 实现 (#14388)
- ARROW-18017 - [Go] 简化计算模块依赖和发布 (#14391)
- ARROW-18019 - [C++][Gandiva] 提高 Projector 评估性能 (#14394)
- ARROW-18026 - [C++][Gandiva] 为无符号整数添加除法和取模函数 (#14397)
- ARROW-18027 - [开发][Archery][Crossbow] 复用 GitHub 令牌 (#14398)
- ARROW-18028 - [开发][Archery][Crossbow] 始终在 PR 评论中使用 GitHub Action 的运行页面 URL (#14399)
- ARROW-18030 - [C++] 提升 LZ4 版本 (#14405)
- ARROW-18044 - [Java] 将 error-prone 库版本升级到 2.16 (#14423)
- ARROW-18047 - [开发][Archery][Crossbow] Queue.put() 应该使用 Job.queue 设置器 (#14410)
- ARROW-18048 - [开发][Archery][Crossbow] 评论机器人会等待一段时间后再生成报告 (#14412)
- ARROW-18053 - [开发] 修复 merge_arrow_pr.py 无法检测 Co-authored-by: 的错误 (#14416)
- ARROW-18056 - [Ruby] 添加从 {name: Arrow::Tensor} 构建 Arrow::Table 的支持 (#14417)
- ARROW-18057 - [R] 在没有 Datasets 功能的构建上,切片函数测试失败 (#14418)
- ARROW-18058 - [开发][Archery] 删除已移除的 ARROW_JNI 相关代码 (#14419)
- ARROW-18061 - [CI][R] 减少每次提交的任务数量 (#14420)
- ARROW-18069 - [文档] 建议最初将 force 与 lease 一起使用 (#14430)
- ARROW-18072 - [C++] 无法在 CMake 3.10 中使用捆绑的 ORC (#14432)
- ARROW-18074 - [CI] 不再需要为 PyArrow C++ 运行 ctest (#14435)
- ARROW-18083 - [C++] 提升内置 zlib 版本 (#14446)
- PARQUET-2172 - [C++] 将字段返回类型更改为 const NodePtr& (#13865)
错误修复
- ARROW-12175 - [C++] 修复 CMake 包 (#13892)
- ARROW-13763 - [Python] 在 ParquetFile & ParquetDatasetPiece 中关闭文件 (#13821)
- ARROW-14363 - [C++][Gandiva] LLVM 13 已弃用没有显式元素类型的 CreateGEP 和 CreateLoad 方法
- ARROW-15602 - [R][文档] 更新文档以说明如何读取带有时区列的时间戳 (#13877)
- ARROW-15733 - array.String 偏移量 int32 溢出
- ARROW-16141 - [R] 为上游更改更新 rhub/fedora-clang-devel (#12824)
- ARROW-16174 - [Python] 修复切片输入上的 FixedSizeListArray.flatten() (#14000)
- ARROW-16521 - [C++][Python] 为 S3 配置 curl 超时策略 (#13385)
- ARROW-16651 - [Python] 将表格转换为新 schema 时忽略字段的可空性 (#14048)
- ARROW-16652 - [Python] 使用表格调用 Cast 计算内核时发生段错误 (#14044)
- ARROW-16674 - [Java] C 数据接口:从导入的缓冲区读取为 nioBuffer 会导致错误 (#13249)
- ARROW-16754 - [Java] 添加重复字段后,StructVector 的子向量意外地重新排序 (#13321)
- ARROW-16838 - [Python] 改进具有扩展数据类型的 pandas 索引的 schema 推断 (#14080)
- ARROW-16897 - [R][C++] Arrow 对象上的完全连接不正确
- ARROW-16942 - 在 MacOS 上构建 JNI 库时出错:找不到“xsimd”提供的包配置文件
- ARROW-16993 - [C++] 如果不需要,则不查找 Boost 组件 (#13846)
- ARROW-17057 - [Python] S3FileSystem 没有重试策略参数 (#13633)
- ARROW-17069 - [文档][Python] 描述 GCS 公共和私有身份验证 (#14392)
- ARROW-17084 - [R] 在 linting 之前安装软件包 (#13620)
- ARROW-17099 - [Python] pyarrow 构建不支持 RELWITHDEBINFO 构建类型 (#14324)
- ARROW-17104 - [CI][Python] 在 CI 作业 AMD64 MacOS 10.15 Python 3 上无法导入 Pyarrow
- ARROW-17166 - [R][CI] force_tests() 无法返回 TRUE (#13680)
- ARROW-17169 - [Go][Parquet] 可空结构体列表的位图写入器出现 Panic (#14183)
- ARROW-17193 - [C++] 添加对查找系统 Abseil 的支持 (#13731)
- ARROW-17199 - [Java][FlightRPC] 清理 Flight SQL 示例服务器 (#13710)
- ARROW-17217 - [文档][Python] 将 pandas 添加为必需依赖项 (#13714)
- ARROW-17223 - [C#] DecimalArray 错误地追加大于 Decimal.MaxValue / 2 且小于 Decimal.MinValue / 2 的值 (#13732)
- ARROW-17228 - [Python] 当传递带有投影列的扫描器时,dataset.write_data 应使用 Scanner.projected_schema (#13756)
- ARROW-17230 - [C++] 修复 DeserializePlan,添加其他选项验证 (#13728)
- ARROW-17233 - [打包][Linux] 更新工件模式 (#13740)
- ARROW-17248 - [CI][Conan] 启用 Zstandard (#13742)
- ARROW-17249 - [CI][Conan] 启用 bzip2 (#13743)
- ARROW-17250 - [CI][Conan] 自动启用 utf8proc (#13744)
- ARROW-17251 - [CI][Conan] 启用 Flight (#13761)
- ARROW-17253 - [Python] 检测迭代器异常而不是崩溃 (#13764)
- ARROW-17254 - [C++][Go][Java][FlightRPC] 实现并测试 Flight SQL GetSchema (#13898)
- ARROW-17256 - [Python] 无法在空 ChunkedArray 上调用 combine_chunks (#13757)
- ARROW-17272 - [开发] 在集成测试中传递 --add-opens (#13765)
- ARROW-17281 - [C++] 修复 Windows 上的缓存大小报告 (#13813)
- ARROW-17296 - [Python] 更新 pyarrow.parquet.read_metadata doctest 中的序列化元数据大小 (#13790)
- ARROW-17315 - [发布][文档] 在版本升级后更新 versions.json (#13805)
- ARROW-17338 - [Java] BaseVariableWidthVector 的最大请求内存应限制为 Integer.MAX_VALUE (#13815)
- ARROW-17341 - [C++] 修复 musl libc 上的 cpu_info.cc 构建错误 (#13819)
- ARROW-17350 - [C++] 为异步工作创建一个调度程序 (#13912)
- ARROW-17353 - [发布][R] 验证二进制文件版本 (#14396)
- ARROW-17372 - [Go][Parquet] 修复 ppc64le 的故障 (#13840)
- ARROW-17382 - [C++] 当标题带有引号时,open_dataset 不会忽略 csv 文件中的 BOM (#13838)
- ARROW-17386 - [R] strptime 测试在不同平台上不稳定 (#13854)
- ARROW-17389 - [Python] 当 PYARROW_INSTALL_TESTS=0 时正确排除测试 (#13904)
- ARROW-17410 - [JS][集成] 为集成降级 zlib (#13885)
- ARROW-17421 - [C++] Windows 上的 CUDA 构建失败 (#13883)
- ARROW-17422 - [C++][CI] Linux 构建缺少依赖项 (#13886)
- ARROW-17423 - [CI][C++] 修复构建 CUDA docker 镜像 (#13896)
- ARROW-17426 - [C++] Substrait consumer 在较旧的 Ubuntu 上编译失败 (#13888)
- ARROW-17433 - [CI][C++] 在 AppVeyor 上使用 Visual Studio 2019 (#13903)
- ARROW-17438 - [R] 如果存在 UDF,glimpse() 会出错
- ARROW-17440 - [C++] 支持 RISC-V 架构 (#13902)
- ARROW-17448 - [R] 修复某些文档中的云存储路径 (#14070)
- ARROW-17450 - [C++][Parquet] 除了 bool 数组之外,还添加对 uint8 布尔值解码的支持 (#14359)
- ARROW-17450 - [C++][Parquet] 支持布尔数据类型的 RLE 解码 (#14147)
- ARROW-17453 - [Go][C++][Parquet] 重复级别的数据不一致 (#13982)
- ARROW-17467 - [Go] 对齐位图操作在没有 t... 时会弄乱最后一个字节 (#13915)
- ARROW-17478 - [C++][Java] 将 ORC 更新到 1.7.6 (#13926)
- ARROW-17494 - [C++] 修复静态构建上的 substrait 测试链接 (#13939)
- ARROW-17496 - [Go] 修复夜间构建 (#13943)
- ARROW-17501 - [Python][wheel] 使用旧的 AWS SDK C++ (#14157)
- ARROW-17507 - [开发][持续集成][R] GHA “自动调优” 不工作 (#14060)
- ARROW-17517 - [C++] 在公共 API 测试中测试引擎 API (#13965)
- ARROW-17517 - [C++] 从 Substrait API 中移除内部头文件 (#14131)
- ARROW-17518 - [持续集成][文档][Python] 更新 glob 以从 git 检测 Arrow 开发版本 (#13966)
- ARROW-17524 - [C++] 读取 ORC 表时包含的字段的修正 (#13962)
- ARROW-17543 - [R] 修复数组创建中 NULL 类型 0 长度向量错误
- ARROW-17550 - [C++][持续集成][MinGW] 为 GCS 测试平台使用系统 Python (#14272)
- ARROW-17556 - [C++] 未绑定的扫描投影表达式导致加载所有字段 (#14264)
- ARROW-17559 - [R][C++] 回归:移除 schema 绑定后性能大幅下降
- ARROW-17565 - [C++] 未提供向后兼容的 ${PACKAGE}_shared CMake 目标 (#14003)
- ARROW-17567 - [C++] 避免 gcc 7 和 c++17 的内部编译器错误 (#14004)
- ARROW-17571 - [基准测试] PyArrow 的默认构建似乎是调试模式 (#14010)
- ARROW-17573 - [Go][Parquet] ByteArray 统计信息可能导致内存泄漏 (#14013)
- ARROW-17577 - [C++][Python] 构建 PyArrow 时 CMake 找不到 Arrow/Arrow Python
- ARROW-17578 - [持续集成][R] 修复 Ubuntu 22.04 和 GCC 12 上 R 的构建 (#14022)
- ARROW-17579 - [Python] PYARROW_CXXFLAGS 被忽略? (#14074)
- ARROW-17583 - [C++][Python] 将 WrittenFile.size 的数据宽度更改为 int64 以匹配 C++ 代码 (#14032)
- ARROW-17598 - [C++] 如果 SIMD 级别为 NEON,则跳过 memory_benchmark (#14036)
- ARROW-17611 - [Rust] 使用 arrow-rs 的 V2 保存的布尔列数据无法被 pyarrow 读取
- ARROW-17612 - [基准测试] macos-arm 上的基准测试失败
- ARROW-17614 - [持续集成][Python] 测试 test_write_dataset_max_rows_per_file 导致多个夜间构建失败 (#14199)
- ARROW-17616 - [持续集成][Java] 解决正则表达式以支持最新的 Arrow Java 版本 >= 10.0.0 (#14076)
- ARROW-17620 - [R] as_arrow_array() 忽略 StructArrays 的类型 (#14047)
- ARROW-17627 - [Go][Parquet] 将 schema 元数据转发到没有 StoreSchema 的文件 (#14087)
- ARROW-17639 - [R] 当第一个元素为 NULL 时,infer_type() 对于列表失败 (#14062)
- ARROW-17641 - [python] 修复 ParseOptions 反序列化 invalid_row_handler 的问题 (#14061)
- ARROW-17643 - [R] 最新 duckdb 版本导致测试失败 (#14149)
- ARROW-17645 - [持续集成] 再次构建 conda-integration (#14069)
- ARROW-17675 - [C++] 修改了 FileSource::Equals 方法以处理 buffer_ 为空的情况 (#14085)
- ARROW-17681 - [持续集成][打包] 使用 glib 更新 brew 依赖项 glib-utils (#14095)
- ARROW-17682 - [持续集成][C++] 夜间 test-ubuntu-20.04-cpp-thread-sanitizer 在 AsyncTaskScheduler 周围的 arrow-utility-test 中失败
- ARROW-17684 - [持续集成][deb] 禁用 arm64 的 Flight (#14300)
- ARROW-17686 - [C++] 为 AsofJoinBasicTest 添加自定义 ToPrint (#14172)
- ARROW-17687 - ScanningStress 测试在持续集成中不稳定 (#14314)
- ARROW-17696 - [C++] arrow-compute-asof-join-node-test 非常慢 (#14190)
- ARROW-17697 - [Python] 修复 types.pxi 中的 Cython 警告 (#14280)
- ARROW-17699 - [R] 为传递给 open_dataset() 的非 schema 对象添加更好的错误消息 (#14108)
- ARROW-17702 - [R][持续集成] CentOS 7 上的测试失败
- ARROW-17703 - [C++][Gandiva] 修复 Gandiva OpenSSL 依赖项 (#14109)
- ARROW-17717 - [R] 持续集成上的 Lintr 错误 (#14113)
- ARROW-17725 - [持续集成][Python] 修复在没有 parquet 的情况下构建 Arrow 时的测试集合问题 (#14119)
- ARROW-17728 - [C++][Gandiva] 接受 LLVM 15.0 (#14125)
- ARROW-17733 - [C++] 在填充索引缓冲区中的空值时考虑 index_width (#14129)
- ARROW-17737 - [R] 转换为表格之前的分组在 `collect()` 之后不得恢复 (#14175)
- ARROW-17738 - [R] dplyr::compute 应该将分组的 arrow_dplyr_query 转换为 arrow 表格 (#14160)
- ARROW-17742 - [C++][Gandiva] 修复 CMake 预设中的 Gandiva utf8proc 依赖项 (#14140)
- ARROW-17753 - [Python][文档] 清理文档以修复构建环境问题 (#14260)
- ARROW-17770 - [C++][Gandiva] 修复 Gandiva 投影仪 Evaluate 的常量正确性 (#14165)
- ARROW-17771 - [文档][Python] 将 CONDA_DLL_SEARCH_MODIFICATION_ENABLE 的使用添加到文档中 (#14302)
- ARROW-17773 - [持续集成][C++] 修复 Travis-CI Arm64 构建上的 sccache 错误 (#14201)
- ARROW-17785 - [Java] 在 JDBC 驱动程序测试中抑制 gRPC 的不稳定性 (#14210)
- ARROW-17787 - [Java] 修复 Javadoc 构建 (#14212)
- ARROW-17790 - [C++][Gandiva] 适应 LLVM 不透明指针 (#14187)
- ARROW-17791 - [Python][持续集成] 由于对 S3 存储桶的 ACCESS_DENIED,某些夜间作业失败
- ARROW-17795 - [C++][R] 添加缺少的 PKG_CONFIG_PATH 以使用系统 zstd (#14202)
- ARROW-17800 - [C++] 修复 jemalloc 统计信息测试中的故障 (#14194)
- ARROW-17805 - [C++][持续集成] 将 Brew 安装的 clang 用于 MacOS
- ARROW-17813 - [Python] 嵌套 ExtensionArray 与 pandas/numpy 之间的转换 (#14238)
- ARROW-17818 - [R] 跳过失败的 duckdb 测试,直到问题解决 (#14209)
- ARROW-17822 - [C++][FlightRPC] 修复无效传输方案导致的崩溃 (#14267)
- ARROW-17829 - [Python] 避免 pandas groupby 在 write_to_dataset 中的弃用警告 (#14306)
- ARROW-17830 - [C++][Gandiva] 临时固定 AppVeyor 上的 LLVM 版本 (#14228)
- ARROW-17831 - [Python][文档] 在移动 pyarrow C++ 代码后,PyArrow 架构页面已过时 (#14311)
- ARROW-17842 - [C++][持续集成] 将 Brew 安装的 clang 用于 MacOS verify-rc (#14236)
- ARROW-17848 - [R] 跳过 lubridate::format_ISO8601 测试,直到下个版本发布 (#14282)
- ARROW-17850 - [Java] 升级 netty + grpc + protobuf + jackson BOM 版本 (#14265)
- ARROW-17853 - [Python][持续集成] test_dataset.py::test_write_dataset_s3_put_only 超时 (#14257)
- ARROW-17853 - 临时回滚 test_write_dataset_max_rows_per_file 的修复 (#14246)
- ARROW-17885 - [R] 将 BLOB 数据作为原始列表返回,而不是整数列表 (#14277)
- ARROW-17915 - [C++] 使用 Substrait ProjectRel 时出错 (#14295)
- ARROW-17927 - [C++] 更改 SleepABitAsync 以使用线程池来减少运行线程数 (#14339)
- ARROW-17930 - [持续集成][C++] PrintValue<arrow::dataset::ScannerTestParams> 中的 Valgrind 失败 (#14317)
- ARROW-17931 - [C++][持续集成] 持续集成上关于数据集“新扫描器”的线程清理器失败
- ARROW-17938 - [Python] 修复 python_test.cc 中的编译错误 (#14321)
- ARROW-17973 - [C++] nullary 函数调用的 Expression::ToString 错误 (#14370)
- ARROW-17977 - [持续集成][C++] 不要在 Debian i386 上使用 LLVM 14 或更高版本 (#14368)
- ARROW-17990 - [C++] 恢复 -mbmi2 标志 (#14375)
- ARROW-17995 - [C++] 修复 json 十进制数未根据显式 schema 重新缩放的问题 (#14380)
- ARROW-17999 - [C++] 使 Minio 服务器启动更稳定 (#14383)
- ARROW-18004 - [C++] ExecBatch 转换为 RecordBatch 可能会越界 (#14386)
- ARROW-18018 - [C++] 由于使用 AllComplete 而不是 AllFinished,单元测试中可能出现段错误 (#14393)
- ARROW-18031 - [C++][Parquet] bool RLE 解码器中的未定义行为 (#14407)
- ARROW-18041 - [Python] wheel 测试中与 Substrait 相关的测试失败 (#14408)
- ARROW-18055 - [C++] arrow-dataset-dataset-writer-test 仍然偶尔超时 (#14428)
- ARROW-18062 - [R] 安装 R 包时,R 3.5 和 3.6 的持续集成作业出错 (#14424)
- ARROW-18079 - [R] 提高 schema 创建效率以防止性能回退 (#14447)
- ARROW-18088 - [Python][持续集成] 使用 pandas master/nightly 构建失败,与 timedelta64 解析度相关
- ARROW-18103 - [打包][deb][RPM] 修复上传工件模式 (#14462)