Apache Arrow 10.0.0 (2022 年 10 月 26 日)
这是一个主要版本,涵盖了超过 2 个月的开发工作。
下载
贡献者
此版本包含来自 100 位独立贡献者的 536 次提交。
$ git shortlog -sn apache-arrow-9.0.0..apache-arrow-10.0.0
68 Sutou Kouhei
52 Matt Topol
32 David Li
31 Antoine Pitrou
19 Alenka Frim
19 Jacob Wujciak-Jens
19 Weston Pace
18 Miles Granger
18 Nic Crane
17 Jin Shang
17 Raúl Cumplido
14 Neal Richardson
14 eitsupi
12 Will Jones
12 david dali susanibar arce
11 Dewey Dunnington
10 Vibhatha Lakmal Abeykoon
7 Igor Suhorukov
7 Larry White
7 Rok Mihevc
6 rtpsw
5 Kshiteej K
5 octalene
4 Krisztián Szűcs
4 Yibo Cai
3 Ben Harkins
3 Bryce Mecum
3 Dominik Moritz
3 George Godik
3 Joris Van den Bossche
3 LouisClt
3 Percy Camilo Triveño Aucahuasi
3 Philipp Moritz
3 Todd Farmer
3 Wes McKinney
2 0x26res
2 Anja Kefala
2 Dragoș Moldovan-Grünfeld
2 François Michonneau
2 Gang Wu
2 Hongze Zhang
2 Joost Hoozemans
2 Kae S
2 Nishanth Thimmegowda
2 Pavel Solodovnikov
2 SHIMA Tatsuya
2 Sam Albers
2 Ziheng Wang
1 Aleksei Smirnov
1 Andrea Giudiceandrea
1 Ankit Gehlot
1 Artavazd Balaian
1 Benson Muite
1 Christopher Dunderdale
1 Corey Kosak
1 Dhruv Vats
1 Duncan MacQuarrie
1 Egill Fridgeirsson
1 Eng Zer Jun
1 Felix Yan
1 Gajo Petrovic
1 Gil Forsyth
1 Ivan Chau
1 Jacky Lee
1 James Bourbeau
1 James Duong
1 Jayjeet Chakraborty
1 Jeroen van Straten
1 Jie Zhang
1 Jin Chengcheng
1 Kai Fricke
1 Kevin Gurney
1 Kun Liu
1 Leo Gertsenshteyn
1 Liang-Chi Hsieh
1 Michael Chirico
1 Michał Pogoda
1 Mitch
1 Muthunagappan Muthuraman
1 Otegami
1 Quang Hoang
1 Quanlong Huang
1 Raphael Taylor-Davies
1 Rasmus Johansen
1 Sanjiban Sengupta
1 Theodore Tsirpanis
1 Wilhelm Ågren
1 William Hyun
1 Xianyang Liu
1 ZMZ91
1 andreoss
1 dependabot[bot]
1 emkornfield
1 fatemehp
1 lafiona
1 mgiessing
1 michalursa
1 mopcup
1 patrick
1 serge-sans-paille
补丁提交者
以下 Apache 提交者将贡献的补丁合并到了代码库中。
$ git shortlog -sn --group=trailer:signed-off-by apache-arrow-9.0.0..apache-arrow-10.0.0
126 Sutou Kouhei
97 Antoine Pitrou
68 David Li
59 Matt Topol
41 Neal Richardson
26 Joris Van den Bossche
25 Weston Pace
21 Nic Crane
13 Dewey Dunnington
11 Yibo Cai
10 Alenka Frim
9 Krisztián Szűcs
4 Jonathan Keane
4 Rok
2 Eric Erhardt
2 Philipp Moritz
2 Wes McKinney
1 Alessandro Molina
1 Andrew Lamb
1 Benjamin Kietzman
1 Dominik Moritz
1 Ian Cook
1 Rok Mihevc
更新日志
Apache Arrow 10.0.0 (2022-10-26)
新特性和改进
- ARROW-3678 - [Go] 实现联合数组 (#13768)
- ARROW-6772 - [C++] 为具有 Equals() 方法的接口添加 operator== (#14038)
- ARROW-6858 - [C++] 简化传递构建选项依赖 (#14224)
- ARROW-7744 - [Java][FlightRPC] Arrow Flight SQL 的 JDBC 驱动 (#13800)
- ARROW-8201 - [Python] 添加 FileFragment.open() 方法 (#14301)
- ARROW-8226 - [Go] 添加 64 位偏移量二进制构建器和字符串构建器 (#13719)
- ARROW-10600 - [Go] 实现 Decimal256 (#13792)
- ARROW-11699 - [R] 为 mutate() 实现 dplyr::across()
- ARROW-11841 - [R][C++] 允许取消长时间运行的命令 (#13635)
- ARROW-12105 - [R] 将 vars_select, vars_rename 替换为 eval_select, eval_rename (#14371)
- ARROW-12590 - [C++][R] 更新 Homebrew 文件的副本以反映最新更新 (#13769)
- ARROW-12693 - [R] 为 ArrowTabular, datasets 添加 unique() 方法 (#13641)
- ARROW-12778 - [R] 在 dplyr 动词中支持 tidyselect where() 选择辅助函数
- ARROW-12958 - [CI][开发者] 为 PR 分支构建并托管文档 (#13913)
- ARROW-13055 - [文档] 创建规范扩展类型文档 (#14167)
- ARROW-13454 - [C++][文档] 表与记录批次 (#14008)
- ARROW-13766 - [R] 添加 slice_*() 方法 (#14361)
- ARROW-14280 - [文档] R 包架构概览 (#14294)
- ARROW-14495 - [Python] 修复 DictionaryArray.from_buffers,不应崩溃 (#13989)
- ARROW-14500 - [C++] 支持从存储类型转换为扩展类型
- ARROW-14958 - [C++][Python][FlightRPC] 实现用于 OpenTelemetry 传播的 Flight 中间件 (#11920)
- ARROW-15011 - [R] 为 dplyr 函数绑定生成文档 (#14014)
- ARROW-15260 - [R] open_dataset - 添加 file_name 作为列 (#12826)
- ARROW-15277 - [C++][Python] 对 chunked_array 使用 ChunkedArray::Make (#13950)
- ARROW-15479 - [C++] 将固定大小列表转换为兼容的固定大小列表类型(其他值类型,其他字段名)(#14181)
- ARROW-15481 - [R][CI] 添加一个模拟 CRAN 旧版 macOS 的 crossbow 任务 (#13925)
- ARROW-15540 - [C++] 允许 substrait 消费者接受包含提示和可空字面量的计划 (#14402)
- ARROW-15545 - [Python][C++] 支持转换为扩展类型 (#14106)
- ARROW-15582 - [C++] 添加支持注册标准 Substrait 函数 (#13613)
- ARROW-15584 - [C++] 添加支持 Substrait 的 RelCommon::Emit (#13914)
- ARROW-15678 - [C++] 添加支持 -DCMAKE_BUILD_TYPE=MinSizeRel (#14342)
- ARROW-15693 - [开发] 更新 crossbow 模板以使用 master 或 main (#13975)
- ARROW-15745 - [Java] 弃用冗余的 ScanTask iterable (#14168)
- ARROW-15838 - [R] 在全外连接中合并连接键 (#14286)
- ARROW-15839 - [C++][Python] 在 ListArray.from_arrays 中接受有效性位图 (#13894)
- ARROW-15927 - [C++][Skyhook] 添加 skyhook 示例 (#12620)
- ARROW-16000 - [C++][Python] Dataset: 添加转码函数选项到 CSV 扫描器的替代实现 (#13820)
- ARROW-16190 - [CI][R] 为 R 在 Apple M1 上实现 CI (#14099)
- ARROW-16226 - [C++] 增加文件系统 tell 的覆盖率 (#14064)
- ARROW-16340 - [C++][Python] 将所有 Python 相关代码移至 PyArrow 中 (#13311)
- ARROW-16356 - [Python] 暴露 RandomAccessFile::GetStream (#13793)
- ARROW-16384 - [文档] 将 Flight SQL 添加到状态页 (#14053)
- ARROW-16424 - [C++] 使用 Uri 解析 substrait ReadRel 文件路径 (#14071)
- ARROW-16431 - [C++][Python] 改进 AppendRowGroups 在模式不同时的错误提示 (#14029)
- ARROW-16584 - [Java] 支持 S3 的 Java JNI (#13157)
- ARROW-16605 - [CI][R] 修复 revdep docker 任务 (#13483)
- ARROW-16690 - [R][FlightRPC] 在 do_put 方法中添加额外的 max_chunksize 参数 (#13267)
- ARROW-16695 - [R][Python][C++] 连接中不支持扩展类型 (#13501)
- ARROW-16719 - [Python] 在 parquet.read_metadata 中添加路径/URI + 文件系统处理 (#13629)
- ARROW-16740 - [C++] 移除 IR Consumer (#13301)
- ARROW-16855 - [C++] 添加 Read Relation ToProto (#13401)
- ARROW-16870 - [C++] 修复 flight 示例中使用 ldd 和 clang 的链接问题 (#14077)
- ARROW-16879 - [R][CI] 使用 testbench 测试 R GCS 绑定 (#13542)
- ARROW-16894 - [C++] 为 Asof Join Node 添加基准测试 (#13426)
- ARROW-16949 - [文档] 为新贡献者指南添加词汇表 (#13951)
- ARROW-16981 - [C++] 暴露 jemalloc 统计信息用于日志记录 (#13516)
- ARROW-16988 - [C++] 引入 Substrait ToProto/FromProto 转换选项 (#13537)
- ARROW-17004 - [Java] 添加用于将 Arrow 数据绑定到 JDBC 参数的工具类 (#13589)
- ARROW-17016 - [C++][Python] 将 Arrow Python C++ 测试移至 Cython (#14117)
- ARROW-17017 - [C++][Python] 启用 Arrow Python 自动重新构建
- ARROW-17021 - [C++][R][CI] 在 crossbow 中启用 sccache 的使用 (#13556)
- ARROW-17052 - [C++][Python][FlightRPC] 暴露 flight 结构序列化 (#13986)
- ARROW-17079 - 显示未知 S3 错误的 HTTP 状态码 (#14019)
- ARROW-17079 - [C++] 对 S3 错误抛出适当的错误消息而不是错误代码 (#14001)
- ARROW-17079 - [C++] 改进 AWS S3 调用的错误消息 (#13979)
- ARROW-17081 - [Java][Datasets] 将 JNI 构建配置从 cpp/ 移至 java/ (#13911)
- ARROW-17088 - [R] 将数据集的 IPC 文件扩展名使用
.arrow
(#13690) - ARROW-17089 - [Python] 将 IPC 文件数据集扩展名使用
.arrow
(#13677) - ARROW-17092 - [文档] 在 IPC 文件格式文档中添加关于 “Feather” 的说明 (#13693)
- ARROW-17106 - [Python] 将初始化代码移至 core 并仅暴露 API (#13802)
- ARROW-17113 - [Java] 在静态初始化块中大声失败 (#13678)
- ARROW-17122 - [Python] 将 Python 相关代码移至 pyarrow 后进行清理
- ARROW-17131 - [Python] 添加 StructType().field():按名称或索引返回字段 (#13652)
- ARROW-17154 - [C++] 将 cmake 项目名从 arrow_python 改为 pyarrow_cpp
- ARROW-17160 - [C++] 为 PyArrow CPP 头文件创建基础目录 (#14275)
- ARROW-17172 - [C++][Python] test_cython_api 在 Windows 上失败 (#14133)
- ARROW-17175 - [CI][macOS] macos-10.15 已弃用,macos-latest 是 macos-11 (#13684)
- ARROW-17178 - [R] 在带有用户定义函数的 arrow_dplyr_query 中支持 head() (#13706)
- ARROW-17181 - [文档][Python] Scalar UDF 实验性文档 (#13687)
- ARROW-17205 - [开发][发布] 创建维护分支时,合并脚本应提示输入下一个版本 (#13708)
- ARROW-17214 - [C++] 为基于列表的类型添加标量到字符串类型的转换 (#13737)
- ARROW-17219 - [Go][IPC] 非原生字节序的字节序转换 (#13716)
- ARROW-17222 - [文档][Archery][集成] 记录 archery 当前涵盖的集成测试用例 (#13717)
- ARROW-17240 - [CI][发布] 在夜间 CI 中验证 wheel 包 (#14319)
- ARROW-17243 - [网站] 将 ClickHouse 添加到 “技术支持”
- ARROW-17247 - [C++][文档] 在 Acero 文档中包含 ExecPlan API 的可见性 (#13741)
- ARROW-17252 - [R] 间歇性 valgrind 故障 (#13773)
- ARROW-17266 - [文档] Java 夜间构建文件前缀已更改 (#13755)
- ARROW-17269 - [Java] 在 MapVector 中实现了 TransferPair 方法,以将正确的 valuevector 获取为 mapvector 而非 listvector (#13776)
- ARROW-17270 - [文档] 将夜间包说明移至开发文档 (#13766)
- ARROW-17273 - [Go][CSV] 为 csv.Writer 添加 Timestamp, Date32, Date64 格式支持 (#13772)
- ARROW-17274 - [GO] 移除 parquet.file.RowGroupReader.Column(index int) 中的 panic (#13767)
- ARROW-17275 - [Go][集成] 处理 IPC 读写中的大偏移量类型 (#13770)
- ARROW-17276 - [Go][集成] 实现联合类型的 IPC 处理 (#13806)
- ARROW-17277 - [Go][CSV] 用于布尔值的自定义 csv.Writer 格式化程序 (#13774)
- ARROW-17280 - [C++] 将 vendored flatbuffers 移至私有命名空间 (#13775)
- ARROW-17282 - [Python] flake8 更新导致 linter CI 失败 (#13778)
- ARROW-17287 - [C++] 创建不依赖于合并生成器的扫描节点 (#13782)
- ARROW-17289 - [C++] 添加类型类别成员检查 (#13783)
- ARROW-17293 - [Java][CI] 修剪 Java 夜间构建 (#13839)
- ARROW-17297 - [Java][文档] 添加通过 C Data Interface 在 C++ 和 Java 之间交互的文档 (#13788)
- ARROW-17299 - [C++][Python] 暴露 Scanner 的 kDefaultBatchReadahead 和 kDefaultFragmentReadahead 参数 (#13799)
- ARROW-17303 - [Java][Dataset] 通过 NativeDatasetFactory 读取 Arrow IPC 文件 (#13760) (#13811)
- ARROW-17304 - [C++][Compute] 在聚合测试比较失败时打印实际值 (#13814)
- ARROW-17305 - [C++] 避免在 BitmapAnd 基准测试中花费时间在 popcount 上 (#13794)
- ARROW-17306 - [C++] 为
LocalFileSystem
提供优化的GetFileInfoGenerator
特化版本 (#13796) - ARROW-17310 - [C++] 从 Iterator 暴露 RBR:Make()
(#13798) - ARROW-17317 - [发布][文档] 标准化以前的文档版本目录 (#14457)
- ARROW-17318 - [C++][Dataset] 为在 Dataset 中获取片段支持异步流接口 (#13804)
- ARROW-17320 - [Python] 改进 pyarrow.parquet API 暴露 (#14096)
- ARROW-17321 - [JS] 更新依赖项 (#13758)
- ARROW-17322 - [文档] 记录错误和功能请求的问题生命周期 (#13781)
- ARROW-17323 - [Go] 清理并升级依赖项 (#13807)
- ARROW-17324 - [Go][CI] 添加 go1.18 任务和 -asan 标志 (#13867)
- ARROW-17326 - [Go][FlightSQL] 为 Go 添加 FlightSQL 支持 (#13828)
- ARROW-17340 - [Go] 使用
T.TempDir
创建临时测试目录 (#13816) - ARROW-17348 - [C++] 添加支持使用 Visual C++ 2019 或更高版本构建捆绑的 LZ4 (#13817)
- ARROW-17349 - [C++] 允许转换 Map 类型 (#14198)
- ARROW-17355 - [R] 重构 handle_* 工具函数以获得更好的开发体验 (#14030)
- ARROW-17357 - [CI][Conan] 启用 JSON (#13823)
- ARROW-17358 - [CI][C++] 添加针对 Alpine Linux 的任务 (#13825)
- ARROW-17359 - [Go][FlightSQL] 创建带有内存 SQLite 的示例,并用于测试 FlightSQL 服务器 (#13868)
- ARROW-17362 - [R] 在 summarise() 中实现 dplyr::across() (#14042)
- ARROW-17364 - [R] 在 across() 中实现 .names 参数
- ARROW-17366 - [R] 在 across() 的 .fns 参数中支持 purrr 风格的 lambda 函数 (#14327)
- ARROW-17367 - [C++] 修复 LZ4 的 CMake 目标名称 (#13831)
- ARROW-17368 - [C++] 添加支持安装工具 (#13832)
- ARROW-17370 - [C++] 为 SplitString() 添加限制 (#13833)
- ARROW-17371 - [R] 移除 as.factor 到 dictionary_encode 的映射
- ARROW-17377 - [C++][文档] 添加基础 Arrow、文件访问、计算和数据集教程 (#13859)
- ARROW-17385 - [集成] 重新启用 Rust 集成用例 (#13852) (#13858)
- ARROW-17385 - [集成] 恢复 “重新启用 Rust 集成用例” (#13856)
- ARROW-17387 - [R] 在 filter() 中实现 dplyr::across() (#14281)
- ARROW-17390 - [Go] 添加联合标量类型 (#13860)
- ARROW-17394 - [C++][Parquet] 修复 parquet_static 依赖项 (#13863)
- ARROW-17395 - [CI][Conan] 找不到 grpc-proto/cci.20220627 包 (#13864)
- ARROW-17405 - [文档][Java] C Data Interface 库能够使用 mvn 命令编译 (#13881)
- ARROW-17407 - [文档][FlightRPC] Flight/gRPC 最佳实践 (#13873)
- ARROW-17409 - [打包][RPM][GLib] *-glib-libs 应该有 .typelib,*-glib-devel 应该有 .gir (#13876)
- ARROW-17412 - [C++] AsofJoin 多键和类型 (#13880)
- ARROW-17418 - [文档][Java] Dataset 库能够使用 mvn 命令编译 (#13889)
- ARROW-17420 - [C++][FlightRPC] 修复 Flight SQL 集成测试中的模式验证 (#13897)
- ARROW-17427 - [Java] 添加生成 DLL 的 Windows 构建脚本 (#14203)
- ARROW-17430 - [Java] ListBinder 用于将 Arrow List 类型绑定到 DB 列 (#13906)
- ARROW-17431 - [Java] MapBinder 用于将 Arrow Map 类型绑定到 DB 列 (#13941)
- ARROW-17434 - [Java][CI] 为 Java 添加构建 Windows 支持 (#13918)
- ARROW-17435 - [CI][Python][CUDA] 为 CUDA 互操作性测试安装 Numba (#13899)
- ARROW-17436 - [C++] 对 RELEASE 构建使用 -O2 而非 -O3 (#13661)
- ARROW-17439 - [R] 更改 pull 的行为,改为 compute 而非 collect (#14330)
- ARROW-17449 - [Python] 改进 Buffer, MemoryPool, NativeFile 和 Codec 的 repr (#13921)
- ARROW-17451 - [CI][Java] 为 JNI 使用 manylinux2014 镜像 (#13920)
- ARROW-17455 - [Go] 函数和内核执行架构 (#13964)
- ARROW-17456 - [Go] 将 compute 模块标记为独立的子模块 (#13910)
- ARROW-17460 - [R] 如果正在注册的新 UDF 与现有 UDF 相同,则不发出警告 (#14436)
- ARROW-17463 - [R] 避免不必要的投影 (#13954)
- ARROW-17470 - [CI][GLib] 添加更多系统软件包以同步上游 PKGBUILD (#13917)
- ARROW-17475 - [Go] 函数接口和注册表实现 (#13924)
- ARROW-17476 - [发布][打包] 使 datafusion-c 可以重用二进制上传器 (#13923)
- ARROW-17479 - [Go] 添加 ArraySpan 和工具类 (#13929)
- ARROW-17480 - [Java] 为 FieldVector 接口添加 setNull() (#14244)
- ARROW-17482 - [Go] 移除 ValueDescr 类型 (#13930)
- ARROW-17483 - [Python] 在非旧版 ParquetDataset/read_table 中支持 Expression 过滤器 (#14011)
- ARROW-17485 - [R] 允许对
write_feather
(write_ipc_file
) 的 compression 选项使用 TRUE/FALSE (#13935) - ARROW-17488 - [Python] 添加对 RelWithDebInfo 的支持
- ARROW-17489 - [R] 由于测试引用了未发布的 stringr 函数,夜间构建失败 (#13937)
- ARROW-17492 - [C++] Hashing32/64 支持大型可变二进制类型 (#13940)
- ARROW-17499 - [Go] 将 MakeArrayOfNull 转移到 array 包 (#13944)
- ARROW-17500 - [Go] Kernel 和 KernelContext 接口 (#13946)
- ARROW-17510 - [CI][C++][Windows][MSVC] 使用 ccache (#13957)
- ARROW-17511 - [C++] 添加对 xsimd 9.0.0 的支持 (#13958)
- ARROW-17512 - [文档] 更新 crossbow 文档以提高清晰度 (#13993)
- ARROW-17519 - [R] RTools35 任务失败 (#14035)
- ARROW-17521 - [Python] 为 Substrait 消费者添加 NamedTableProvider 的 python 绑定 (#14024)
- ARROW-17523 - [C++] 添加对 substrait 函数 is_null, is_not_null 和 count 的支持 (#13969)
- ARROW-17525 - [Java] 使用 NativeDatasetFactory 读取 ORC 文件 (#13973)
- ARROW-17527 - [Go] 实现 Cast to Boolean 函数 (#13974)
- ARROW-17532 - [Go][Compute] 实现数值类型转换函数 (#13992)
- ARROW-17536 - [打包][RPM][Gandiva] 修复 CentOS Stream 9 上的构建错误 (#13984)
- ARROW-17545 - [C++][CI] 强制使用 C++17 而非 C++11 (#13991)
- ARROW-17546 - [C++] 移除 pre-C++17 兼容性措施
- ARROW-17551 - [Go] 实现时间类型转换函数 (#14006)
- ARROW-17553 - [Go] 使 flight.Server 能够注册额外的 grpc 服务 (#13995)
- ARROW-17554 - [Python][打包] 停止生成 macOS Mavericks wheel 包 (#13996)
- ARROW-17555 - [开发][CI] “ci/scripts/install_osx_sdk.sh” 未使用
- ARROW-17560 - [Java][Gandiva] 将 JNI 构建配置从 cpp/ 移至 java/ (#14159)
- ARROW-17561 - [Java][ORC] 将 JNI 构建配置从 cpp/ 移至 java/ (#14162)
- ARROW-17569 - [C++] 将 xsimd 版本提升到 9.0.1 (#14005)
- ARROW-17575 - [文档][C++] 更新构建文档以遵循新的 CMake 包 (#14097)
- ARROW-17585 - [Java] 更新 GenerateSampleData.java (#14289)
- ARROW-17586 - [Go] 字符串到数值类型转换函数 (#14015)
- ARROW-17587 - [Go] 从扩展类型转换 (#14016)
- ARROW-17588 - [Go] 转换为二进制类类型 (#14027)
- ARROW-17594 - [R][打包] 在 CentOS 7 上使用 devtoolset 8 构建二进制文件 (#14243)
- ARROW-17600 - [Go] 实现嵌套类型的类型转换 (#14056)
- ARROW-17603 - [C++][FlightRPC] 当 REQUIRE_TLSCREDENTIALSOPTIONS 开启时,详细说明故障 (#14034)
- ARROW-17604 - [文档][Java] 更清楚地说明需要 –add-opens (#14066)
- ARROW-17617 - [文档] 移除 Flight 的实验性限定符 (#14055)
- ARROW-17621 - [CI] 审计工作流 (#14155)
- ARROW-17628 - [CI][打包][Java] 发布带有 SNAPSHOT 版本的最新夜间构建 (#14135)
- ARROW-17629 - [Java] 在 JdbcToArrowUtils 中将 DB 列绑定到 Arrow Map 类型 (#14134)
- ARROW-17630 - [Java] 在 JdbcToArrowTypeConverter 中引入列索引作为 JdbcFieldInfo.column
- ARROW-17631 - [Java] 将表/列注释传播到 Arrow Schema 中 (#14081)
- ARROW-17632 - [Python][C++] 添加构建期间 libarrow 位置的详细信息 (#14059)
- ARROW-17638 - [Go] 扩展 C Data API 对联合数组和 RecordReader 接口的支持 (#14057)
- ARROW-17646 - [Go][CI] 将 C Data 切换为使用 cgo.Handle(提升至 Go1.17)(#14067)
- ARROW-17647 - [C++] 在将 protobuf 与 Substrait 一起使用时采用更好的命名空间风格 (#14121)
- ARROW-17649 - [Python] 移除 <= 1.0.0 中剩余的已弃用 API (#14401)
- ARROW-17659 - [Java] 当提供 config.shouldIncludeMetadata 时填充 JDBC 模式名称元数据 (#14196)
- ARROW-17665 - [R] 文档 dplyr 和 compute 功能 (#14387)
- ARROW-17666 - [R] 文档对 dplyr 动词支持的例外情况
- ARROW-17667 - [R] 文档对函数绑定支持的例外情况
- ARROW-17669 - [Go] 为 Record batch, Tables 和 Chunked Arrays 获取 Function kernels (#14214)
- ARROW-17670 - [Go] 为 Primitive 和 FixedSize 类型实现 Filter 函数 (#14088)
- ARROW-17671 - [Go] 为 Binary/String 实现 Filter kernels (#14098)
- ARROW-17673 - [R]
dplyr::arrange
中的desc
应允许dplyr::
前缀 (#14090) - ARROW-17674 - [R] 在 arrange() 中实现 dplyr::across() (#14092)
- ARROW-17677 - [Go] 为 List 和扩展类型实现 Filter 函数 (#14141)
- ARROW-17678 - [Go] 为 Record Batches 和 Tables 实现 Filter kernels (#14156)
- ARROW-17688 - [C++][Java][FlightRPC] Flight SQL 的 Substrait、事务、取消 (#13492)
- ARROW-17689 - [R] 在 group_by() 中实现 dplyr::across() (#14122)
- ARROW-17690 - [R] 在 distinct() 中实现 dplyr::across() (#14154)
- ARROW-17691 - [Go] 为 Primitive 类型实现 Take (#14101)
- ARROW-17693 - [C++] 移除 string_view backport (#14177)
- ARROW-17694 - [C++] 移除 std::optional backport (#14105)
- ARROW-17695 - [C++] 移除 Variant 类 (#14136)
- ARROW-17698 - [R] 在 `across()` 中实现 `where()` 的使用
- ARROW-17701 - [C++][Gandiva] 添加对无类型节点的支持 (#14110)
- ARROW-17704 - [Java][FlightRPC] 更新到 Junit 5 (#14103)
- ARROW-17716 - [文档] 移除 IR 文档页面 (#14112)
- ARROW-17724 - [R] 在 dplyr::across 的 .fns 参数中允许包名称前缀 (#14279)
- ARROW-17730 - [Go] 为 FSB 和 VarBinary 实现 Take kernels (#14127)
- ARROW-17734 - [Go] 为 List 和 Dense Union 实现 Take (#14130)
- ARROW-17736 - [C++] 为 Substrait 生成器添加了一个回退名称解析机制 (#14143)
- ARROW-17741 - [打包] 在 java-jars 包中包含 JDBC 驱动 (#14139)
- ARROW-17749 - [Go] 为 Struct 实现 Filter 和 Take (#14145)
- ARROW-17764 - [CI][C++] “#include
" 缺失 (#14161) - ARROW-17767 - [Java][ORC] 将 JNI 构建配置从 cpp/ 移至 java/ (#14163)
- ARROW-17778 - [Go][CSV] 简单的 CSV Reader Schema 和类型推断 (#14171)
- ARROW-17782 - [C++][R] R 包在 macos 10.13 上无法使用 C++17 std lib 构建 (#14178)
- ARROW-17786 - [Java] 使用 org.apache.arrow.dataset.jni.NativeDatasetFactory 读取 CSV 文件 (#14182)
- ARROW-17788 - [R][文档] 添加使用 Scanner 的示例 (#14184)
- ARROW-17789 - [Java][文档] 更新 Java Dataset 文档以反映最新更改 (#14382)
- ARROW-17792 - [C++] 使用 lambda 捕获移动构造 (#14188)
- ARROW-17794 - [Java] 在 JVM 退出时强制删除 jni lib 文件 (#14189)
- ARROW-17803 - [C++][nodiscard] (#14193)
- ARROW-17804 - [Go][CSV] 添加 Date32 和 Time32 解析器 (#14192)
- ARROW-17810 - [Java] 使用 jacoco-maven-plugin 0.8.8 支持 Java 18 (#14197)
- ARROW-17811 - [Java][文档] 添加了 Java 中 Dictionary Encoding 的高级文档 (#14213)
- ARROW-17814 - [C++] 修复代码风格 (#14218)
- ARROW-17814 - [C++] 移除 make_unique 重新实现 (#14204)
- ARROW-17815 - [Python] 当 SetSignalStopSource 失败时发出警告而不是错误 (#14205)
- ARROW-17817 - [C++] 如果 ORC 被激活,则允许其在 MSVC 上编译 (#14208)
- ARROW-17823 - [C++] 恢复针对 CUDA 的 std::make_shared 更改 (#14233)
- ARROW-17823 - [C++] 优先使用 std::make_shared/std::make_unique 而非带有 new 的构造函数 (#14216)
- ARROW-17824 - [C++][Gandiva] 为可变长度输出缓冲区实现预分配 (#14230)
- ARROW-17826 - [Python] 从 compute 内核创建表达式时允许使用标量 (#14360)
- ARROW-17834 - [Python] 允许通过 pa.array(..) 构造函数创建 ExtensionArray (#14253)
- ARROW-17840 - [Java] 禁用不稳定的 JaCoCo 覆盖率检查 (#14231)
- ARROW-17844 - [C++] 移除 atomic shared_ptr 兼容性函数 (#14239)
- ARROW-17845 - [CI][Conan] 在 Conan CI 检查中重新启用 Flight (#14240)
- ARROW-17846 - [C++] 在 CSV 子系统中使用
if constexpr
(#14241) - ARROW-17847 - [C++] 支持 JSON 解析器中未加引号的 decimal (#14242)
- ARROW-17849 - [R][文档] 为 centos-7 用户文档因 C++17 带来的变化 (#14440)
- ARROW-17854 - [CI][开发者] 在 S3 上托管预览文档 (#14247)
- ARROW-17856 - [CI][Archery] 添加新的 Archery 命令以删除 crossbow 代码库上的旧分支和标签 (#14248)
- ARROW-17857 - [C++] 修复 Table::CombineChunksToBatch 中的段错误 (#14249)
- ARROW-17860 - [Plasma] 弃用 Plasma
- ARROW-17861 - [C++] 弃用 Plasma (#14305)
- ARROW-17862 - [Plasma][GLib] 弃用 Plasma C GLib 绑定 (#14259)
- ARROW-17863 - [Python] 弃用 Plasma Python 绑定 (#14343)
- ARROW-17864 - [Plasma][Ruby] 弃用 Plasma Ruby 绑定 (#14258)
- ARROW-17865 - [Java] 弃用 Java Plasma JNI 绑定 (#14262)
- ARROW-17868 - [C++][Python] 恢复 ARROW_PYTHON CMake 选项 (#14273)
- ARROW-17872 - [C++][CI] 减少 macOS CI 依赖项 (#14310)
- ARROW-17875 - [C++] 移除各种早于 C++17 的兼容性措施 (#14263)
- ARROW-17878 - [Website] 排除 Ballista 文档不被删除
- ARROW-17880 - [Go] 为 CSV 写入器添加对 Decimal128 和 Decimal256 的支持 (#14278)
- ARROW-17882 - [Java][Doc] 为 Windows 用户添加生成 JNI DLL 的构建步骤 (#14379)
- ARROW-17883 - [Java] 实现不可变表 (#14316)
- ARROW-17888 - [Docs] 在新贡献者指南中添加对 Cookbook 贡献页面的引用 (#14283)
- ARROW-17889 - [CI] 移除 Kartothek 集成测试 (#14274)
- ARROW-17891 - [Docs][Python] 更新和同步 developers/python 页面的 Windows 部分 (#14350)
- ARROW-17903 - [JS] 更新依赖项 (#14285)
- ARROW-17911 - [R] 在
transmute()
中实现across()
(#14290) - ARROW-17924 - [Doc][Format] 澄清 C Data Interface 中的不可变性假设 (#14304)
- ARROW-17929 - [C#] 改进 NuGet 包。 (#14312)
- ARROW-17934 - [R] 数据集测试中使用临时文件而非工作目录 (#14315)
- ARROW-17936 - [R] ExecPlanReader 测试因崩溃而中止
- ARROW-17939 - [Docs][Python] PyArrow C++ 测试更改后更新 Python 开发页面 (#14322)
- ARROW-17940 - [Java][Gandiva] 为 JavaBuffer 实现 Reserve (#14323)
- ARROW-17942 - [Website] 部分链接可以从 http 更改为 https
- ARROW-17944 - [Python] substrait.run_query 接受 bytes/Buffer 且不会发生段错误 (#14331)
- ARROW-17945 - [Website][Release] 对 search.maven.org 使用 https:// (#14329)
- ARROW-17950 - [Docs][Python] 添加有关 PyArrow C++ API 变更的更多信息 (#14333)
- ARROW-17952 - [Archery][CI] 修复运行 ubuntu-cuda-cpp 时发生的 archery 错误 (#14335)
- ARROW-17954 - [R] 更新 10.0 的新闻 (#14337)
- ARROW-17955 - [Docs][Java] Table 的教程文档 (#14344)
- ARROW-17962 - [Java] 从 try-with-resources 中移除未使用的 schema 创建 (#14346)
- ARROW-17965 - [C++] ExecBatch 支持 ChunkedArray 值 (#14348)
- ARROW-17969 - [CI][C++] 在 Ubuntu 18.04 上不使用 LLVM 14 或更高版本 (#14356)
- ARROW-17971 - [Format][Docs] 添加 ADBC (#14079)
- ARROW-17972 - [CI] 更新 CUDA docker 作业
- ARROW-17976 - [C++] 在 arrow/compare.cc 中使用泛型 Lambda 表达式 (#14363)
- ARROW-17982 - [C++][Java] 更新 ORC 到 1.8.0 (#14367)
- ARROW-17988 - [C++] 移除 index_sequence_for 和 aligned_union 的回移植 (#14372)
- ARROW-17992 - [CI][C++][Conda] 移除不必要的 clangdev/llvmdev 锁定 (#14376)
- ARROW-17993 - [CI][Release] 对 verify-rc-source-*-conda-* 使用 Node.js 16 LTS (#14377)
- ARROW-17997 - [Ruby] 添加支持从原始嵌套 Ruby 数组构建 Arrow::Tensor (#14381)
- ARROW-18010 - [Go] 为 Casting 添加 ARM64 Neon 实现 (#14388)
- ARROW-18017 - [Go] 简化 Compute 模块依赖和发布 (#14391)
- ARROW-18019 - [C++][Gandiva] 提升 Projector 的评估性能 (#14394)
- ARROW-18026 - [C++][Gandiva] 为无符号整数添加 div 和 mod 函数 (#14397)
- ARROW-18027 - [Dev][Archery][Crossbow] 复用 GitHub Token (#14398)
- ARROW-18028 - [Dev][Archery][Crossbow] 在 PR 评论中始终使用 GitHub Action 的运行页面 URL (#14399)
- ARROW-18030 - [C++] 提升 LZ4 版本 (#14405)
- ARROW-18044 - [Java] 将 error-prone 库版本升级到 2.16 (#14423)
- ARROW-18047 - [Dev][Archery][Crossbow] Queue.put() 应使用 Job.queue setter (#14410)
- ARROW-18048 - [Dev][Archery][Crossbow] 评论机器人等待片刻后生成报告 (#14412)
- ARROW-18053 - [Dev] 修复 merge_arrow_pr.py 无法检测 Co-authored-by: 的错误 (#14416)
- ARROW-18056 - [Ruby] 添加支持从 {name: Arrow::Tensor} 构建 Arrow::Table (#14417)
- ARROW-18057 - [R] 没有 Datasets 功能的构建上,slice 函数测试失败 (#14418)
- ARROW-18058 - [Dev][Archery] 移除已删除的 ARROW_JNI 相关代码 (#14419)
- ARROW-18061 - [CI][R] 减少每次提交的作业数量 (#14420)
- ARROW-18069 - [Docs] 建议最初使用带 lease 的 force (#14430)
- ARROW-18072 - [C++] 无法在 CMake 3.10 中使用绑定的 ORC (#14432)
- ARROW-18074 - [CI] 不再需要为 PyArrow C++ 运行 ctest (#14435)
- ARROW-18083 - [C++] 提升 vendored zlib 版本 (#14446)
- PARQUET-2172 - [C++] 将字段返回类型更改为 const NodePtr& (#13865)
错误修复
- ARROW-12175 - [C++] 修复 CMake 包 (#13892)
- ARROW-13763 - [Python] 关闭 ParquetFile 和 ParquetDatasetPiece 中的文件 (#13821)
- ARROW-14363 - [C++][Gandiva] LLVM 13 已弃用没有显式元素类型的 CreateGEP 和 CreateLoad 方法
- ARROW-15602 - [R][Docs] 更新文档以解释如何读取带时区的时间戳列 (#13877)
- ARROW-15733 - array.String offsets int32 溢出
- ARROW-16141 - [R] 为上游更改更新 rhub/fedora-clang-devel (#12824)
- ARROW-16174 - [Python] 修复 FixedSizeListArray.flatten() 在切片输入上的问题 (#14000)
- ARROW-16521 - [C++][Python] 配置 S3 的 curl 超时策略 (#13385)
- ARROW-16651 - [Python] 将 Table 强制转换为新 schema 时忽略字段的可空性 (#14048)
- ARROW-16652 - [Python] 使用 Table 调用 Cast compute kernel 时发生段错误 (#14044)
- ARROW-16674 - [Java] C data interface: 从导入的 buffer 读取为 nioBuffer 时引发错误 (#13249)
- ARROW-16754 - [Java] 添加重复字段后,StructVector 的子向量发生意外重新排序 (#13321)
- ARROW-16838 - [Python] 改进带有扩展 dtypes 的 pandas 索引的 schema 推断 (#14080)
- ARROW-16897 - [R][C++] Arrow 对象的全连接不正确
- ARROW-16942 - 在 MacOS 上构建 JNI 库时出错:找不到由“xsimd”提供的包配置文件
- ARROW-16993 - [C++] 如果不需要 Boost 组件,则不查找它们 (#13846)
- ARROW-17057 - [Python] S3FileSystem 没有重试策略的参数 (#13633)
- ARROW-17069 - [Docs][Python] 描述 GCS 公共和私有的认证方式 (#14392)
- ARROW-17084 - [R] 在 linting 前安装包 (#13620)
- ARROW-17104 - [CI][Python] 在 CI 作业 AMD64 MacOS 10.15 Python 3 上无法导入 Pyarrow
- ARROW-17099 - [Python] pyarrow 构建不支持 RELWITHDEBINFO 构建类型 (#14324)
- ARROW-17166 - [R][CI] force_tests() 不能返回 TRUE (#13680)
- ARROW-17169 - [Go][Parquet] bitmap 写入器在 Nullable List of Struct 中发生 Panic (#14183)
- ARROW-17193 - [C++] 添加支持以查找系统中的 Abseil (#13731)
- ARROW-17199 - [Java][FlightRPC] 清理 Flight SQL 示例服务器 (#13710)
- ARROW-17217 - [Docs][Python] 添加 pandas 作为必需的依赖项 (#13714)
- ARROW-17223 - [C#] DecimalArray 错误地追加大于 Decimal.MaxValue / 2 和小于 Decimal.MinValue / 2 的值 (#13732)
- ARROW-17228 - [Python] 当传递带有 projected columns 的 scanner 时,dataset.write_data 应使用 Scanner.projected_schema (#13756)
- ARROW-17230 - [C++] 修复 DeserializePlan,添加额外的选项验证 (#13728)
- ARROW-17233 - [Packaging][Linux] 更新 artifact 模式 (#13740)
- ARROW-17248 - [CI][Conan] 启用 Zstandard (#13742)
- ARROW-17249 - [CI][Conan] 启用 bzip2 (#13743)
- ARROW-17250 - [CI][Conan] 自动启用 utf8proc (#13744)
- ARROW-17251 - [CI][Conan] 启用 Flight (#13761)
- ARROW-17253 - [Python] 检测迭代器异常而非崩溃 (#13764)
- ARROW-17254 - [C++][Go][Java][FlightRPC] 实现并测试 Flight SQL GetSchema (#13898)
- ARROW-17256 - [Python] 不能在空的 ChunkedArray 上调用 combine_chunks (#13757)
- ARROW-17272 - [Dev] 在集成测试中传递 –add-opens (#13765)
- ARROW-17281 - [C++] 修复 Windows 上的缓存大小报告问题 (#13813)
- ARROW-17296 - [Python] 在 pyarrow.parquet.read_metadata doctest 中更新序列化元数据大小 (#13790)
- ARROW-17315 - [Release][Docs] 通过 post version bump 更新 versions.json (#13805)
- ARROW-17338 - [Java] BaseVariableWidthVector 的最大请求内存应限制为 Integer.MAX_VALUE (#13815)
- ARROW-17341 - [C++] 修复 musl libc 上 cpu_info.cc 的构建错误 (#13819)
- ARROW-17350 - [C++] 为异步工作创建一个调度器 (#13912)
- ARROW-17353 - [Release][R] 验证二进制版本 (#14396)
- ARROW-17372 - [Go][Parquet] 修复 ppc64le 上的失败 (#13840)
- ARROW-17382 - [C++] 当 header 带有引号时,open_dataset 不会忽略 csv 文件中的 BOM (#13838)
- ARROW-17386 - [R] strptime 测试在跨平台环境中不够健壮 (#13854)
- ARROW-17389 - [Python] 当 PYARROW_INSTALL_TESTS=0 时正确排除测试 (#13904)
- ARROW-17410 - [JS][Integration] 降低集成测试中的 zlib 版本 (#13885)
- ARROW-17421 - [C++] Windows 上的 CUDA 构建失败 (#13883)
- ARROW-17422 - [C++][CI] Linux 构建缺少依赖项 (#13886)
- ARROW-17423 - [CI][C++] 修复构建 CUDA docker 镜像的问题 (#13896)
- ARROW-17426 - [C++] Substrait consumer 在较旧的 Ubuntu 上编译失败 (#13888)
- ARROW-17433 - [CI][C++] 在 AppVeyor 上使用 Visual Studio 2019 (#13903)
- ARROW-17438 - [R] 如果存在 UDF,glimpse() 会出错
- ARROW-17440 - [C++] 支持 RISC-V 架构 (#13902)
- ARROW-17448 - [R] 修复部分文档中的云存储路径 (#14070)
- ARROW-17450 - [C++][Parquet] 除 bool 数组外,添加对 uint8 boolean 解码的支持 (#14359)
- ARROW-17450 - [C++][Parquet] 支持 boolean 数据类型的 RLE 解码 (#14147)
- ARROW-17453 - [Go][C++][Parquet] Repetition Levels 导致数据不一致 (#13982)
- ARROW-17467 - [Go] Aligned Bitmap Ops 在没有...时会弄乱最后一个字节 (#13915)
- ARROW-17478 - [C++][Java] 更新 ORC 到 1.7.6 (#13926)
- ARROW-17494 - [C++] 修复静态构建上的 substrait 测试链接问题 (#13939)
- ARROW-17496 - [Go] 修复夜间构建 (#13943)
- ARROW-17501 - [Python][wheel] 使用旧版 AWS SDK C++ (#14157)
- ARROW-17507 - [Dev][CI][R] GHA“autotune”不起作用 (#14060)
- ARROW-17517 - [C++] 在公共 API 测试中测试 engine API (#13965)
- ARROW-17517 - [C++] 从 substrait API 中移除内部头文件 (#14131)
- ARROW-17518 - [CI][Doc][Python] 更新 glob 以从 git 检测 arrow 开发版本 (#13966)
- ARROW-17524 - [C++] 读取 ORC 表时包含的字段修正 (#13962)
- ARROW-17543 - [R] 修复数组创建中 NULL 类型 0 长度向量的错误
- ARROW-17550 - [C++][CI][MinGW] 为 GCS testbench 使用系统 Python (#14272)
- ARROW-17556 - [C++] 未绑定的 scan projection expression 导致加载所有字段 (#14264)
- ARROW-17559 - [R][C++] 回归:移除 schema binding 后性能大幅下降
- ARROW-17565 - [C++] 未提供向后兼容的 ${PACKAGE}_shared CMake target (#14003)
- ARROW-17567 - [C++] 避免使用 gcc 7 和 c++17 时出现内部编译器错误 (#14004)
- ARROW-17571 - [Benchmarks] PyArrow 的默认构建似乎是 debug 版本 (#14010)
- ARROW-17573 - [Go][Parquet] ByteArray 统计信息可能导致内存泄漏 (#14013)
- ARROW-17577 - [C++][Python] 构建 PyArrow 时 CMake 找不到 Arrow/Arrow Python
- ARROW-17578 - [CI][R] 修复 R 在 Ubuntu 22.04 和 GCC 12 上的构建问题 (#14022)
- ARROW-17579 - [Python] PYARROW_CXXFLAGS 被忽略了吗? (#14074)
- ARROW-17583 - [C++][Python] 将 WrittenFile.size 的数据宽度更改为 int64 以匹配 C++ 代码 (#14032)
- ARROW-17598 - [C++] 如果 SIMD 级别为 NEON,则跳过 memory_benchmark (#14036)
- ARROW-17611 - [Rust] arrow-rs 使用 V2 保存的 Boolean 列数据无法被 pyarrow 读取
- ARROW-17612 - [Benchmarks] macos-arm 上的基准测试失败
- ARROW-17614 - [CI][Python] 测试 test_write_dataset_max_rows_per_file 导致多个夜间构建失败 (#14199)
- ARROW-17616 - [CI][Java] 解决 regex 问题以支持最新的 Arrow Java 版本 >= 10.0.0 (#14076)
- ARROW-17620 - [R] as_arrow_array() 忽略 StructArrays 的类型 (#14047)
- ARROW-17627 - [Go][Parquet] 在不使用 StoreSchema 的情况下将 schema 元数据转发到文件 (#14087)
- ARROW-17639 - [R] 当列表的第一个元素为 NULL 时,infer_type() 失败 (#14062)
- ARROW-17641 - [python] 修复 ParseOptions 对 invalid_row_handler 的反序列化问题 (#14061)
- ARROW-17643 - [R] 最新的 duckdb 版本导致测试失败 (#14149)
- ARROW-17645 - [CI] 让 conda-integration 再次构建成功 (#14069)
- ARROW-17675 - [C++] 修改 FileSource::Equals 方法以处理 buffer_ 为 null 的情况 (#14085)
- ARROW-17681 - [CI][Packaging] 将 brew 依赖项 glib-utils 更新为 glib (#14095)
- ARROW-17682 - [CI][C++] 夜间测试 test-ubuntu-20.04-cpp-thread-sanitizer 在 AsyncTaskScheduler 附近导致 arrow-utility-test 失败
- ARROW-17684 - [CI][deb] 为 arm64 禁用 Flight (#14300)
- ARROW-17686 - [C++] 为 AsofJoinBasicTest 添加自定义 ToPrint (#14172)
- ARROW-17687 - ScanningStress 测试在 CI 中不稳定 (#14314)
- ARROW-17696 - [C++] arrow-compute-asof-join-node-test 异常缓慢 (#14190)
- ARROW-17697 - [Python] 修复 types.pxi 中的 Cython 警告 (#14280)
- ARROW-17699 - [R] 为 open_dataset() 传入非 schema 参数时添加更好的错误消息 (#14108)
- ARROW-17702 - [R][CI] CentOS 7 上的测试失败
- ARROW-17703 - [C++][Gandiva] 修复 Gandiva 的 OpenSSL 依赖问题 (#14109)
- ARROW-17717 - [R] CI 上的 Lintr 错误 (#14113)
- ARROW-17725 - [CI][Python] 修复 Arrow 在未构建 parquet 的情况下的测试收集问题 (#14119)
- ARROW-17728 - [C++][Gandiva] 接受 LLVM 15.0 (#14125)
- ARROW-17733 - [C++] 在填充索引 buffer 中的 null 值时考虑 index_width (#14129)
- ARROW-17737 - [R] 转换为 Table 之前的 Groups 在
collect()
后不能被恢复 (#14175) - ARROW-17738 - [R] dplyr::compute 应将 grouped arrow_dplyr_query 转换为 arrow Table (#14160)
- ARROW-17742 - [C++][Gandiva] 修复 CMake presets 中 Gandiva 的 utf8proc 依赖问题 (#14140)
- ARROW-17753 - [Python][Docs] 记录清理构建环境问题的步骤 (#14260)
- ARROW-17770 - [C++][Gandiva] 修复 Gandiva projector Evaluate 的 const 正确性 (#14165)
- ARROW-17771 - [Docs][Python] 将 CONDA_DLL_SEARCH_MODIFICATION_ENABLE 的用法添加到文档中 (#14302)
- ARROW-17773 - [CI][C++] 修复 Travis-CI Arm64 构建上的 sccache 错误 (#14201)
- ARROW-17785 - [Java] 抑制 JDBC 驱动程序测试中 gRPC 导致的不稳定性 (#14210)
- ARROW-17787 - [Java] 修复 Javadoc 构建 (#14212)
- ARROW-17790 - [C++][Gandiva] 适应 LLVM opaque pointer (#14187)
- ARROW-17791 - [Python][CI] 由于 ACCESS_DENIED 到 S3 bucket,部分夜间作业失败
- ARROW-17795 - [C++][R] 添加缺失的 PKG_CONFIG_PATH 以使用系统 zstd (#14202)
- ARROW-17800 - [C++] 修复 jemalloc stats 测试中的失败 (#14194)
- ARROW-17805 - [C++][CI] 对 MacOS 使用通过 Brew 安装的 clang
- ARROW-17813 - [Python] 嵌套 ExtensionArray 与 pandas/numpy 之间的转换 (#14238)
- ARROW-17818 - [R] 跳过正在失败的 duckdb 测试,直到问题解决 (#14209)
- ARROW-17822 - [C++][FlightRPC] 修复无效传输方案导致的崩溃 (#14267)
- ARROW-17829 - [Python] 避免 write_to_dataset 中的 pandas groupby 弃用警告 (#14306)
- ARROW-17830 - [C++][Gandiva] 在 AppVeyor 上临时锁定 LLVM 版本 (#14228)
- ARROW-17831 - [Python][Docs] pyarrow C++ 代码移动后,PyArrow Architecture 页面已过时 (#14311)
- ARROW-17842 - [C++][CI] 对 MacOS verify-rc 使用通过 Brew 安装的 clang (#14236)
- ARROW-17848 - [R] 跳过 lubridate::format_ISO8601 测试,直到下个版本发布 (#14282)
- ARROW-17850 - [Java] 升级 netty + grpc + protobuf + jackson BOM 版本 (#14265)
- ARROW-17853 - [Python][CI] test_dataset.py::test_write_dataset_s3_put_only 中的超时 (#14257)
- ARROW-17853 - 临时撤销对 test_write_dataset_max_rows_per_file 的修复 (#14246)
- ARROW-17885 - [R] 将 BLOB 数据作为 raw 列表返回,而不是整数列表 (#14277)
- ARROW-17915 - [C++] 使用 Substrait ProjectRel 时出错 (#14295)
- ARROW-17927 - [C++] 将 SleepABitAsync 更改为使用线程池以减少正在运行的线程数 (#14339)
- ARROW-17930 - [CI][C++] Valgrind 在 PrintValue<arrow::dataset::ScannerTestParams> 中失败 (#14317)
- ARROW-17931 - [C++] [CI] CI 上 dataset “new scanner” 附近的 Thread Sanitizer 失败
- ARROW-17938 - [Python] 修复 python_test.cc 上的编译错误 (#14321)
- ARROW-17973 - [C++] nullary function call 时 Expression::ToString 错误 (#14370)
- ARROW-17977 - [CI][C++] 在 Debian i386 上不使用 LLVM 14 或更高版本 (#14368)
- ARROW-17990 - [C++] 恢复 -mbmi2 标志 (#14375)
- ARROW-17995 - [C++] 修复 json decimals 未根据显式 schema 进行重新缩放的问题 (#14380)
- ARROW-17999 - [C++] 使 Minio 服务器启动更健壮 (#14383)
- ARROW-18004 - [C++] ExecBatch 转换为 RecordBatch 可能超出范围 (#14386)
- ARROW-18018 - [C++] 由于使用了 AllComplete 而非 AllFinished,单元测试中可能发生段错误 (#14393)
- ARROW-18031 - [C++][Parquet] bool RLE decoder 中的未定义行为 (#14407)
- ARROW-18041 - [Python] wheel 测试中与 Substrait 相关的测试失败 (#14408)
- ARROW-18055 - [C++] arrow-dataset-dataset-writer-test 偶尔仍然超时 (#14428)
- ARROW-18062 - [R] 安装 R 包时,R 3.5 和 3.6 的 CI 作业中出现错误 (#14424)
- ARROW-18079 - [R] 提高 schema 创建效率以防止性能回归 (#14447)
- ARROW-18088 - [Python][CI] 使用 pandas master/nightly 构建时发生与 timedelta64 分辨率相关的失败
- ARROW-18103 - [Packaging][deb][RPM] 修复上传 artifact 模式 (#14462)