Apache Arrow 15.0.1(2024 年 3 月 7 日)
这是一个补丁版本,涵盖了超过 1 个月的开发工作。
下载
贡献者
此版本包含来自 18 位不同贡献者的 37 次提交。
$ git shortlog -sn apache-arrow-15.0.0..apache-arrow-15.0.1
5 Antoine Pitrou
4 Alenka Frim
4 Joris Van den Bossche
4 Raúl Cumplido
3 Rossi(Ruoxi) Sun
2 Dewey Dunnington
2 Rossi Sun
2 emkornfield
2 mwish
1 Curt Hagenlocher
1 David Li
1 Jeremy Aguilon
1 Lubo Slivka
1 Matt Topol
1 Rok Mihevc
1 Sutou Kouhei
1 Tom Jarosz
1 ZhangHuiGui
补丁提交者
以下 Apache 提交者将贡献的补丁合并到仓库中。
$ git shortlog -sn --group=trailer:signed-off-by apache-arrow-15.0.0..apache-arrow-15.0.1
12 Antoine Pitrou
7 Joris Van den Bossche
3 Sutou Kouhei
2 AlenkaF
2 David Li
2 Dewey Dunnington
2 mwish
1 Benjamin Kietzman
1 Curt Hagenlocher
1 Jacob Wujciak-Jens
1 Matt Topol
变更日志
Apache Arrow 15.0.1 (2024-03-07 08:00:00)
错误修复
- GH-38655 - [C++] “iso_calendar” 内核对于数组长度 > 32 时返回错误结果 (#39360)
- GH-39313 - [Python] 修复 _pandas_api#_check_import 中的竞争条件 (#39314)
- GH-39332 - [C++] 在 ExecBatchBuilder 中追加变长数据超过偏移量限制 (int32 最大值) 时显式报错 (#39383)
- GH-39525 - [C++][Parquet] 将内存池传递给解码器 (#39526)
- GH-39527 - [C++][Parquet] 在截断为 int32 之前验证页面大小 (#39528)
- GH-39577 - [C++] 修复
CompareBinaryColumnToRow
中跨缓冲区边界的尾部字访问问题 (#39606) - GH-39582 - [C++][Acero] 使用 ExecutePlan 连接表时随机挂起
- GH-39583 - [C++] 修复 ExecBatchBuilder 在追加具有相同 id 的连续尾部行时可能超出缓冲区边界的问题(对于固定大小类型) (#39585)
- GH-39599 - [Python] 避免泄露 Numpy dtypes 的引用 (#39636)
- GH-39640 - [Docs] 将 pydata-sphinx-theme 版本固定到 0.14.* (#39758)
- GH-39640 - [Docs] 将 pydata-sphinx-theme 版本固定到 0.14.1 (#39658)
- GH-39656 - [Release] 将 macOS wheels 的平台标签更新为 macosx_10_15 (#39657)
- GH-39672 - [Go] 非 UTC 时区时间到 Date32/Date64 转换问题 (#39674)
- GH-39690 - [C++][FlightRPC] 修复 PollInfo 中的 nullptr 解引用问题 (#39711)
- GH-39732 - [Python][CI] 修复使用最新/夜间版 pandas 时的测试失败问题 (#39760)
- GH-39737 - [Release][Docs] 更新发布后文档任务 (#39762)
- GH-39740 - [C++] 修复 month_day_nano 间隔的 filter 和 take 内核问题 (#39795)
- GH-39778 - [C++] 修复 key hash avx2 中跨缓冲区边界的尾部字节访问问题 (#39800)
- GH-39803 - [C++][Acero] 修复 AsOfJoin 输出模式与输入模式顺序不同的问题 (#39804)
- GH-39860 - [C++] Expression ExecuteScalarExpression 执行空参数函数时结果错误 (#39908)
- GH-39865 - [C++] 导入注册扩展时去除扩展元数据 (#39866)
- GH-39897 - [C++] arrow::fs::FileSystemFromUri() 对于 s3 URIs 非线程安全
- GH-39916 - [C#] 恢复对 .NET 4.6.2 的支持 (#40008)
- GH-39933 - [R] 修复最新 reticulate 中指针到 Python 的转换问题 (#39969)
- GH-39942 - [Python] 使 capsule 名称检查更宽松 (#39977)
- GH-39976 - [C++] 修复 BinaryViewBuilder::AppendArraySlice 中非内联数据大小计算问题 (#39994)
- GH-40004 - [Python][FlightRPC] 在 GeneratorStream 中释放 GIL (#40005)
- GH-40068 - [C++] 读取 parquet 文件元数据时可能存在数据竞争
- GH-40112 - [CI][Python] 确保选择 CPython 而非 PyPy (#40131)
- GH-40174 - [C++][CI][Parquet] 修复 parquet column_writer_test 构建问题 (#40175)
- GH-40386 - [Python] Python 构建因 Cython 3.0.9 而损坏
新特性与改进
- GH-39504 - [Docs] 更新主 sphinx 文档的页脚以包含正确归属 (#39505)
- GH-39673 - [C++] PollFlightInfo 未遵循 rule of 5
- GH-39849 - [Python] 移除 pytest-lazy-fixture 的使用 (#39850)
- GH-39876 - [C++] 第三方库: 将 zlib 升级到 1.3.1 (#39877)
- GH-39880 - [Python][CI] 为 dask 集成测试将 moto 版本固定到 <5 (#39881)
- GH-39999 - [Python] 修复使用 pandas CoW / 夜间版集成测试时的测试问题 (#40000)
- GH-40009 - [C++] 添加缺失的 “#include
" (#40010) - GH-40248 - [R] 支持 gnu libtool?