Apache Arrow 15.0.1 (2024年3月7日)
这是一个补丁版本,涵盖了超过1个月的开发工作。
下载
贡献者
此版本包含来自 18 位不同贡献者的 37 次提交。
$ git shortlog -sn apache-arrow-15.0.0..apache-arrow-15.0.1
5 Antoine Pitrou
4 Alenka Frim
4 Joris Van den Bossche
4 Raúl Cumplido
3 Rossi(Ruoxi) Sun
2 Dewey Dunnington
2 Rossi Sun
2 emkornfield
2 mwish
1 Curt Hagenlocher
1 David Li
1 Jeremy Aguilon
1 Lubo Slivka
1 Matt Topol
1 Rok Mihevc
1 Sutou Kouhei
1 Tom Jarosz
1 ZhangHuiGui
补丁提交者
以下 Apache 提交者将贡献的补丁合并到仓库中。
$ git shortlog -sn --group=trailer:signed-off-by apache-arrow-15.0.0..apache-arrow-15.0.1
12 Antoine Pitrou
7 Joris Van den Bossche
3 Sutou Kouhei
2 AlenkaF
2 David Li
2 Dewey Dunnington
2 mwish
1 Benjamin Kietzman
1 Curt Hagenlocher
1 Jacob Wujciak-Jens
1 Matt Topol
更新日志
Apache Arrow 15.0.1 (2024-03-07 08:00:00)
Bug 修复
- GH-38655 - [C++] 当数组长度大于 32 时,“iso_calendar” 内核返回不正确的结果 (#39360)
- GH-39313 - [Python] 修复 _pandas_api#_check_import 中的竞争条件 (#39314)
- GH-39332 - [C++] 当追加变长数据超过偏移量限制 (int32 max) 时,在 ExecBatchBuilder 中明确报错 (#39383)
- GH-39525 - [C++][Parquet] 将内存池传递给解码器 (#39526)
- GH-39527 - [C++][Parquet] 在截断为 int32 前验证页面大小 (#39528)
- GH-39577 - [C++] 修复 `CompareBinaryColumnToRow` 中跨缓冲区边界的尾部字访问问题 (#39606)
- GH-39582 - [C++][Acero] 使用 ExecutePlan 连接表时出现随机挂起
- GH-39583 - [C++] 修复 ExecBatchBuilder 在追加具有相同 id 的连续尾部行时可能超过缓冲区边界的问题(针对固定大小类型)(#39585)
- GH-39599 - [Python] 避免对 Numpy dtypes 的引用泄漏 (#39636)
- GH-39640 - [Docs] 将 pydata-sphinx-theme 固定到 0.14.* 版本 (#39758)
- GH-39640 - [Docs] 将 pydata-sphinx-theme 固定到 0.14.1 版本 (#39658)
- GH-39656 - [Release] 将 macOS wheels 的平台标签更新为 macosx_10_15 (#39657)
- GH-39672 - [Go] 非 UTC 时区的 Time 到 Date32/Date64 转换问题 (#39674)
- GH-39690 - [C++][FlightRPC] 修复 PollInfo 中的空指针解引用问题 (#39711)
- GH-39732 - [Python][CI] 修复使用最新/每日构建版 pandas 时的测试失败问题 (#39760)
- GH-39737 - [Release][Docs] 更新发布后文档任务 (#39762)
- GH-39740 - [C++] 修复 month_day_nano 区间类型的 filter 和 take 内核 (#39795)
- GH-39778 - [C++] 修复 key hash avx2 中跨缓冲区边界的尾部字节访问问题 (#39800)
- GH-39803 - [C++][Acero] 修复 AsOfJoin 在 schemas 顺序与输出不同时的问题 (#39804)
- GH-39860 - [C++] Expression ExecuteScalarExpression 执行空参数函数时结果错误 (#39908)
- GH-39865 - [C++] 导入已注册的扩展时剥离扩展元数据 (#39866)
- GH-39897 - [C++] 使用 s3 URI 时 arrow::fs::FileSystemFromUri() 非线程安全
- GH-39916 - [C#] 恢复对 .NET 4.6.2 的支持 (#40008)
- GH-39933 - [R] 修复针对最新 reticulate 的指针到 Python 的转换 (#39969)
- GH-39942 - [Python] 使胶囊名称检查更宽松 (#39977)
- GH-39976 - [C++] 修复 BinaryViewBuilder::AppendArraySlice 中行外数据大小的计算问题 (#39994)
- GH-40004 - [Python][FlightRPC] 在 GeneratorStream 中释放 GIL (#40005)
- GH-40068 - [C++] 读取 parquet 文件元数据时可能存在数据竞争
- GH-40112 - [CI][Python] 确保选择 CPython,而不是 PyPy (#40131)
- GH-40174 - [C++][CI][Parquet] 修复 parquet column_writer_test 的构建问题 (#40175)
- GH-40386 - [Python] Python 构建被 Cython 3.0.9 破坏
新功能和改进
- GH-39504 - [Docs] 更新主 sphinx 文档的页脚,提供正确的署名 (#39505)
- GH-39673 - [C++] PollFlightInfo 没有遵循“五法则” (rule of 5)
- GH-39849 - [Python] 移除 pytest-lazy-fixture 的使用 (#39850)
- GH-39876 - [C++] 第三方库:将 zlib 升级到 1.3.1 (#39877)
- GH-39880 - [Python][CI] 为 dask 集成测试固定 moto<5 版本 (#39881)
- GH-39999 - [Python] 修复针对 pandas CoW / 每日集成测试的测试 (#40000)
-
GH-40009 - [C++] 添加缺失的 "#include"
" (#40010) - GH-40248 - [R] 是否支持 gnu libtool?