Apache Arrow 0.15.1 (2019 年 11 月 1 日)
这是一个涵盖超过 1 个月开发的主要版本。
下载
贡献者
此版本包含来自 13 位不同贡献者的 41 次提交。
$ git shortlog -sn apache-arrow-0.15.0..apache-arrow-0.15.1
10 Wes McKinney
10 Antoine Pitrou
7 Krisztián Szűcs
2 tianchen92
2 Joris Van den Bossche
2 Sutou Kouhei
2 Anthony Abate
1 Uwe L. Korn
1 Prudhvi Porandla
1 Yuqi Gu
1 ptaylor
1 Rick Cobb
1 tianchen
补丁提交者
以下 Apache 提交者将贡献的补丁合并到存储库中。
$ git shortlog -csn apache-arrow-0.15.0..apache-arrow-0.15.1
41 Krisztián Szűcs
更新日志
新特性和改进
- ARROW-6610 - [C++] 添加 ARROW_FILESYSTEM=ON/OFF CMake 配置标志
- ARROW-6661 - [Java] 实现像 slice 这样的 API 来增强 VectorSchemaRoot
- ARROW-6777 - [GLib][CI] 取消固定 gobject-introspection gem
- ARROW-6852 - [C++] memory-benchmark 构建在 Arm64 上失败
- ARROW-6927 - [C++] 添加 gRPC 版本检查
- ARROW-6963 - [打包][Wheel][OSX] 使用 crossbow 的命令从 travis 构建部署文件
Bug 修复
- ARROW-6464 - [Java] 使用 slice API 重构 FixedSizeListVector#splitAndTransfer
- ARROW-6728 - [C#] 支持读取和写入 Date32 和 Date64 数组
- ARROW-6740 - [Python] 无法在 Windows 上删除已关闭的 MemoryMappedFile
- ARROW-6762 - [C++] JSON 读取器在换行符上出现段错误
- ARROW-6795 - [C#] 在 C# 中读取大型 Arrow 文件会导致异常
- ARROW-6806 - [C++] 反序列化包含 null/empty 列表的 ListArray 时出现段错误
- ARROW-6809 - [RUBY] 由于 glib2 3.3.7 编译失败,Gem 无法在 macOS 上安装
- ARROW-6813 - [Ruby] headers=true 的 Arrow::Table.load 导致 Arrow 0.15 中出现异常
- ARROW-6834 - [C++] 将 gtest 固定到 1.8.1 以分类失败的 Appveyor / MSVC 构建
- ARROW-6844 - [C++][Parquet][Python] 列表
列读取在 0.15.0 中损坏 - ARROW-6857 - [Python][C++] 对 empty chunked_array 进行 dictionary_encode 时出现段错误 (边缘情况)
- ARROW-6860 - [Python] 仅将 libarrow_flight.so 链接到 pyarrow._flight
- ARROW-6861 - [Python] arrow-0.15.0 读取 arrow-0.14.1 输出的 Parquet 字典列:读取列失败:IOError:Arrow 错误:无效:Resize 无法缩小
- ARROW-6869 - [C++] builder_dict.h 中的字典 “delta” 构建逻辑产生无效的数组
- ARROW-6873 - [Python] 过时的 CColumn 引用破坏 Cython cimport pyarrow
- ARROW-6874 - [Python] 转换为对象 dtype 时,Table.to_pandas() 中存在内存泄漏
- ARROW-6876 - [Python] 读取具有许多列的 parquet 文件对于 0.15.0 变得缓慢
- ARROW-6877 - [C++] 无法从正确的环境找到 Boost
- ARROW-6878 - [Python] pa.array() 无法正确处理 python3 下具有字节键的字典列表
- ARROW-6882 - [Python] 无法从 dictionary_encoding 结果创建 chunked_array
- ARROW-6886 - [C++] arrow::io header nvcc 编译器警告
- ARROW-6898 - [Java] 修复 ArrowWriter 和多个测试类中潜在的内存泄漏
- ARROW-6903 - [Python] ARROW-6860 更改后 Wheels 损坏
- ARROW-6905 - [打包][OSX] 由于 brew 编译超时,MacOS 上的 Nightly 构建失败
- ARROW-6910 - [Python] pyarrow.parquet.read_table(…) 占用大量内存,直到程序退出才释放
- ARROW-6922 - [Python] Pandas master 构建失败 (MultiIndex.levels 更改)
- ARROW-6937 - [打包][Python] 修复 conda linux 和 OSX wheel nightly 构建
- ARROW-6938 - [Python] Windows wheel 依赖于未捆绑的 zstd.dll 和 libbz2.dll
- ARROW-6962 - [C++] [CI] 停止使用 -Weverything 进行编译
- ARROW-6977 - [C++] 仅在支持该功能时启用 jemalloc background_thread
- ARROW-6983 - [C++] 线程任务组有时会崩溃