Apache Arrow 0.15.1 (2019年11月1日)
这是一个主要版本,涵盖了超过 1 个月的开发工作。
下载
贡献者
此版本包含来自 13 位不同贡献者的 41 次提交。
$ git shortlog -sn apache-arrow-0.15.0..apache-arrow-0.15.1
10 Wes McKinney
10 Antoine Pitrou
7 Krisztián Szűcs
2 tianchen92
2 Joris Van den Bossche
2 Sutou Kouhei
2 Anthony Abate
1 Uwe L. Korn
1 Prudhvi Porandla
1 Yuqi Gu
1 ptaylor
1 Rick Cobb
1 tianchen
补丁提交者
以下 Apache 提交者将贡献的补丁合并到仓库中。
$ git shortlog -csn apache-arrow-0.15.0..apache-arrow-0.15.1
41 Krisztián Szűcs
更新日志
新功能和改进
- ARROW-6610 - [C++] 添加 ARROW_FILESYSTEM=ON/OFF CMake 配置标志
- ARROW-6661 - [Java] 实现 slice 等 API 以增强 VectorSchemaRoot
- ARROW-6777 - [GLib][CI] 取消固定 gobject-introspection gem
- ARROW-6852 - [C++] 在 Arm64 上 memory-benchmark 构建失败
- ARROW-6927 - [C++] 添加 gRPC 版本检查
- ARROW-6963 - [打包][Wheel][OSX] 使用 crossbow 的命令从 travis 构建中部署工件
Bug 修复
- ARROW-6464 - [Java] 使用 slice API 重构 FixedSizeListVector#splitAndTransfer
- ARROW-6728 - [C#] 支持读写 Date32 和 Date64 数组
- ARROW-6740 - [Python] 在 Windows 上无法删除已关闭的 MemoryMappedFile
- ARROW-6762 - [C++] JSON 读取器在换行符处出现段错误
- ARROW-6795 - [C#] 在 C# 中读取大型 Arrow 文件导致异常
- ARROW-6806 - [C++] 反序列化包含 null/空列表的 ListArray 时出现段错误
- ARROW-6809 - [RUBY] 由于 glib2 3.3.7 编译失败,Gem 无法在 macOS 上安装
- ARROW-6813 - [Ruby] 在 Arrow 0.15 中,使用 headers=true 的 Arrow::Table.load 导致异常
- ARROW-6834 - [C++] 将 gtest 固定到 1.8.1 以排查失败的 Appveyor / MSVC 构建
-
ARROW-6844 - [C++][Parquet][Python] 列表
列在 0.15.0 版本中读取中断 - ARROW-6857 - [Python][C++] 在空 chunked_array 上进行 dictionary_encode 时出现段错误 (边缘情况)
- ARROW-6860 - [Python] 仅将 libarrow_flight.so 链接到 pyarrow._flight
- ARROW-6861 - [Python] arrow-0.15.0 读取 arrow-0.14.1 输出的 Parquet 字典列时出错: 读取列失败: IOError: Arrow 错误: Invalid: Resize cannot downsize
- ARROW-6869 - [C++] builder_dict.h 中的字典“增量”构建逻辑产生无效数组
- ARROW-6873 - [Python] 过时的 CColumn 引用破坏了 Cython cimport pyarrow
- ARROW-6874 - [Python] 在转换为 object dtype 时,Table.to_pandas() 存在内存泄漏
- ARROW-6876 - [Python] 对于 0.15.0 版本,读取具有多列的 parquet 文件变慢
- ARROW-6877 - [C++] 未能从正确的环境中找到 Boost
- ARROW-6878 - [Python] 在 python3 下,pa.array() 无法正确处理键为字节的字典列表
- ARROW-6882 - [Python] 无法从 dictionary_encoding 结果创建 chunked_array
- ARROW-6886 - [C++] arrow::io 头文件的 nvcc 编译器警告
- ARROW-6898 - [Java] 修复 ArrowWriter 和几个测试类中的潜在内存泄漏
- ARROW-6903 - [Python] 在 ARROW-6860 更改后,Wheels 被破坏
- ARROW-6905 - [打包][OSX] 由于 brew 编译超时,MacOS 上的夜间构建失败
- ARROW-6910 - [Python] pyarrow.parquet.read_table(...) 占用大量内存,且直到程序退出才释放
- ARROW-6922 - [Python] Pandas 主构建失败 (MultiIndex.levels 更改)
- ARROW-6937 - [打包][Python] 修复 conda linux 和 OSX wheel 的夜间构建
- ARROW-6938 - [Python] Windows wheel 依赖于 zstd.dll 和 libbz2.dll,但它们未被捆绑
- ARROW-6962 - [C++] [CI] 停止使用 -Weverything 进行编译
- ARROW-6977 - [C++] 仅在支持该功能时才启用 jemalloc background_thread
- ARROW-6983 - [C++] 线程化任务组有时会崩溃