Apache Arrow 0.14.0 (2019 年 7 月 4 日)
这是一个重要的版本,涵盖了 3 个多月的开发。
下载
贡献者
此版本包含 78 位不同贡献者的 570 次提交。
$ git shortlog -sn apache-arrow-0.13.0..apache-arrow-0.14.0
67 Antoine Pitrou
62 Wes McKinney
37 Sebastien Binet
34 Sutou Kouhei
25 Kouhei Sutou
24 Neal Richardson
22 Romain Francois
21 Joris Van den Bossche
20 Benjamin Kietzman
19 Micah Kornfield
18 Krisztián Szűcs
16 David Li
16 François Saint-Jacques
14 Yosuke Shiro
11 Pindikura Ravindra
11 Praveen
10 liyafan82
10 tianchen
7 Kenta Murata
7 Neville Dipale
7 Renjie Liu
6 Chao Sun
6 Deepak Majeti
6 Hatem Helal
5 Andy Grove
4 Brian Hulette
4 Bryan Cutler
4 Eric Erhardt
4 Zhuo Peng
4 ptaylor
4 shengjun.li
3 Marco Neumann
3 Philipp Moritz
3 Prudhvi Porandla
3 Renat Valiullin
3 TP Boudreau
3 Zhiyuan Zheng
2 Fabio B. Silva
2 HyukjinKwon
2 John Muehlhausen
2 Prashanth Govindarajan
2 alexandreyc
2 shyam
1 Alex Sergeev
1 Anatoly Myachev
1 Anson Qian
1 Frank Wessels
1 Gidon Gershinsky
1 Guillaume Horel
1 Ivan Sadikov
1 Jamie Blondin
1 Javier Luraschi
1 Jim Walker
1 Johannes Luong
1 Jonathan A. Sternberg
1 Kevin Gurney
1 MASAMIKI
1 Mark Cafaro
1 Masayuki Takahashi
1 Miguel Cabrera
1 Nuno Sucena Almeida
1 Pearu Peterson
1 Robin Kåveland Hansen
1 Rok
1 Ryan Murray
1 Takuya Kato
1 Yngve Sekse Kristiansen
1 Yuqi Gu
1 Yurui Zhou
1 Zhijun Fu
1 daslu
1 dlekkas
1 emkornfield
1 praveenbingo
1 rjzamora
1 siddharth
1 tianchen92
1 tiger
补丁提交者
以下 Apache 提交者将贡献的补丁合并到了存储库中。
$ git shortlog -csn apache-arrow-0.13.0..apache-arrow-0.14.0
213 Wes McKinney
67 Antoine Pitrou
40 Sutou Kouhei
36 Krisztián Szűcs
36 Sebastien Binet
34 Micah Kornfield
33 Kouhei Sutou
22 Pindikura Ravindra
19 Romain Francois
18 Chao Sun
16 François Saint-Jacques
10 Uwe L. Korn
6 Bryan Cutler
4 Brian Hulette
4 Yosuke Shiro
3 GitHub
2 Andy Grove
2 Philipp Moritz
2 Sidd
1 Deepak Majeti
1 Robert Nishihara
1 ptaylor
更新日志
新特性和改进
- ARROW-1012 - [C++] 创建一个可配置的 RecordBatchReader 实现,用于从 Apache Parquet 文件读取
- ARROW-1207 - [C++] 实现 Map 逻辑类型
- ARROW-1261 - [Java] 为 Map 逻辑类型添加容器类型
- ARROW-1278 - 固定大小列表类型的集成测试
- ARROW-1279 - [集成][Java] Map 类型的集成测试
- ARROW-1280 - [C++] 实现固定大小列表类型
- ARROW-1496 - [JS] 将覆盖率数据上传到 codecov.io
- ARROW-1558 - [C++] 实现布尔选择内核
- ARROW-1774 - [C++] 添加“view”函数,为兼容类型创建零拷贝视图(如果支持)
- ARROW-1957 - [Python] 使用新的 NANO LogicalType Parquet 单元写入纳秒时间戳
- ARROW-1983 - [Python] 添加写入 parquet `_metadata` 文件的功能
- ARROW-2057 - [Python] 配置 pyarrow.parquet.write_table 中数据页的大小
- ARROW-2102 - [C++] 实现 take 内核函数 - 原始值类型
- ARROW-2103 - [C++] 实现 take 内核函数 - 字符串/二进制值类型
- ARROW-2104 - [C++] 实现 take 内核函数 - 嵌套数组值类型
- ARROW-2105 - [C++] 实现 take 内核函数 - 正确处理特殊索引
- ARROW-2217 - [C++] 添加选项,为压缩库依赖项使用动态链接
- ARROW-2298 - [Python] 添加选项,在转换为整数 Arrow 类型时不将 NaN 视为 null
- ARROW-2412 - [集成] 添加嵌套字典集成测试
- ARROW-2467 - [Rust] 使用 Flatbuffers 生成代码
- ARROW-2517 - [Java] 添加列表
写入器 - ARROW-2707 - [C++] 使用 Column::Slice 实现 Table::Slice 方法
- ARROW-2796 - [C++] 简化 symbols.map 文件,在构建 libarrow_python 时使用
- ARROW-2818 - [Python] 将 SparseDataFrame 传递到 Table.from_pandas 时提供更好的错误消息
- ARROW-2835 - [C++] ReadAt/WriteAt 与移动文件位置不一致
- ARROW-2969 - [R] 在 StructArray 和每个单元格包含数据帧的“嵌套”数据帧列之间转换
- ARROW-2981 - [C++] 支持在代码库上运行 clang-tidy 的脚本/文档
- ARROW-3040 - [Go] 添加对比较数组的支持
- ARROW-3041 - [Go] 添加对 TimeArray 的支持
- ARROW-3052 - [C++] 检测 ORC 系统包
- ARROW-3087 - [C++] 添加将比较操作应用于标量的内核
- ARROW-3144 - [C++] 将“字典”成员从 DictionaryType 移动到 ArrayData,以允许在数组块之间更改字典
- ARROW-3150 - [Python] 在 Linux 和 Windows 上发布启用 Flight 的 Python 轮子
- ARROW-3166 - [C++] 合并 arrow/io 和 parquet-cpp 中使用的 IO 接口
- ARROW-3191 - [Java] 添加支持 ArrowBuf 指向任意内存。
- ARROW-3200 - [C++] 添加支持读取带字典的 Flight 流
- ARROW-3290 - [C++] 用于安全 gRPC 的工具链支持
- ARROW-3294 - [C++] 在 Windows/Appveyor 上测试 Flight RPC
- ARROW-3314 - [R] 在构建时使用 pkg-config 设置 -rpath
- ARROW-3419 - [C++] 将 include-what-you-use 检查作为夜间构建运行
- ARROW-3459 - [C++][Gandiva] 添加对可变长度输出向量的支持
- ARROW-3475 - [C++] Int64Builder.Finish(NumericArray
) - ARROW-3572 - [打包] 正确处理 crossbow 的 ssh 来源 url
- ARROW-3671 - [Go] 实现 Interval 数组
- ARROW-3676 - [Go] 实现 Decimal128 数组
- ARROW-3679 - [Go] 实现 IPC 协议
- ARROW-3680 - [Go] 实现 Float16 数组
- ARROW-3686 - [Python] 支持在 to/from numpy 中使用掩码数组
- ARROW-3729 - [C++] 支持写入 TIMESTAMP_NANOS Parquet 元数据
- ARROW-3732 - [R] 添加将 RecordBatch 或 Schema 写入 Message 值,然后读取回来的函数
- ARROW-3758 - [R] 在 Windows 上构建 R 库,为 Windows 开发人员编写构建说明文档
- ARROW-3759 - [R][CI] 在 Appveyor 中的 Windows 上构建和测试
- ARROW-3767 - [C++] 添加将 Null 强制转换为任何类型的功能
- ARROW-3780 - [R] 获取数据失败:收集 int16 时数据无效
- ARROW-3791 - [C++] 添加 CSV 文件中布尔值的类型推断
- ARROW-3794 - [R] 考虑将 INT8 映射到 integer() 而不是 raw()
- ARROW-3804 - [R] 考虑降低所需的 R 运行时
- ARROW-3810 - [R] Array 和 ChunkedArray 的 type= 参数
- ARROW-3811 - [R] 结构数组推断
- ARROW-3814 - [R] RecordBatch$from_arrays()
- ARROW-3815 - [R] 改进记录批次工厂
- ARROW-3848 - [R] 允许在 RandomAccessFile$Read() 中缺少 nbytes
- ARROW-3897 - [MATLAB] 添加 MATLAB 支持,将数值数据类型写入 Feather 文件
- ARROW-3904 - [C++/Python] 验证 decimal128 类型的 scale 和 precision
- ARROW-4013 - [文档][C++] 文档介绍如何在 MSYS2 上构建 Apache Arrow
- ARROW-4020 - [发布] 在发布投票通过后,从开发分发系统中删除源工件
- ARROW-4036 - [C++] 使状态代码可插拔
- ARROW-4047 - [Python] 在 Parquet 文档中记录 int96 时间戳的使用和选项
- ARROW-4086 - [Java] 添加用于调试分配失败的 API
- ARROW-4121 - [C++] 重构 InvertKernel 的内存分配
- ARROW-4159 - [C++] 检查 -Wdocumentation 问题
- ARROW-4194 - [格式] Metadata.rst 没有指定 Timestamp 类型时区
- ARROW-4302 - [C++] 将 OpenSSL 添加到 C++ 构建工具链
- ARROW-4337 - [C#] 数组/RecordBatch 构建器流畅 API
- ARROW-4343 - [C++] 将尽可能完整的 Ubuntu Trusty/14.04 构建添加到 docker-compose 设置中
- ARROW-4356 - [CI] 添加 turbodbc 的集成 (docker) 测试
- ARROW-4452 - [Python] 序列化稀疏 torch 张量
- ARROW-4453 - [Python] 为 SparseTensor 创建 Cython 包装器
- ARROW-4467 - [Rust] [DataFusion] 为 DataFusion 创建 REPL 和 Dockerfile
- ARROW-4503 - [C#] ArrowStreamReader 过度分配和复制数据
- ARROW-4504 - [C++] 减少单元测试可执行文件的数量
- ARROW-4505 - [C++] 更友好的 date32 PrettyPrint
- ARROW-4566 - [C++][Flight] 添加选项,针对在不同主机上运行的性能服务器运行 arrow-flight-benchmark
- ARROW-4596 - [Rust] [DataFusion] 实现 COUNT 聚合函数
- ARROW-4622 - [C++] [Python] UnionArray 中的 MakeDense 和 MakeSparse 应该接受 Field 向量
- ARROW-4625 - [Flight] 包装服务器忙等待方法
- ARROW-4626 - [Flight] 将应用程序元数据字段添加到 DoGet
- ARROW-4627 - [Flight] 将应用程序元数据字段添加到 DoPut
- ARROW-4701 - [C++] 添加 JSON 分块器基准
- ARROW-4702 - [C++] 升级依赖项版本
- ARROW-4708 - [C++] 添加多线程 JSON 读取器
- ARROW-4714 - [C++][Java] 提供 JNI 接口,通过 Arrow C++ 读取 ORC 文件
- ARROW-4717 - [C#] 考虑暴露 ValueTask 而不是 Task
- ARROW-4719 - [C#] 在 C# 中实现 ChunkedArray、Column 和 Table
- ARROW-4741 - [Java] 为所有类添加文档并为类 javadocs 启用 checkstyle
- ARROW-4787 - [C++] 在哈希内核操作中包含 “null” 值(或许可以切换开启/关闭)
- ARROW-4788 - [C++] 开发更简洁的 API 来构造 StructArray
- ARROW-4800 - [C++] 创建/移植 StatusOr 实现,使其能够返回状态或类型
- ARROW-4805 - [Rust] 将时间数组写入 CSV
- ARROW-4806 - [Rust] 在转换内核中支持转换时间数组
- ARROW-4824 - [Python] read_csv 应该接受 io.StringIO 对象
- ARROW-4827 - [C++] 实现两个 git 版本之间的基准比较
- ARROW-4847 - [Python] 添加 pyarrow.table 工厂函数,根据输入类型分派到各种构造函数
- ARROW-4904 - [C++] 将 arrow/ipc/test-common.h 中的实现移动到 libarrow_testing
- ARROW-4911 - [R] 支持为 Windows 构建软件包
- ARROW-4912 - [C++, Python] 允许为 CSV 读取器指定列名
- ARROW-4913 - [Java][内存] 限制账本和 arrowbuf 的数量
- ARROW-4945 - [Flight] 在 Travis 中启用 Flight 集成测试
- ARROW-4956 - [C#] 允许 ArrowBuffers 在 C# 中包装外部内存
- ARROW-4959 - [Gandiva][Crossbow] 构建失败
- ARROW-4968 - [Rust] StructArray 构建器和 From<> 方法应检查字段类型是否与架构匹配
- ARROW-4971 - [Go] DataType 相等性
- ARROW-4972 - [Go] Array 相等性
- ARROW-4973 - [Go] Slice Array 相等性
- ARROW-4974 - [Go] Array 近似相等性
- ARROW-4990 - [C++] 用于比较数组与数组的内核
- ARROW-4993 - [C++] 在 CMake 配置结束时显示摘要
- ARROW-5000 - [Python] 修复 setup.py 中的弃用警告
- ARROW-5007 - [C++] 将 DCHECK 移出 sse-utils
- ARROW-5020 - [C++][Gandiva] 将构建的 Gandiva 相关 conda 包拆分到单独的 .yml conda env 文件中
- ARROW-5027 - [Python] 添加 JSON 读取器
- ARROW-5038 - [Rust] [DataFusion] 实现 AVG 聚合函数
- ARROW-5039 - [Rust] [DataFusion] 修复 CAST 支持中的错误
- ARROW-5045 - [Rust] 代码覆盖率在 CI 中静默失败
- ARROW-5053 - [Rust] [DataFusion] 使用环境变量指定 arrow 测试数据的位置
- ARROW-5054 - [C++][发布] 在 verify-release-candidate.sh 中测试 Flight
- ARROW-5056 - [打包] 调整 conda 食谱以在 unix 系统上使用 ORC conda-forge 包
- ARROW-5061 - [发布] 改进 03-binary 性能
- ARROW-5062 - [Java] 为 Flight 遮蔽 Java Guava 依赖项
- ARROW-5063 - [Java] FlightClient 不应创建子分配器
- ARROW-5064 - [发布] 将 PKG_CONFIG_PATH 传递给验证脚本中的 glib
- ARROW-5066 - [集成] 添加标志以在 integration/integration_test.py 中启用/禁用实现
- ARROW-5071 - [基准测试] 使用 archery 执行基准测试
- ARROW-5076 - [打包] 提高二进制上传后的性能
- ARROW-5077 - [Rust] 发布过程应更改 Cargo.toml 以使用发布版本
- ARROW-5078 - [文档] Sphinx 因 RemovedInSphinx30Warning 失败
- ARROW-5079 - [发布] 添加脚本以发布 C# 包
- ARROW-5080 - [发布] 添加脚本以发布 Rust 包
- ARROW-5081 - [C++] 在 CMake 配置中一致使用 PATH_SUFFIXES
- ARROW-5082 - [Python][打包] 减小 macOS 和 manylinux1 wheels 的大小
- ARROW-5083 - [开发者] 在 merge_arrow_pr.py 脚本中,允许用户设置已发布的修复版本
- ARROW-5088 - [C++] 在发布模式下使用 BUILD_WARNING_LEVEL=CHECKIN 时,不要设置 -Werror
- ARROW-5091 - [Flight] 将 FlightGetInfo 消息重命名为 FlightInfo
- ARROW-5093 - [打包] 添加对选择性二进制上传的支持
- ARROW-5094 - [打包] 添加 APT/Yum 验证脚本
- ARROW-5102 - [C++] 减少头文件依赖项
- ARROW-5108 - [Go] 实现从 Arrow 文件读取原始数组
- ARROW-5109 - [Go] 实现从 Arrow 文件读取二进制/字符串数组
- ARROW-5110 - [Go] 实现从 Arrow 文件读取结构体数组
- ARROW-5111 - [Go] 实现从 Arrow 文件读取列表数组
- ARROW-5112 - [Go] 实现将数组写入 Arrow 文件
- ARROW-5113 - [C++][Flight] C++ 中 DoPut 的单元测试
- ARROW-5115 - [JS] 实现 Vector Builders
- ARROW-5116 - [Rust] 将内核相关文件移动到 compute/kernels 下
- ARROW-5124 - [C++] 在 MinGW 构建中添加对 Parquet 的支持
- ARROW-5126 - [Rust] [Parquet] 将 parquet 列描述转换为 arrow 数据类型
- ARROW-5127 - [Rust] [Parquet] 添加页面迭代器
- ARROW-5136 - [Flight] 实现调用选项(超时)
- ARROW-5137 - [Flight] 实现身份验证 API
- ARROW-5145 - [C++] 发布模式缺少便捷的输入验证
- ARROW-5150 - [Ruby] 添加 Arrow::Table#raw_records
- ARROW-5155 - [GLib][Ruby] 添加对从数据类型构建联合数组的支持
- ARROW-5157 - [网站] 将 MATLAB 添加到由 Apache Arrow 驱动的页面
- ARROW-5162 - [Rust] [Parquet] 将 mod reader 重命名为 arrow。
- ARROW-5163 - [Gandiva] 转换时间戳/日期错误地将 0097 年评估为 1997 年
- ARROW-5164 - [Gandiva] [C++] 引入 32 位哈希函数
- ARROW-5165 - [Python][文档] 构建文档没有建议分配 $ARROW_BUILD_TYPE
- ARROW-5168 - [GLib] 添加 garrow_array_take()
- ARROW-5171 - [C++] 在比较枚举选项中使用 LESS 而不是 LOWER。
- ARROW-5172 - [Go] 实现从 Arrow 文件读取固定大小的二进制数组
- ARROW-5178 - [Python] 允许从 Python 字典创建 Table
- ARROW-5179 - [Python] 在 Python 3.7+ 上返回普通字典,而不是 OrderedDict
- ARROW-5185 - [C++] 在 CMake 配置文件中添加对 Boost 的支持
- ARROW-5187 - [Rust] 将 StructArray 展平为 RecordBatch 的能力
- ARROW-5188 - [Rust] 为 StructArray 添加时间构建器
- ARROW-5189 - [Rust] [Parquet] 格式化 parquet 行中的各个字段
- ARROW-5190 - [R] 讨论:R 包中的 tibble 依赖项
- ARROW-5191 - [Rust] 公开 CSV 和 JSON 读取器架构
- ARROW-5203 - [GLib] 添加对比较筛选器的支持
- ARROW-5204 - [C++] 提高 BufferBuilder 性能
- ARROW-5212 - [Go] Go 库中的 Array BinaryBuilder 无法访问调整大小的值缓冲区
- ARROW-5218 - [C++] 当指定第三方库位置时,改进构建
- ARROW-5219 - [C++] 使用 Ninja 时,并行构建 protobuf_ep
- ARROW-5222 - [Python] 在 MacOS 上为开发安装 pyarrow 时遇到的问题
- ARROW-5225 - [Java] 提高 BaseValueVector#getValidityBufferSizeFromCount 的性能
- ARROW-5226 - [Gandiva] 支持十进制的比较运算符
- ARROW-5238 - [Python] 提高 pyarrow.dictionary 函数的可用性
- ARROW-5241 - [Python] 添加选项以禁用向 parquet 文件写入统计信息
- ARROW-5250 - [Java] 删除方法上的 javadoc 抑制。
- ARROW-5252 - [C++] 更改变体实现
- ARROW-5256 - [打包][deb] 无法使用 LLVM 7.1.0 构建
- ARROW-5257 - [网站] 更新网站以使用“官方”Apache Arrow标志,添加明确标记的标志链接
- ARROW-5258 - [C++/Python] 向调用者公开数据集片段的文件元数据
- ARROW-5261 - [C++] 完成 Duration 和 Interval 标量类型的实现
- ARROW-5262 - [Python] 修复拼写错误
- ARROW-5264 - [Java] 允许通过环境变量启用/禁用边界检查
- ARROW-5266 - [Go] 实现 Float16 的读/写 IPC
- ARROW-5268 - [GLib] 添加 GArrowJSONReader
- ARROW-5269 - [C++] 将基准测试候选项列入回归检查的白名单
- ARROW-5275 - [C++] 编写通用文件系统测试
- ARROW-5281 - [Rust] [Parquet] 将 DataPageBuilder 移动到 test_common
- ARROW-5284 - [Rust] 使用 std::alloc 替换 libc 进行内存分配
- ARROW-5286 - [Python] 在给定已知 schema 的情况下,支持 Table.from_pandas 中的 Structs
- ARROW-5288 - [文档] 丰富贡献指南
- ARROW-5289 - [C++] 将 arrow/util/concatenate.h 移动到 arrow/array/
- ARROW-5290 - [Java] 提供一个标志来启用/禁用向量的 get 方法中的空值检查
- ARROW-5291 - [Python] 为 Array 上的 “take” 内核添加包装器
- ARROW-5298 - [Rust] 为 Buffer 添加 debug 实现
- ARROW-5299 - [C++] ListArray 的比较不正确
- ARROW-5309 - [Python] 对返回新对象的 Python “append” 方法添加说明
- ARROW-5311 - [C++] 在 Take 内核中返回更具体的无效状态
- ARROW-5313 - [格式] 对 Field 表格的注释有点令人困惑
- ARROW-5317 - [Rust] [Parquet] 为 SerializedFileReader 实现 IntoIterator
- ARROW-5319 - [CI] 在 MinGW 构建中启用 ccache
- ARROW-5321 - [Gandiva][C++] 为 utf8 和 binary 类型添加 isnull 和 isnotnull
- ARROW-5323 - [CI] 将压缩与 clcache 一起使用
- ARROW-5328 - [R] 添加 shell 脚本以在本地执行完整的软件包重建和测试
- ARROW-5329 - 添加直接在 MATLAB 中构建 Feather 的 MATLAB 接口的支持
- ARROW-5334 - [C++] 为保持一致性,向 arrow::Integer 和 arrow::FloatingPoint 类名添加 “Type”
- ARROW-5335 - [Python] 当转换为 pandas 时,如果出现可变字典则引发错误
- ARROW-5339 - [C++] 将 jemalloc 添加到第三方依赖下载脚本中
- ARROW-5341 - [C++] 添加关于在本地修复和测试 -Wdocumentation clang 警告的说明
- ARROW-5342 - [格式] 在 IPC 协议中形式化扩展类型元数据
- ARROW-5346 - [C++] 恢复对 vendor 日期代码中限定持续时间的更改
- ARROW-5349 - [Python/C++] 提供一种在 parquet ColumnChunkMetaData 中指定文件路径的方法
- ARROW-5361 - [R] 遵循 ARROW-3144 中的 DictionaryType/DictionaryArray 更改
- ARROW-5363 - [GLib] 修复编码风格
- ARROW-5364 - [C++] 在 BuildUtils.cmake 注释中使用 ASCII 而不是 UTF-8
- ARROW-5365 - [C++][CI] 将 UBSan 和 ASAN 添加到 CI 中
- ARROW-5368 - [C++] 在 MinGW 中默认禁用 jemalloc
- ARROW-5369 - [C++] 添加对 Windows 上 glog 的支持
- ARROW-5370 - [C++] 默认情况下检测系统 uriparser
- ARROW-5372 - [GLib] 添加对空值/布尔值 CSV 读取选项的支持
- ARROW-5378 - [C++] 添加本地 FileSystem 实现
- ARROW-5380 - [C++] 修复并启用针对未对齐访问的 UBSan
- ARROW-5384 - [Go] 添加 FixedSizeList 数组
- ARROW-5389 - [C++] 添加内部临时目录 API
- ARROW-5392 - [C++][CI][MinGW] 在 AppVeyor 上禁用静态库构建
- ARROW-5393 - [R] 为 read_parquet() 添加测试和示例
- ARROW-5395 - [C++] 在文件格式中使用流 EOS
- ARROW-5396 - [JS] 确保读取器和写入器支持没有 RecordBatches 的文件和流
- ARROW-5401 - [CI] [C++] 在 Travis-CI 上打印 ccache 统计信息
- ARROW-5404 - [C++] nonstd::string_view 与 c++17 中的 std::string_view 冲突
- ARROW-5407 - [C++] 集成测试 Travis CI 条目构建了许多不必要的目标
- ARROW-5413 - [C++] CSV 读取器不删除 BOM
- ARROW-5415 - [发布] 发布脚本应在所有位置更新 R 版本
- ARROW-5416 - [网站] 将 Homebrew 添加到项目安装页面
- ARROW-5418 - [CI][R] 运行代码覆盖率并报告给 codecov.io
- ARROW-5420 - [Java] 在 VariableWidthVector 中实现或删除 getCurrentSizeInBytes
- ARROW-5427 - [Python] RangeIndex 序列化更改的影响
- ARROW-5428 - [C++] 添加在 arrow::io::BufferedInputStream 中设置“读取范围”的选项
- ARROW-5429 - [Java] 提供替代的缓冲区分配策略
- ARROW-5432 - [Python] 向 pyarrow.NativeFile 添加 “read_at” 方法
- ARROW-5433 - [C++][Parquet] 改进 parquet-reader 列信息
- ARROW-5434 - [Java] 为 ARROW-3191 中 ArrowBuf 的更改引入向后兼容性的包装器
- ARROW-5436 - [Python] 在 parquet.read_table 中公开 filters 参数
- ARROW-5438 - [JS] 在文件格式中使用流 EOS
- ARROW-5441 - [C++] 实现 FindArrowFlight.cmake
- ARROW-5442 - [网站] 阐明是什么使发布工件成为“官方”工件
- ARROW-5443 - [Gandiva][Crossbow] 关闭 parquet 加密
- ARROW-5447 - [CI] [Ruby] CI 在 AppVeyor 上失败
- ARROW-5449 - [C++] 本地文件系统实现:调查 Windows UNC 路径
- ARROW-5451 - [C++][Gandiva] 为小数添加舍入函数
- ARROW-5452 - [R] 添加文档网站 (pkgdown)
- ARROW-5461 - [Java] 为 Float8Vector 和分配器添加微基准测试
- ARROW-5463 - [Rust] 为 Buffer 实现 AsRef
- ARROW-5464 - [Archery] 错误的 –benchmark-filter 默认值
- ARROW-5465 - [Crossbow] 支持将提交的作业定义 yaml 写入文件
- ARROW-5466 - [Java] 在 Travis CI 中 Docker 化 Java 构建,在单个条目中运行多个 JDK
- ARROW-5467 - [Go] 实现 Time32/Time64 数组的读/写 IPC
- ARROW-5468 - [Go] 实现 Timestamp 数组的读/写 IPC
- ARROW-5469 - [Go] 实现 Date32/Date64 数组的读/写 IPC
- ARROW-5470 - [CI] C++ 本地文件系统补丁破坏 Travis R 作业
- ARROW-5472 - [开发] 如果未设置 JIRA 组件,则向 PR 合并工具添加警告
- ARROW-5474 - [C++] 记录所需的 Boost 版本
- ARROW-5476 - [Java][内存] 修复 Netty ArrowBuf 切片
- ARROW-5477 - [C++] 检查所需的 RapidJSON 版本
- ARROW-5478 - [打包] 删除 Ubuntu 14.04 支持
- ARROW-5481 - [GLib] garrow_seekable_input_stream_peek() 缺少“error”参数文档
- ARROW-5483 - [Java] 添加采用 Field 对象的 ValueVector 构造函数
- ARROW-5485 - [Gandiva][Crossbow] OSx 构建失败
- ARROW-5486 - [GLib] 添加 gandiva::FunctionRegistry 和相关内容的绑定
- ARROW-5488 - [R] 在 C++ lib 不可用时进行处理
- ARROW-5490 - [C++] 删除 ARROW_BOOST_HEADER_ONLY
- ARROW-5491 - [C++] 删除 MACRO 定义后不必要的分号
- ARROW-5492 - [R] 向 read_* 函数添加 “col_select” 参数以读取列的子集
- ARROW-5495 - [C++] 一致地使用 HTTPS 下载依赖项
- ARROW-5496 - [R][CI] 修复 R codecov.io 报告中的相对路径
- ARROW-5498 - [C++] 使用 Flatbuffers 1.11.0 和 MinGW 构建失败
- ARROW-5500 - [R] read_csv_arrow() 签名应与 readr::read_csv() 匹配
- ARROW-5503 - [R] 添加 read_json()
- ARROW-5504 - [R] 将 use_threads 参数移动到全局选项
- ARROW-5509 - [R] write_parquet()
- ARROW-5511 - [打包] 在 Conda 包中启用 Flight
- ARROW-5512 - [C++] 为 Datasets 项目起草初始公共 API
- ARROW-5513 - [Java] 重构 getstartOffset 的方法名称以使用驼峰式命名
- ARROW-5516 - [Python] pyarrow 的开发页面在使用 pip 时缺少依赖项
- ARROW-5518 - [Java] 在 allocateNew 和 clear 上将 VectorSchemaRoot rowCount 设置为 0
- ARROW-5524 - [C++] 如果未找到 OpenSSL,则在 CMake 中关闭 PARQUET_BUILD_ENCRYPTION
- ARROW-5526 - [开发者] 在 GitHub issue 模板中添加更醒目的提示,引导错误报告提交到 JIRA
- ARROW-5529 - [Flight] 允许使用多个 TLS 证书进行服务
- ARROW-5531 - [Python] 在 Array.from_buffers 中支持二进制、utf8 和嵌套类型
- ARROW-5533 - [Plasma] Plasma 客户端应该是线程安全的
- ARROW-5534 - [GLib] 添加 garrow_table_concatenate()
- ARROW-5535 - [GLib] 添加 garrow_table_slice()
- ARROW-5537 - [JS] 在 RecordBatchWriter 和 DictionaryBuilder 中支持增量字典
- ARROW-5538 - [C++] 将最低 OpenSSL 版本限制为 1.0.2
- ARROW-5541 - [R] 从负 int32 到 uint32 和 uint64 的转换现在是安全的
- ARROW-5544 - [Archery] 在回归时,“benchmark diff”子命令不应返回非零值
- ARROW-5545 - [C++][文档] 在 C++ API 文档中阐明带时区的时间戳的 UTC 值期望
- ARROW-5547 - [C++][FlightRPC] 未提供 arrow-flight.pc
- ARROW-5552 - [Go] 使 Schema 和 Field 实现 Stringer
- ARROW-5554 - 为 arrow::Concatenate 添加 Python 封装器
- ARROW-5555 - [R] 添加 install_arrow() 函数以帮助用户获取 C++ 运行时库
- ARROW-5556 - [文档] 记录 JSON 读取器
- ARROW-5557 - [C++] 调查在不同平台上 VisitBitsUnrolled 的性能
- ARROW-5564 - [C++] 将 uriparser 添加到 conda-forge
- ARROW-5565 - [Python] 记录在使用 pyarrow 时如何使用 gdb
- ARROW-5567 - [C++] 修复 memory-benchmark 的构建错误
- ARROW-5574 - [R] read_arrow() 的文档错误
- ARROW-5580 - 修正 Gandiva 中时间戳函数的定义
- ARROW-5581 - [Java] 为向量排序提供接口和初始实现
- ARROW-5582 - [Go] 添加对比较记录的支持
- ARROW-5586 - [R] 将 LIST 类型的 Array 转换为 R 列表
- ARROW-5587 - [Java] 为 Java 代码添加更多的 maven 风格检查
- ARROW-5590 - [R] 如果可能,在同一个 CI 条目中运行“no libarrow”R 构建
- ARROW-5591 - [Go] 实现 Duration & Intervals 的读/写 IPC
- ARROW-5597 - [打包][deb] 添加 Flight 包
- ARROW-5600 - [R] R 包命名空间清理
- ARROW-5602 - [Java][Gandiva] 为十进制舍入函数添加测试
- ARROW-5604 - [Go] 改进 type-traits 的测试覆盖率
- ARROW-5609 - [C++] 设置 CMP0068 CMake 策略以避免 macOS 警告
- ARROW-5612 - [Python][文档] 阐明 date_as_object 选项的行为
- ARROW-5621 - [Go] 实现 Decimal128 数组的读/写 IPC
- ARROW-5622 - [C++][Dataset] 未提供 arrow-dataset.pc
- ARROW-5625 - [R] 将结构体类型的 Array 转换为数据帧列
- ARROW-5632 - [文档] 添加一些描述在 macOS 上使用 Xcode IDE 进行编译/调试工作流的文档
- ARROW-5633 - [Python] 在 Linux wheels 中启用 bz2
- ARROW-5635 - [C++] 支持“压缩”表
- ARROW-5637 - [Gandiva] [Java] 完成 IN 表达式
- ARROW-5639 - [Java] 从 getOffsetBufferValueCapacity 中删除浮点计算
- ARROW-5641 - [GLib] 从 Git 目标中删除由 GNU Autotools 生成的枚举文件
- ARROW-5643 - [Flight] 添加覆盖主机名检查的功能
- ARROW-5650 - [Python] 更新 manylinux 依赖版本
- ARROW-5652 - [CI] 修复 iwyu docker 镜像
- ARROW-5656 - [Python] 在 macOS 上启用 Flight wheels
- ARROW-5659 - [C++] 添加对查找 Homebrew 安装的 OpenSSL 的支持
- ARROW-5660 - [GLib][CI] 使用最新的 macOS 镜像和所有基于 Homebrew 的库
- ARROW-5661 - 支持 Gandiva 中十进制的哈希函数
-
ARROW-5662 - [C++] 添加对 BOOST_SOURCE=AUTO 的支持 捆绑 系统 - ARROW-5663 - [打包][RPM] 更新 0.14.0 的 CentOS 包
- ARROW-5664 - [Crossbow] 在 CircleCI 上而不是 Travis 上执行夜间 crossbow 测试
- ARROW-5668 - [Python] 对于不可为空的字段,在 Schema.__repr__ 中显示“not null”
- ARROW-5669 - [Crossbow] manylinux1 wheel 构建失败
- ARROW-5670 - [Crossbow] get_apache_mirror.py 在 macOS 上使用 Python 3.5 时发生 TLS 错误
- ARROW-5671 - [crossbow] mac os python wheels 构建失败
- ARROW-5672 - [Java] 重构冗余方法修饰符
- ARROW-5683 - [R] 将 snappy 添加到 Rtools Windows 构建
- ARROW-5684 - [打包][deb] 添加对 Ubuntu 19.04 的支持
- ARROW-5685 - [打包][deb] 添加对 Apache Arrow Datasets 的支持
- ARROW-5687 - [C++] 删除 ARROW_BOOST_VENDORED 的剩余使用
- ARROW-5690 - [打包][Python] macOS wheels 损坏:缺少 libprotobuf.18.dylib
- ARROW-5694 - [Python] 转换为 pandas 时不支持十进制列表
- ARROW-5695 - [C#][发布] 在 verify-release-candidate.sh 中运行 sourcelink 测试
- ARROW-5696 - [Gandiva] [C++] 引入 castVarcharVarchar
- ARROW-5699 - [C++] 优化 CSV 中 Decimal128 的解析
- ARROW-5701 - [C++][Gandiva] 仅为所需的选择向量类型构建表达式
- ARROW-5702 - [C++] parquet::arrow::FileReader::GetSchema()
- ARROW-5704 - [C++] 停止对 SparseTensorImpl 类使用 ARROW_TEMPLATE_EXPORT
- ARROW-5705 - [Java] 优化 BaseValueVector#computeCombinedBufferSize 逻辑
- ARROW-5706 - [Java] 删除 getValidityBufferValueCapacity 中的类型转换
- ARROW-5707 - [Java] 改进 ArrowRecordBatch 的性能和代码结构
- ARROW-5710 - [C++] 允许在 Windows 上使用 Ninja 编译 Gandiva
- ARROW-5718 - [R] 在 record_batch() 和 table() 中自动拼接数据帧
- ARROW-5721 - [Rust] 将数组相关代码移动到一个单独的模块中
- ARROW-5724 - [R] [CI] AppVeyor 构建应该使用 ccache
- ARROW-5725 - [Crossbow] 将 conda 配方移植到 Azure Pipelines
- ARROW-5726 - [Java] 为整数向量实现一个通用接口
- ARROW-5727 - [Python] [CI] 在运行测试之前安装 pytest-faulthandler
- ARROW-5748 - [打包][deb] 添加对 Debian GNU/Linux buster 的支持
- ARROW-5749 - [Python] 为 Table::CombineChunks() 添加 Python 绑定
- ARROW-5751 - [打包][Python] Python macOS wheels 对 libcares 具有动态依赖性
- ARROW-5752 - [Java] 提高 ArrowBuf#setZero 的性能
- ARROW-5755 - [Rust] [Parquet] 为 Type 添加派生的 clone
- ARROW-5768 - [发布] CHANGELOG.md 末尾有多余的换行符
- ARROW-5773 - [R] 在发布前清理文档
- ARROW-5780 - [C++] 为 Decimal128 操作添加基准测试
- ARROW-5782 - [发布] 在 dev/release/01-perform.sh 中为 Flight 设置测试数据
- ARROW-5783 - [发布][C#] 从 RAT 检查中排除 dummy.git
- ARROW-5785 - Rust datafusion 实现不应依赖 rustyline
- ARROW-5787 - [发布][Rust] 使用本地模块验证 RC
- ARROW-5793 - [发布] 避免在 dev/release/03-binary.sh 中重复已知主机 SSH 错误
- ARROW-5794 - [发布] 跳过上传已上传的二进制文件
- ARROW-5795 - [发布] 添加上传二进制文件的缺失等待
- ARROW-5796 - [发布][APT] 更新预期软件包列表
- ARROW-5797 - [发布][APT] 更新支持的发行版
- ARROW-5813 - [C++] 支持检查不同连续张量的相等性
- ARROW-5818 - [Java][Gandiva] 支持 varlen 输出向量
- ARROW-5820 - [发布] 从验证脚本中删除未定义变量检查
- ARROW-653 - [Python / C++] 添加调试函数以十六进制打印数组的缓冲区内容
- ARROW-767 - [C++] 采用 FileSystem 抽象
- ARROW-835 - [格式] 添加 Timedelta 类型来描述时间间隔
- ARROW-840 - [Python] 提供 Python API 用于创建可以存活于 Arrow IPC 的用户定义数据类型
- ARROW-973 - [网站] 添加关于项目的 FAQ 页面
错误修复
- ARROW-1837 - [Java] 无法读取集成测试中超出有符号范围的无符号整数
- ARROW-2119 - [C++][Java] 处理零记录批次的 Arrow 流
- ARROW-2136 - [Python] 从 pandas 转换时未检查不可为空的 schema 字段
- ARROW-2256 - [C++] 在 Ubuntu 16.04 上使用 LLVM apt repos 时,Fuzzer 构建开箱即用失败
- ARROW-2461 - [Python] 为 manylinux2010 标签构建 wheels
- ARROW-3344 - [Python] test_plasma.py 失败(在 test_plasma_list 中)
- ARROW-3399 - [Python] 无法序列化 numpy 矩阵对象
- ARROW-3650 - [Python] 混合列索引以字符串形式读取
- ARROW-3762 - [C++] 当 BinaryArray 容量溢出时,Parquet arrow::Table 读取错误
- ARROW-4021 - [Ruby] 在 msys2 上构建 red-arrow 时出错
- ARROW-4076 - [Python] schema 验证和过滤器
- ARROW-4139 - [Python] 如果设置了 UTF8 ConvertedType,则将 Parquet 列统计信息转换为 unicode
- ARROW-4301 - [Java][Gandiva] Maven 快照版本更新似乎没有更新 Gandiva 子模块
- ARROW-4324 - [Python] 从混合 numpy 标量列表创建时,数组 dtype 推断不正确
- ARROW-4350 - [Python] dtype=object 的数组无法转换为列表的 ListArray
- ARROW-4447 - [C++] 调查 libthrift 的动态链接
- ARROW-4516 - [Python] 在没有 `_common_dataset` 但有空 `_tempfile` 的路径上创建 ParquetDataset 时出错
- ARROW-4523 - [JS] 添加行代理生成基准测试
- ARROW-4651 - [Format] Flight Location 应该比 (host, port) 对更灵活
- ARROW-4675 - [Python] 在 py2 中序列化 bool ndarray 并在 py3 中反序列化时出错
- ARROW-4694 - [CI] detect-changes.py 不一致
- ARROW-4723 - [Python] 读取包含 parquet 文件的目录时跳过 _files
- ARROW-4725 - [C++] 在 MinGW 构建下禁用字典测试
- ARROW-4823 - [Python] read_csv 不应该关闭它不拥有的文件句柄
- ARROW-4845 - [R] Windows MingW64 上的编译器警告
- ARROW-4851 - [Java] BoundsChecking.java 旧 drill 参数的默认行为似乎不正确
- ARROW-4885 - [Python] read_csv() 无法处理 decimal128 列
- ARROW-4886 - [Rust] 将切片的原始数组转换为列表数组时行为不一致
- ARROW-4923 - 公开 Decimal 向量的 setter,该 setter 接受 long 和 double 输入
- ARROW-4934 - [Python] 解决在 Python 3.8 中将成为错误的弃用通知
- ARROW-5019 - [C#] ArrowStreamWriter 在不可查找的流上不起作用
- ARROW-5049 - [Python] 在 spark 中使用 pyarrow FileSystem 时找不到 org/apache/hadoop/fs/FileSystem 类
- ARROW-5051 - [GLib][Gandiva] 发布验证脚本中的测试失败
- ARROW-5058 - [Release] 02-source.sh 生成带有错误链接的电子邮件模板
- ARROW-5068 - [Gandiva][Packaging] 修复 CMake 重构后 gandiva 的每日构建
- ARROW-5090 - 由于 dylib 中的 @rpath,Parquet 链接在 MacOS 上失败
- ARROW-5092 - [C#] Source Link 不适用于 C# 发布脚本
- ARROW-5095 - [Flight][C++] Flight DoGet 不公开服务器错误消息
- ARROW-5096 - [Packaging][deb] 缺少 plasma-store-server 包
- ARROW-5097 - [Packaging][CentOS6] arrow-lib 具有无法解析的依赖项
- ARROW-5098 - [Website] 更新 0.13.0 的 APT 安装文档
- ARROW-5100 - [JS] 如果缓冲区共享相同的底层 ArrayBuffer,则 Writer 会交换字节顺序
- ARROW-5117 - [Go] 在初始化构建器后附加零切片时发生 Panic
- ARROW-5119 - [Go] array.Boolean 的无效 Stringer 实现
- ARROW-5129 - [Rust][Parquet] 列写入器错误:添加新数据页时检查字典编码器
- ARROW-5130 - [Python] 在 Pyarrow 之后导入 TensorFlow 时发生段错误
- ARROW-5132 - [Java] 使用 Visual Studio 2017 在 Windows 上构建 gandiva_jni.dll 时出错
- ARROW-5138 - [Python/C++] 行组检索无法正确恢复索引
- ARROW-5142 - [CI] 修复 AppVeyor 脚本中的 conda 调用
- ARROW-5144 - [Python] ParquetDataset 和 ParquetPiece 不可序列化
- ARROW-5146 - [Dev] 合并脚本强制使用目录名称
- ARROW-5147 - [C++] 构建时出错:找不到 DoubleConversion
- ARROW-5148 - [CI] [C++] 与 LLVM 相关的编译错误
- ARROW-5149 - [Packaging][Wheel] 在 Windows 构建中将 LLVM 固定到版本 7
- ARROW-5152 - [Python] 构建时 CMake 警告
- ARROW-5159 - 无法在 arrow crate 中构建 benchmarks。
- ARROW-5160 - [C++] ABORT_NOT_OK 对表达式求值两次
- ARROW-5166 - [Python][Parquet] uint64 列的统计信息可能会溢出
- ARROW-5167 - [C++] 将 string-view-light 升级到最新版本
- ARROW-5169 - [Python] 在 Table.from_pandas 中,不可为空的字段将转换为可为空的字段
- ARROW-5173 - [Go] 处理多个背靠背连接的流
- ARROW-5174 - [Go] 为 DataTypes 实现 Stringer
- ARROW-5177 - [Python] ParquetReader.read_column() 不检查边界
- ARROW-5183 - [CI] AppVeyor 上的 MinGW 构建失败
- ARROW-5184 - [Rust] 损坏的链接和其他文档警告
- ARROW-5194 - [C++][Plasma] TEST(PlasmaSerialization, GetReply) 失败
- ARROW-5195 - [Python] read_csv 忽略字符串类型的 null_values
- ARROW-5201 - [Python] 在 Python 3.7 中,从 collections 导入 ABC 已被弃用
- ARROW-5208 - [Python] 当存在掩码时,pa.array() 中强制转换期间的结果类型不一致
- ARROW-5214 - [C++] 离线依赖下载器会遗漏一些库
- ARROW-5217 - [Rust] [CI] DataFusion 测试失败
- ARROW-5232 - [Java] 在 clear/setSafe 循环的情况下,值向量大小迅速增加
- ARROW-5233 - [Go] 迁移到新的 flatbuffers-v1.11.0
- ARROW-5237 - [Python] pandas 元数据中的 pandas_version 键不再填充
- ARROW-5240 - [C++][CI] cmake_format 0.5.0 似乎会使构建失败
- ARROW-5242 - [C++] 由于收窄,Arrow 无法使用 Visual Studio 2017 Update 9 或更高版本进行干净编译
- ARROW-5243 - [Java][Gandiva] 添加十进制比较函数的测试
- ARROW-5245 - [C++][CI] 取消固定 cmake_format
- ARROW-5246 - [Go] 在 CI 中使用 Go-1.12
- ARROW-5249 - [Java] Flight 客户端在某些情况下无法正确处理身份验证
- ARROW-5253 - [C++] 外部 Snappy 在 Alpine 上失败
- ARROW-5254 - [Flight][Java] DoAction 不支持结果流
- ARROW-5255 - [Java] 实现用户定义的数据类型 API
- ARROW-5260 - [Python][C++] 在全新的进程中从组件反序列化时崩溃
- ARROW-5274 - [JavaScript] countBy 的数组类型错误
- ARROW-5285 - [C++][Plasma] 删除 GPU 对象时,GpuProcessHandle 未释放
- ARROW-5293 - [C++] 对 DictionaryArray 使用内核不会保留有序标志
- ARROW-5294 - [CI] setuptools_scm 失败
- ARROW-5296 - [Java] 零星的 Flight 测试失败
- ARROW-5301 - [Python] 关于 nthreads 参数的 parquet 文档已过时
- ARROW-5306 - [CI] [GLib] 禁用 GTK-Doc
- ARROW-5308 - [Go] 删除已弃用的 Feather 格式
- ARROW-5314 - [Go] 带有偏移量的字符串数组的打印不正确
- ARROW-5325 - [Archery][Benchmark] 从基准测试差异 cli 命令输出格式正确的 jsonlines
- ARROW-5330 - [Python] [CI] 在 Travis-CI 上运行 Python Flight 测试
- ARROW-5332 - [R] R 包构建/安装失败:dyn.load() 中出错
- ARROW-5348 - [CI] [Java] Gandiva checkstyle 失败
- ARROW-5360 - [Rust] 2019-05-16+ 的 nightly 版本破坏了 rustyline 的构建
- ARROW-5362 - [C++] 压缩往返测试可能导致某些消毒剂失败
- ARROW-5371 - [Release] 为 dev/release/00-prepare.sh 添加测试
- ARROW-5373 - [Java] 添加有关 Gandiva Java 构建的缺失详细信息
- ARROW-5376 - [C++] 在 gcc 5.4.0 上编译失败
- ARROW-5383 - [Go] 更新 IPC flatbuf(新的 Duration 类型)
- ARROW-5387 - [Go] 正确处理列表的子切片
- ARROW-5388 - [Go] 在 array.NewChunked 中使用 arrow.TypeEqual
- ARROW-5390 - [CI] Travis 上超出作业时间限制
- ARROW-5397 - 测试 Flight TLS 支持
- ARROW-5398 - [Python] URI 更改导致 Flight 测试中断
- ARROW-5403 - [C++] 测试失败未在 Windows 共享构建中传播
- ARROW-5411 - [C++][Python] 在 Mac OS Mojave 上构建时出现构建错误
- ARROW-5412 - [Java] 集成测试因 UnsupportedOperationException 而失败
- ARROW-5419 - [C++] CSV strings_can_be_null 选项不遵守所有 null_values
- ARROW-5421 - [Packaging][Crossbow] 每日测试配置中的重复键
- ARROW-5430 - [Python] 可以读取但不能写入基于大整数分区的 parquet
- ARROW-5435 - [Java] 为 IntervalYearVector#getAsStringBuilder 添加测试
- ARROW-5437 - [Python] parquet 测试缺少 pandas pytest 标记
- ARROW-5446 - [C++] 使用 cmake 标头安装目录而不是 include
- ARROW-5448 - [CI] AppVeyor 上的 MinGW 构建失败
- ARROW-5453 - [C++] 刚发布的 cmake-format 0.5.2 破坏了构建
- ARROW-5455 - [Rust] 2019-05-30 Rust nightly 版本破坏了构建
- ARROW-5456 - [GLib][Plasma] 安装的 plasma-glib 可能会用于构建文档
- ARROW-5457 - [GLib][Plasma] 测试的环境变量名称错误
- ARROW-5459 - [Go] 为 Float16 DataType 实现 Stringer
- ARROW-5462 - [Go] 支持写入零长度列表
- ARROW-5479 - [Rust] [DataFusion] 使用 ARROW_TEST_DATA 而不是相对路径进行测试
- ARROW-5487 - [CI] [Python] 文档构建失败
- ARROW-5493 - [集成/Go] 为 IPC 集成测试添加 Go 支持
- ARROW-5507 - [Plasma] [CUDA] 编译错误
- ARROW-5514 - [C++] uint64 的打印输出显示错误的值
- ARROW-5517 - [C++] 头文件集合的 CMake 逻辑应该只考虑不包含目录的文件名
- ARROW-5520 - [C++][打包] AArch64C 上没有 NVidia CUDA 工具包
- ARROW-5521 - [打包] 使用 Apache RAT 0.13 时许可证检查失败
- ARROW-5528 - 连接空二进制数组时 Concatenate() 崩溃。
- ARROW-5532 - [JS] 字段元数据未读取
- ARROW-5551 - [Go] 无效的 FixedSizeArray 表示
- ARROW-5553 - [Ruby] red-arrow gem 在 ruby:2.5 docker 镜像上无法编译
- ARROW-5576 - [C++] thrift_ep tarball 下载不稳定
- ARROW-5577 - [C++] 在 Alpine Linux 上由于 googletest 共享库导致链接失败
- ARROW-5583 - [Java] 当 NullableValueHolder 的 isSet 为 0 时,不应使用 buffer 字段
- ARROW-5584 - [Java] 在 FieldReader javadoc 中添加链接引用的 import
- ARROW-5589 - [C++][模糊测试] arrow-ipc-fuzzing-test 崩溃 2354085db0125113f04f7bd23f54b85cca104713
- ARROW-5592 - [Go] 实现 Duration 数组
- ARROW-5596 - [Python] Flight 测试在 Python 2.7 上失败
- ARROW-5601 - [gandiva] 使用字符串字段的投影器时出错
- ARROW-5603 - [Python] 注册 pytest 标记以避免警告
- ARROW-5605 - [C++][模糊测试] arrow-ipc-fuzzing-test 崩溃 74aec871d14bb6b07c72ea8f0e8c9f72cbe6b73c
- ARROW-5606 - [Python] pandas.RangeIndex._start/_stop/_step 已弃用
- ARROW-5608 - [C++][parquet] 使用 parquet::arrow::ColumnReader 时无效的内存访问
- ARROW-5615 - [C++] 由于 gcc 5.4.0 Ubuntu 16.04 上的 C++11 字符串字面量导致编译错误
- ARROW-5616 - [Python] 针对 Python 2.7 头文件的 C++ 构建失败
- ARROW-5617 - [C++] 当使用 ARROW_BOOST_VENDORED=ON 时,thrift_ep 0.12.0 构建失败
- ARROW-5619 - [C++] get_apache_mirror.py 不适用于 Python 3.5
- ARROW-5623 - [CI][GLib] 在 macOS 上失败
- ARROW-5624 - [C++] -Duriparser_SOURCE=BUNDLED 已损坏
- ARROW-5626 - [C++][Gandiva] 表达式缓存也应考虑精度和刻度
- ARROW-5629 - [C++] 修复 Coverity 问题
- ARROW-5631 - [C++] CMake 3.2 构建已损坏
- ARROW-5648 - [C++] 在没有 codecvt 的情况下 mingw 构建失败
- ARROW-5654 - [C++] ChunkedArray 应验证数组的类型
- ARROW-5674 - [Python] test_parquet.py 中缺少 pandas pytest 标记
- ARROW-5675 - [文档] 修复描述在 macOS 上使用 Xcode IDE 编译/调试工作流程的文档中的错别字
- ARROW-5678 - [R][Lint] 修复 hadolint docker linting 错误
- ARROW-5693 - [Go] 跳过 Decimal128 的 IPC 集成测试
- ARROW-5697 - [GLib] c_glib/Dockerfile 已损坏
- ARROW-5698 - [R] r/Dockerfile docker-compose 构建已损坏
- ARROW-5709 - [C++] gandiva-date_time_test 在 Windows 上失败
- ARROW-5714 - [JS] Int64Builder 在有/无 BigNum 时行为不一致
- ARROW-5723 - [Gandiva][Crossbow] 构建失败
- ARROW-5728 - [Python] [CI] Travis-CI 中 test_jvm.py 失败
- ARROW-5730 - [Python][CI] 有选择地跳过 dask 集成测试中的测试用例
- ARROW-5732 - [C++] macOS 构建在 master 上由于 pmmintrin.h 的警告而莫名失败
- ARROW-5735 - [C++] Appveyor 构建在 thrift_ep 构建中持续失败
- ARROW-5737 - [C++][Gandiva] Gandiva 在 manylinux 中无法构建
- ARROW-5738 - [Crossbow][Conda] 由于缺少内在函数,OSX 包构建失败
- ARROW-5739 - [CI] 修复 docker python 构建
- ARROW-5750 - [Java] Java 编译在 master 上失败
- ARROW-5754 - [C++]缺少 ~GrpcStreamWriter 的 override?
- ARROW-5765 - [C++] TestDictionary.Validate 测试在 release 构建中崩溃
- ARROW-5769 - [Java] org.apache.arrow.flight.TestTls 通过 dev/release/00-prepare.sh 失败
- ARROW-5770 - [C++] 修复 result.h 中的 -Wpessimizing-move
- ARROW-5771 - [Python] Docker python-nopandas 作业失败
- ARROW-5774 - [Java][文档] 记录 flight 需要检出 git 子模块
- ARROW-5781 - [Archery] 确保基准测试克隆接受修订中的远程
- ARROW-5791 - [Python] pyarrow.csv.read_csv 挂起 + 耗尽所有 RAM
- ARROW-5816 - [Release] 并行 curl 在 verify-release-candidate-sh 中无法可靠工作
- ARROW-5824 - [Gandiva] [C++] 修复十进制 null
- ARROW-61 - [Java] 方法可以返回大于 long MAX_VALUE 的值