Apache Arrow 0.14.0 (2019年7月4日)
这是一个涵盖超过3个月开发的大版本发布。
下载
贡献者
此版本包括来自78位不同贡献者的570次提交。
$ git shortlog -sn apache-arrow-0.13.0..apache-arrow-0.14.0
67 Antoine Pitrou
62 Wes McKinney
37 Sebastien Binet
34 Sutou Kouhei
25 Kouhei Sutou
24 Neal Richardson
22 Romain Francois
21 Joris Van den Bossche
20 Benjamin Kietzman
19 Micah Kornfield
18 Krisztián Szűcs
16 David Li
16 François Saint-Jacques
14 Yosuke Shiro
11 Pindikura Ravindra
11 Praveen
10 liyafan82
10 tianchen
7 Kenta Murata
7 Neville Dipale
7 Renjie Liu
6 Chao Sun
6 Deepak Majeti
6 Hatem Helal
5 Andy Grove
4 Brian Hulette
4 Bryan Cutler
4 Eric Erhardt
4 Zhuo Peng
4 ptaylor
4 shengjun.li
3 Marco Neumann
3 Philipp Moritz
3 Prudhvi Porandla
3 Renat Valiullin
3 TP Boudreau
3 Zhiyuan Zheng
2 Fabio B. Silva
2 HyukjinKwon
2 John Muehlhausen
2 Prashanth Govindarajan
2 alexandreyc
2 shyam
1 Alex Sergeev
1 Anatoly Myachev
1 Anson Qian
1 Frank Wessels
1 Gidon Gershinsky
1 Guillaume Horel
1 Ivan Sadikov
1 Jamie Blondin
1 Javier Luraschi
1 Jim Walker
1 Johannes Luong
1 Jonathan A. Sternberg
1 Kevin Gurney
1 MASAMIKI
1 Mark Cafaro
1 Masayuki Takahashi
1 Miguel Cabrera
1 Nuno Sucena Almeida
1 Pearu Peterson
1 Robin Kåveland Hansen
1 Rok
1 Ryan Murray
1 Takuya Kato
1 Yngve Sekse Kristiansen
1 Yuqi Gu
1 Yurui Zhou
1 Zhijun Fu
1 daslu
1 dlekkas
1 emkornfield
1 praveenbingo
1 rjzamora
1 siddharth
1 tianchen92
1 tiger
补丁提交者
以下 Apache 提交者将贡献的补丁合并到仓库中。
$ git shortlog -csn apache-arrow-0.13.0..apache-arrow-0.14.0
213 Wes McKinney
67 Antoine Pitrou
40 Sutou Kouhei
36 Krisztián Szűcs
36 Sebastien Binet
34 Micah Kornfield
33 Kouhei Sutou
22 Pindikura Ravindra
19 Romain Francois
18 Chao Sun
16 François Saint-Jacques
10 Uwe L. Korn
6 Bryan Cutler
4 Brian Hulette
4 Yosuke Shiro
3 GitHub
2 Andy Grove
2 Philipp Moritz
2 Sidd
1 Deepak Majeti
1 Robert Nishihara
1 ptaylor
更新日志
新功能和改进
- ARROW-1012 - [C++] 创建一个可配置的 RecordBatchReader 实现,用于从 Apache Parquet 文件中读取数据
- ARROW-1207 - [C++] 实现 Map 逻辑类型
- ARROW-1261 - [Java] 为 Map 逻辑类型添加容器类型
- ARROW-1278 - Fixed Size List 类型的集成测试
- ARROW-1279 - [集成][Java] Map 类型的集成测试
- ARROW-1280 - [C++] 实现 Fixed Size List 类型
- ARROW-1496 - [JS] 上传覆盖率数据到 codecov.io
- ARROW-1558 - [C++] 实现布尔选择内核
- ARROW-1774 - [C++] 添加 "view" 函数,为兼容类型创建零拷贝视图(如果支持)
- ARROW-1957 - [Python] 使用新的 NANO 逻辑类型 Parquet 单元写入纳秒级时间戳
- ARROW-1983 - [Python] 添加写入 parquet `_metadata` 文件的功能
- ARROW-2057 - [Python] 在 pyarrow.parquet.write_table 中配置数据页的大小
- ARROW-2102 - [C++] 实现 take 内核函数 - 原始值类型
- ARROW-2103 - [C++] 实现 take 内核函数 - 字符串/二进制值类型
- ARROW-2104 - [C++] 实现 take 内核函数 - 嵌套数组值类型
- ARROW-2105 - [C++] 实现 take 内核函数 - 正确处理特殊索引
- ARROW-2217 - [C++] 添加选项以对压缩库依赖项使用动态链接
- ARROW-2298 - [Python] 添加选项,在转换为整数 Arrow 类型时不将 NaN 视为空值
- ARROW-2412 - [集成] 添加嵌套字典集成测试
- ARROW-2467 - [Rust] 使用 Flatbuffers 生成代码
-
ARROW-2517 - [Java] 添加列表
写入器 - ARROW-2707 - [C++] 使用 Column::Slice 实现 Table::Slice 方法
- ARROW-2796 - [C++] 简化 symbols.map 文件,在构建 libarrow_python 时使用
- ARROW-2818 - [Python] 将 SparseDataFrame 传入 Table.from_pandas 时提供更好的错误信息
- ARROW-2835 - [C++] ReadAt/WriteAt 与移动文件位置不一致
- ARROW-2969 - [R] 在 StructArray 和每个单元格中包含数据帧的“嵌套”data.frame 列之间进行转换
- ARROW-2981 - [C++] 支持在代码库上运行 clang-tidy 的脚本/文档
- ARROW-3040 - [Go] 添加对比较数组的支持
- ARROW-3041 - [Go] 添加对 TimeArray 的支持
- ARROW-3052 - [C++] 检测 ORC 系统包
- ARROW-3087 - [C++] 为与标量的比较操作添加内核
- ARROW-3144 - [C++] 将 "dictionary" 成员从 DictionaryType 移动到 ArrayData,以允许在 Array 块之间更改字典
- ARROW-3150 - [Python] 在 Linux 和 Windows 上发布支持 Flight 的 Python wheel 包
- ARROW-3166 - [C++] 整合 arrow/io 和 parquet-cpp 中使用的 IO 接口
- ARROW-3191 - [Java] 添加对 ArrowBuf 指向任意内存的支持
- ARROW-3200 - [C++] 添加对读取带字典的 Flight 流的支持
- ARROW-3290 - [C++] 对安全 gRPC 的工具链支持
- ARROW-3294 - [C++] 在 Windows / Appveyor 上测试 Flight RPC
- ARROW-3314 - [R] 构建时使用 pkg-config 设置 -rpath
- ARROW-3419 - [C++] 将 include-what-you-use 检查作为夜间构建运行
- ARROW-3459 - [C++][Gandiva] 添加对可变长度输出向量的支持
-
ARROW-3475 - [C++] Int64Builder.Finish(NumericArray
) - ARROW-3572 - [打包] 正确处理 crossbow 的 ssh 源 url
- ARROW-3671 - [Go] 实现 Interval 数组
- ARROW-3676 - [Go] 实现 Decimal128 数组
- ARROW-3679 - [Go] 实现 IPC 协议
- ARROW-3680 - [Go] 实现 Float16 数组
- ARROW-3686 - [Python] 在 to/from numpy 中支持掩码数组
- ARROW-3729 - [C++] 支持写入 TIMESTAMP_NANOS Parquet 元数据
- ARROW-3732 - [R] 添加将 RecordBatch 或 Schema 写入 Message 值,然后读回的函数
- ARROW-3758 - [R] 在 Windows 上构建 R 库,并为 Windows 开发者编写构建说明文档
- ARROW-3759 - [R][CI] 在 Appveyor 中进行 Windows 上的构建和测试
- ARROW-3767 - [C++] 添加从 Null 到任何类型的转换
- ARROW-3780 - [R] 获取数据失败:收集 int16 时数据无效
- ARROW-3791 - [C++] 为 CSV 文件中的布尔值添加类型推断
- ARROW-3794 - [R] 考虑将 INT8 映射到 integer() 而不是 raw()
- ARROW-3804 - [R] 考虑降低所需的 R 运行时版本
- ARROW-3810 - [R] 用于 Array 和 ChunkedArray 的 type= 参数
- ARROW-3811 - [R] 结构体数组推断
- ARROW-3814 - [R] RecordBatch$from_arrays()
- ARROW-3815 - [R] 优化记录批处理工厂
- ARROW-3848 - [R] 允许在 RandomAccessFile$Read() 中省略 nbytes
- ARROW-3897 - [MATLAB] 添加 MATLAB 支持,将数值数据类型写入 Feather 文件
- ARROW-3904 - [C++/Python] 验证 decimal128 类型的 scale 和 precision
- ARROW-4013 - [文档][C++] 记录如何在 MSYS2 上构建 Apache Arrow
- ARROW-4020 - [发布] 在发布投票通过后,从开发分发系统中移除源文件
- ARROW-4036 - [C++] 使状态码可插拔
- ARROW-4047 - [Python] 在 Parquet 文档中记录 int96 时间戳的使用和选项
- ARROW-4086 - [Java] 添加用于调试内存分配失败的 API
- ARROW-4121 - [C++] 从 InvertKernel 中重构内存分配
- ARROW-4159 - [C++] 检查 -Wdocumentation 问题
- ARROW-4194 - [格式] Metadata.rst 没有为 Timestamp 类型指定时区
- ARROW-4302 - [C++] 将 OpenSSL 添加到 C++ 构建工具链中
- ARROW-4337 - [C#] Array / RecordBatch Builder 流式 API
- ARROW-4343 - [C++] 在 docker-compose 设置中添加尽可能完整的 Ubuntu Trusty / 14.04 构建
- ARROW-4356 - [CI] 为 turbodbc 添加集成(docker)测试
- ARROW-4452 - [Python] 序列化稀疏 torch 张量
- ARROW-4453 - [Python] 为 SparseTensor 创建 Cython 包装器
- ARROW-4467 - [Rust] [DataFusion] 为 DataFusion 创建一个 REPL 和 Dockerfile
- ARROW-4503 - [C#] ArrowStreamReader 分配和复制数据过多
- ARROW-4504 - [C++] 减少单元测试可执行文件的数量
- ARROW-4505 - [C++] 为 date32 提供更好的 PrettyPrint
- ARROW-4566 - [C++][Flight] 添加选项以针对在不同主机上运行的性能服务器运行 arrow-flight-benchmark
- ARROW-4596 - [Rust] [DataFusion] 实现 COUNT 聚合函数
- ARROW-4622 - [C++] [Python] UnionArray 中的 MakeDense 和 MakeSparse 应接受一个 Field 向量
- ARROW-4625 - [Flight] 包装服务器忙等待方法
- ARROW-4626 - [Flight] 向 DoGet 添加应用程序元数据字段
- ARROW-4627 - [Flight] 向 DoPut 添加应用程序元数据字段
- ARROW-4701 - [C++] 添加 JSON 分块器基准测试
- ARROW-4702 - [C++] 升级依赖版本
- ARROW-4708 - [C++] 添加多线程 JSON 读取器
- ARROW-4714 - [C++][Java] 提供 JNI 接口以通过 Arrow C++ 读取 ORC 文件
- ARROW-4717 - [C#] 考虑公开 ValueTask 而不是 Task
- ARROW-4719 - [C#] 在 C# 中实现 ChunkedArray、Column 和 Table
- ARROW-4741 - [Java] 为所有类添加文档并为类 javadocs 启用 checkstyle
- ARROW-4787 - [C++] 在哈希内核操作中包含“null”值(可能带有开关选项)
- ARROW-4788 - [C++] 开发更简洁的 API 用于构造 StructArray
- ARROW-4800 - [C++] 创建/移植 StatusOr 实现,以便能够返回状态或类型
- ARROW-4805 - [Rust] 将时间数组写入 CSV
- ARROW-4806 - [Rust] 支持在 cast 内核中转换时间数组
- ARROW-4824 - [Python] read_csv 应接受 io.StringIO 对象
- ARROW-4827 - [C++] 实现两个 git 修订版本之间的基准比较
- ARROW-4847 - [Python] 添加 pyarrow.table 工厂函数,根据输入类型分派到不同的构造函数
- ARROW-4904 - [C++] 将 arrow/ipc/test-common.h 中的实现移动到 libarrow_testing
- ARROW-4911 - [R] 支持为 Windows 构建包
- ARROW-4912 - [C++, Python] 允许为 CSV 读取器指定列名
- ARROW-4913 - [Java][内存] 限制 ledgers 和 arrowbufs 的数量
- ARROW-4945 - [Flight] 在 Travis 中启用 Flight 集成测试
- ARROW-4956 - [C#] 允许 ArrowBuffers 在 C# 中包装外部内存
- ARROW-4959 - [Gandiva][Crossbow] 构建中断
- ARROW-4968 - [Rust] StructArray 构建器和 From<> 方法应检查字段类型是否与模式匹配
- ARROW-4971 - [Go] DataType 相等性
- ARROW-4972 - [Go] 数组相等性
- ARROW-4973 - [Go] 切片数组相等性
- ARROW-4974 - [Go] 数组近似相等性
- ARROW-4990 - [C++] 用于比较数组与数组的内核
- ARROW-4993 - [C++] 在 CMake 配置结束时显示摘要
- ARROW-5000 - [Python] 修复 setup.py 中的弃用警告
- ARROW-5007 - [C++] 将 DCHECK 移出 sse-utils
- ARROW-5020 - [C++][Gandiva] 将与 Gandiva 相关的 conda 包拆分到单独的 .yml conda 环境文件中
- ARROW-5027 - [Python] 添加 JSON 读取器
- ARROW-5038 - [Rust] [DataFusion] 实现 AVG 聚合函数
- ARROW-5039 - [Rust] [DataFusion] 修复 CAST 支持中的错误
- ARROW-5045 - [Rust] CI 中的代码覆盖率静默失败
- ARROW-5053 - [Rust] [DataFusion] 使用环境变量指定 arrow 测试数据的位置
- ARROW-5054 - [C++][发布] 在 verify-release-candidate.sh 中测试 Flight
- ARROW-5056 - [打包] 调整 conda recipes 以在 unix 系统上使用 ORC conda-forge 包
- ARROW-5061 - [发布] 提高 03-binary 的性能
- ARROW-5062 - [Java] 为 Flight 遮蔽 Java Guava 依赖
- ARROW-5063 - [Java] FlightClient 不应创建子分配器
- ARROW-5064 - [发布] 将 PKG_CONFIG_PATH 传递给验证脚本中的 glib
- ARROW-5066 - [集成] 在 integration/integration_test.py 中添加标志以启用/禁用实现
- ARROW-5071 - [基准测试] 使用 archery 执行基准测试运行
- ARROW-5076 - [打包] 提高二进制上传后的性能
- ARROW-5077 - [Rust] 发布过程应更改 Cargo.toml 以使用发布版本
- ARROW-5078 - [文档] Sphinx 因 RemovedInSphinx30Warning 而失败
- ARROW-5079 - [发布] 添加一个脚本来发布 C# 包
- ARROW-5080 - [发布] 添加一个脚本来发布 Rust 包
- ARROW-5081 - [C++] 在 CMake 配置中一致使用 PATH_SUFFIXES
- ARROW-5082 - [Python][打包] 减小 macOS 和 manylinux1 wheel 包的大小
- ARROW-5083 - [开发者] 在 merge_arrow_pr.py 脚本中,允许用户设置已发布的修复版本
- ARROW-5088 - [C++] 在发布模式下使用 BUILD_WARNING_LEVEL=CHECKIN 时不设置 -Werror
- ARROW-5091 - [Flight] 将 FlightGetInfo 消息重命名为 FlightInfo
- ARROW-5093 - [打包] 添加对选择性二进制上传的支持
- ARROW-5094 - [打包] 添加 APT/Yum 验证脚本
- ARROW-5102 - [C++] 减少头文件依赖
- ARROW-5108 - [Go] 实现从 Arrow 文件读取原始数组
- ARROW-5109 - [Go] 实现从 Arrow 文件读取二进制/字符串数组
- ARROW-5110 - [Go] 实现从 Arrow 文件读取结构体数组
- ARROW-5111 - [Go] 实现从 Arrow 文件读取列表数组
- ARROW-5112 - [Go] 实现将数组写入 Arrow 文件
- ARROW-5113 - [C++][Flight] C++ 中 DoPut 的单元测试
- ARROW-5115 - [JS] 实现 Vector Builders
- ARROW-5116 - [Rust] 将内核相关文件移动到 compute/kernels 下
- ARROW-5124 - [C++] 在 MinGW 构建中添加对 Parquet 的支持
- ARROW-5126 - [Rust] [Parquet] 将 parquet 列描述符转换为 arrow 数据类型
- ARROW-5127 - [Rust] [Parquet] 添加页迭代器
- ARROW-5136 - [Flight] 实现调用选项(超时)
- ARROW-5137 - [Flight] 实现身份验证 API
- ARROW-5145 - [C++] 发布模式缺少方便的输入验证
- ARROW-5150 - [Ruby] 添加 Arrow::Table#raw_records
- ARROW-5155 - [GLib][Ruby] 添加从数据类型构建联合数组的支持
- ARROW-5157 - [网站] 将 MATLAB 添加到“由 Apache Arrow 驱动”页面
- ARROW-5162 - [Rust] [Parquet] 将 mod reader 重命名为 arrow。
- ARROW-5163 - [Gandiva] 转换时间戳/日期时错误地将 0097 年评估为 1997 年
- ARROW-5164 - [Gandiva] [C++] 引入 32 位哈希函数
- ARROW-5165 - [Python][文档] 构建文档未建议分配 $ARROW_BUILD_TYPE
- ARROW-5168 - [GLib] 添加 garrow_array_take()
- ARROW-5171 - [C++] 在比较枚举选项中使用 LESS 而不是 LOWER。
- ARROW-5172 - [Go] 实现从 Arrow 文件中读取固定大小二进制数组
- ARROW-5178 - [Python] 允许从 Python 字典创建 Table
- ARROW-5179 - [Python] 在 Python 3.7+ 上返回普通字典,而不是 OrderedDict
- ARROW-5185 - [C++] 添加对带 CMake 配置文件的 Boost 的支持
- ARROW-5187 - [Rust] 将 StructArray 扁平化为 RecordBatch 的能力
- ARROW-5188 - [Rust] 为 StructArray 添加时间构建器
- ARROW-5189 - [Rust] [Parquet] 格式化 parquet 行中的单个字段
- ARROW-5190 - [R] 讨论:R 包中的 tibble 依赖
- ARROW-5191 - [Rust] 公开 CSV 和 JSON 读取器模式
- ARROW-5203 - [GLib] 添加对比较过滤器的支持
- ARROW-5204 - [C++] 提高 BufferBuilder 的性能
- ARROW-5212 - [Go] Go 库中的 Array BinaryBuilder 无法访问以调整值缓冲区的大小
- ARROW-5218 - [C++] 改进指定第三方库位置时的构建
- ARROW-5219 - [C++] 使用 Ninja 时并行构建 protobuf_ep
- ARROW-5222 - [Python] 在 MacOS 上为开发安装 pyarrow 时出现问题
- ARROW-5225 - [Java] 提高 BaseValueVector#getValidityBufferSizeFromCount 的性能
- ARROW-5226 - [Gandiva] 支持 decimal 的比较运算符
- ARROW-5238 - [Python] 提高 pyarrow.dictionary 函数的可用性
- ARROW-5241 - [Python] 添加选项以禁止向 parquet 文件写入统计信息
- ARROW-5250 - [Java] 移除方法上的 javadoc 抑制。
- ARROW-5252 - [C++] 更改变体实现
- ARROW-5256 - [打包][deb] 使用 LLVM 7.1.0 构建失败
- ARROW-5257 - [网站] 将网站更新为使用“官方”Apache Arrow 徽标,并添加指向徽标的明确标记链接
- ARROW-5258 - [C++/Python] 将数据集片段的文件元数据公开给调用者
- ARROW-5261 - [C++] 完成 Duration 和 Interval 标量类型的实现
- ARROW-5262 - [Python] 修复拼写错误
- ARROW-5264 - [Java] 允许通过环境变量启用/禁用边界检查
- ARROW-5266 - [Go] 实现 Float16 的读/写 IPC
- ARROW-5268 - [GLib] 添加 GArrowJSONReader
- ARROW-5269 - [C++] 为回归检查白名单化基准测试候选
- ARROW-5275 - [C++] 编写通用文件系统测试
- ARROW-5281 - [Rust] [Parquet] 将 DataPageBuilder 移动到 test_common
- ARROW-5284 - [Rust] 使用 std::alloc 替换 libc 进行内存分配
- ARROW-5286 - [Python] 在给定已知模式的情况下,在 Table.from_pandas 中支持 Structs
- ARROW-5288 - [文档] 丰富贡献指南
- ARROW-5289 - [C++] 将 arrow/util/concatenate.h 移动到 arrow/array/
- ARROW-5290 - [Java] 提供一个标志来启用/禁用向量 get 方法中的空值检查
- ARROW-5291 - [Python] 为 Array 上的 "take" 内核添加包装器
- ARROW-5298 - [Rust] 为 Buffer 添加调试实现
- ARROW-5299 - [C++] ListArray 比较不正确
- ARROW-5309 - [Python] 为返回新对象的 Python "append" 方法添加说明
- ARROW-5311 - [C++] 在 Take 内核中返回更具体的无效状态
- ARROW-5313 - [格式] Field 表上的注释有点令人困惑
- ARROW-5317 - [Rust] [Parquet] 为 SerializedFileReader 实现 IntoIterator
- ARROW-5319 - [CI] 在 MinGW 构建中启用 ccache
- ARROW-5321 - [Gandiva][C++] 为 utf8 和二进制类型添加 isnull 和 isnotnull
- ARROW-5323 - [CI] 在 clcache 中使用压缩
- ARROW-5328 - [R] 添加 shell 脚本以在本地进行完整的包重建和测试
- ARROW-5329 - 添加支持在 MATLAB 内部直接为 Feather 构建 MATLAB 接口
- ARROW-5334 - [C++] 将 "Type" 添加到 arrow::Integer、arrow::FloatingPoint 类的名称中以保持一致性
- ARROW-5335 - [Python] 转换到 pandas 时,对可变字典引发错误
- ARROW-5339 - [C++] 将 jemalloc 添加到第三方依赖下载脚本中
- ARROW-5341 - [C++] 添加关于在本地修复和测试 -Wdocumentation clang 警告的说明
- ARROW-5342 - [格式] 在 IPC 协议中正式化扩展类型元数据
- ARROW-5346 - [C++] 恢复对 vendored date 代码中限定 duration 的更改
- ARROW-5349 - [Python/C++] 提供一种方法在 parquet ColumnChunkMetaData 中指定文件路径
- ARROW-5361 - [R] 遵循 ARROW-3144 的 DictionaryType/DictionaryArray 更改
- ARROW-5363 - [GLib] 修复编码风格
- ARROW-5364 - [C++] 在 BuildUtils.cmake 注释中使用 ASCII 而不是 UTF-8
- ARROW-5365 - [C++][CI] 将 UBSan 和 ASAN 添加到 CI 中
- ARROW-5368 - [C++] 在 MinGW 中默认禁用 jemalloc
- ARROW-5369 - [C++] 在 Windows 上添加对 glog 的支持
- ARROW-5370 - [C++] 默认检测系统 uriparser
- ARROW-5372 - [GLib] 添加对 null/boolean 值 CSV 读取选项的支持
- ARROW-5378 - [C++] 添加本地 FileSystem 实现
- ARROW-5380 - [C++] 修复并启用 UBSan 以检测未对齐访问。
- ARROW-5384 - [Go] 添加 FixedSizeList 数组
- ARROW-5389 - [C++] 添加内部临时目录 API
- ARROW-5392 - [C++][CI][MinGW] 在 AppVeyor 上禁用静态库构建
- ARROW-5393 - [R] 为 read_parquet() 添加测试和示例
- ARROW-5395 - [C++] 在文件格式中利用流 EOS
- ARROW-5396 - [JS] 确保读取器和写入器支持没有 RecordBatches 的文件和流
- ARROW-5401 - [CI] [C++] 在 Travis-CI 上打印 ccache 统计信息
- ARROW-5404 - [C++] nonstd::string_view 与 c++17 中的 std::string_view 冲突
- ARROW-5407 - [C++] 集成测试 Travis CI 条目构建了许多不必要的目标
- ARROW-5413 - [C++] CSV 读取器不移除 BOM
- ARROW-5415 - [发布] 发布脚本应在所有地方更新 R 版本
- ARROW-5416 - [网站] 将 Homebrew 添加到项目安装页面
- ARROW-5418 - [CI][R] 运行代码覆盖率并报告给 codecov.io
- ARROW-5420 - [Java] 在 VariableWidthVector 中实现或移除 getCurrentSizeInBytes
- ARROW-5427 - [Python] RangeIndex 序列化更改的影响
- ARROW-5428 - [C++] 添加选项以在 arrow::io::BufferedInputStream 中设置“读取范围”
- ARROW-5429 - [Java] 提供替代的缓冲区分配策略
- ARROW-5432 - [Python] 将 'read_at' 方法添加到 pyarrow.NativeFile
- ARROW-5433 - [C++][Parquet] 改进 parquet-reader 的列信息
- ARROW-5434 - [Java] 为 ARROW-3191 中的 ArrowBuf 更改引入向后兼容的包装器
- ARROW-5436 - [Python] 在 parquet.read_table 中公开 filters 参数
- ARROW-5438 - [JS] 在文件格式中利用流 EOS
- ARROW-5441 - [C++] 实现 FindArrowFlight.cmake
- ARROW-5442 - [网站] 澄清什么使发布工件成为“官方”
- ARROW-5443 - [Gandiva][Crossbow] 关闭 parquet 加密
- ARROW-5447 - [CI] [Ruby] CI 在 AppVeyor 上失败
- ARROW-5449 - [C++] 本地文件系统实现:研究 Windows UNC 路径
- ARROW-5451 - [C++][Gandiva] 为 decimals 添加舍入函数
- ARROW-5452 - [R] 添加文档网站 (pkgdown)
- ARROW-5461 - [Java] 为 Float8Vector 和分配器添加微基准测试
- ARROW-5463 - [Rust] 为 Buffer 实现 AsRef
- ARROW-5464 - [Archery] 错误的 --benchmark-filter 默认值
- ARROW-5465 - [Crossbow] 支持将提交的作业定义 yaml 写入文件
- ARROW-5466 - [Java] 在 Travis CI 中对 Java 构建进行 Docker 化,在单个条目中运行多个 JDK
- ARROW-5467 - [Go] 实现 Time32/Time64 数组的读/写 IPC
- ARROW-5468 - [Go] 实现 Timestamp 数组的读/写 IPC
- ARROW-5469 - [Go] 实现 Date32/Date64 数组的读/写 IPC
- ARROW-5470 - [CI] C++ 本地文件系统补丁破坏了 Travis R 作业
- ARROW-5472 - [开发] 如果未设置 JIRA 组件,则向 PR 合并工具添加警告
- ARROW-5474 - [C++] 记录所需的 Boost 版本
- ARROW-5476 - [Java][内存] 修复 Netty ArrowBuf Slice
- ARROW-5477 - [C++] 检查所需的 RapidJSON 版本
- ARROW-5478 - [打包] 放弃对 Ubuntu 14.04 的支持
- ARROW-5481 - [GLib] garrow_seekable_input_stream_peek() 缺少 "error" 参数文档
- ARROW-5483 - [Java] 添加接受 Field 对象的 ValueVector 构造函数
- ARROW-5485 - [Gandiva][Crossbow] OSx 构建失败
- ARROW-5486 - [GLib] 添加 gandiva::FunctionRegistry 及相关内容的绑定
- ARROW-5488 - [R] 当 C++ 库不可用时的变通方法
- ARROW-5490 - [C++] 移除 ARROW_BOOST_HEADER_ONLY
- ARROW-5491 - [C++] 移除 MACRO 定义后不必要的分号
- ARROW-5492 - [R] 为 read_* 函数添加 "col_select" 参数以读取列的子集
- ARROW-5495 - [C++] 一致地使用 HTTPS 下载依赖项
- ARROW-5496 - [R][CI] 修复 R codecov.io 报告中的相对路径
- ARROW-5498 - [C++] 使用 Flatbuffers 1.11.0 和 MinGW 构建失败
- ARROW-5500 - [R] read_csv_arrow() 签名应与 readr::read_csv() 匹配
- ARROW-5503 - [R] 添加 read_json()
- ARROW-5504 - [R] 将 use_threads 参数移动到全局选项
- ARROW-5509 - [R] write_parquet()
- ARROW-5511 - [打包] 在 Conda 包中启用 Flight
- ARROW-5512 - [C++] 为 Datasets 项目起草初始公共 API
- ARROW-5513 - [Java] 重构方法名 getstartOffset 以使用驼峰命名法
- ARROW-5516 - [Python] pyarrow 的开发页面在使用 pip 时缺少依赖项
- ARROW-5518 - [Java] 在 allocateNew 和 clear 时将 VectorSchemaRoot rowCount 设置为 0
- ARROW-5524 - [C++] 如果未找到 OpenSSL,则在 CMake 中关闭 PARQUET_BUILD_ENCRYPTION
- ARROW-5526 - [开发者] 在 GitHub 问题模板中添加更醒目的通知,以将错误报告引导至 JIRA
- ARROW-5529 - [Flight] 允许使用多个 TLS 证书提供服务
- ARROW-5531 - [Python] 在 Array.from_buffers 中支持二进制、utf8 和嵌套类型
- ARROW-5533 - [Plasma] Plasma 客户端应是线程安全的
- ARROW-5534 - [GLib] 添加 garrow_table_concatenate()
- ARROW-5535 - [GLib] 添加 garrow_table_slice()
- ARROW-5537 - [JS] 在 RecordBatchWriter 和 DictionaryBuilder 中支持增量字典
- ARROW-5538 - [C++] 将最低 OpenSSL 版本限制为 1.0.2
- ARROW-5541 - [R] 从负 int32 到 uint32 和 uint64 的转换现在是安全的
- ARROW-5544 - [Archery] 在 `benchmark diff` 子命令中出现回归时不应返回非零值
- ARROW-5545 - [C++][文档] 在 C++ API 文档中澄清对带时区的时间戳的 UTC 值的期望
- ARROW-5547 - [C++][FlightRPC] 未提供 arrow-flight.pc
- ARROW-5552 - [Go] 使 Schema 和 Field 实现 Stringer
- ARROW-5554 - 为 arrow::Concatenate 添加一个 python 包装器
- ARROW-5555 - [R] 添加 install_arrow() 函数以帮助用户获取 C++ 运行时库
- ARROW-5556 - [文档] 记录 JSON 读取器
- ARROW-5557 - [C++] 调查 VisitBitsUnrolled 在不同平台上的性能
- ARROW-5564 - [C++] 将 uriparser 添加到 conda-forge
- ARROW-5565 - [Python] 记录如何在处理 pyarrow 时使用 gdb
- ARROW-5567 - [C++] 修复 memory-benchmark 的构建错误
- ARROW-5574 - [R] read_arrow() 的文档错误
- ARROW-5580 - 纠正 Gandiva 中时间戳函数的定义
- ARROW-5581 - [Java] 为向量排序提供接口和初始实现
- ARROW-5582 - [Go] 添加对比较 Records 的支持
- ARROW-5586 - [R] 将 LIST 类型的数组转换为 R 列表
- ARROW-5587 - [Java] 为 Java 代码添加更多 maven 风格的检查
- ARROW-5590 - [R] 如果可能,在同一个 CI 条目中运行“无 libarrow”的 R 构建
- ARROW-5591 - [Go] 实现 Duration 和 Intervals 的读/写 IPC
- ARROW-5597 - [打包][deb] 添加 Flight 包
- ARROW-5600 - [R] R 包命名空间清理
- ARROW-5602 - [Java][Gandiva] 添加 decimal 舍入函数的测试
- ARROW-5604 - [Go] 提高 type-traits 的测试覆盖率
- ARROW-5609 - [C++] 设置 CMP0068 CMake 策略以避免 macOS 警告
- ARROW-5612 - [Python][文档] 澄清 date_as_object 选项的行为
- ARROW-5621 - [Go] 实现 Decimal128 数组的读/写 IPC
- ARROW-5622 - [C++][Dataset] 未提供 arrow-dataset.pc
- ARROW-5625 - [R] 将结构体类型的数组转换为数据帧列
- ARROW-5632 - [文档] 添加一些描述在 macOS 上使用 Xcode IDE 的编译/调试工作流程的文档
- ARROW-5633 - [Python] 在 Linux wheel 包中启用 bz2
- ARROW-5635 - [C++] 支持“压缩”表
- ARROW-5637 - [Gandiva] [Java]完成 IN 表达式
- ARROW-5639 - [Java] 从 getOffsetBufferValueCapacity 中移除浮点计算
- ARROW-5641 - [GLib] 从 Git 目标中移除由 GNU Autotools 生成的枚举文件
- ARROW-5643 - [Flight] 添加覆盖主机名检查的能力
- ARROW-5650 - [Python] 更新 manylinux 依赖版本
- ARROW-5652 - [CI] 修复 iwyu docker 镜像
- ARROW-5656 - [Python] 在 macOS 上启用 Flight wheel 包
- ARROW-5659 - [C++] 添加对查找由 Homebrew 安装的 OpenSSL 的支持
- ARROW-5660 - [GLib][CI] 使用最新的 macOS 镜像和所有基于 Homebrew 的库
- ARROW-5661 - 支持 Gandiva 中 decimal 的哈希函数
- ARROW-5662 - [C++] 添加对 BOOST_SOURCE=AUTO|BUNDLED|SYSTEM 的支持
- ARROW-5663 - [打包][RPM] 为 0.14.0 更新 CentOS 包
- ARROW-5664 - [Crossbow] 在 CircleCI 而不是 Travis 上执行夜间 crossbow 测试
- ARROW-5668 - [Python] 在 Schema.__repr__ 中为不可为空的字段显示 "not null"
- ARROW-5669 - [Crossbow] manylinux1 wheel 包构建失败
- ARROW-5670 - [Crossbow] get_apache_mirror.py 在 macOS 上使用 Python 3.5 时因 TLS 错误而失败
- ARROW-5671 - [crossbow] mac os python wheel 包构建失败
- ARROW-5672 - [Java] 重构冗余的方法修饰符
- ARROW-5683 - [R] 将 snappy 添加到 Rtools Windows 构建中
- ARROW-5684 - [打包][deb] 添加对 Ubuntu 19.04 的支持
- ARROW-5685 - [打包][deb] 添加对 Apache Arrow Datasets 的支持
- ARROW-5687 - [C++] 移除对 ARROW_BOOST_VENDORED 的剩余使用
- ARROW-5690 - [打包][Python] macOS wheel 包损坏:缺少 libprotobuf.18.dylib
- ARROW-5694 - [Python] 转换为 pandas 时不支持 decimal 列表
- ARROW-5695 - [C#][发布] 在 verify-release-candidate.sh 中运行 sourcelink 测试
- ARROW-5696 - [Gandiva] [C++] 引入 castVarcharVarchar
- ARROW-5699 - [C++] 优化 CSV 中 Decimal128 的解析
- ARROW-5701 - [C++][Gandiva] 仅为所需的选择向量类型构建表达式
- ARROW-5702 - [C++] parquet::arrow::FileReader::GetSchema()
- ARROW-5704 - [C++] 停止对 SparseTensorImpl 类使用 ARROW_TEMPLATE_EXPORT
- ARROW-5705 - [Java] 优化 BaseValueVector#computeCombinedBufferSize 逻辑
- ARROW-5706 - [Java] 移除 getValidityBufferValueCapacity 中的类型转换
- ARROW-5707 - [Java] 改进 ArrowRecordBatch 的性能和代码结构
- ARROW-5710 - [C++] 允许在 Windows 上使用 Ninja 编译 Gandiva
- ARROW-5718 - [R] 在 record_batch() 和 table() 中自动拼接数据帧
- ARROW-5721 - [Rust] 将数组相关代码移动到单独的模块中
- ARROW-5724 - [R] [CI] AppVeyor 构建应使用 ccache
- ARROW-5725 - [Crossbow] 将 conda recipes 移植到 azure pipelines
- ARROW-5726 - [Java] 为 int 向量实现一个通用接口
- ARROW-5727 - [Python] [CI] 在运行测试前安装 pytest-faulthandler
- ARROW-5748 - [打包][deb] 添加对 Debian GNU/Linux buster 的支持
- ARROW-5749 - [Python] 为 Table::CombineChunks() 添加 Python 绑定
- ARROW-5751 - [打包][Python] Python macOS wheel 包对 libcares 有动态依赖
- ARROW-5752 - [Java] 提高 ArrowBuf#setZero 的性能
- ARROW-5755 - [Rust] [Parquet] 为 Type 添加派生的 clone
- ARROW-5768 - [发布] CHANGELOG.md 末尾有多余的换行符
- ARROW-5773 - [R] 发布前清理文档
- ARROW-5780 - [C++] 为 Decimal128 操作添加基准测试
- ARROW-5782 - [发布] 在 dev/release/01-perform.sh 中为 Flight 设置测试数据
- ARROW-5783 - [发布][C#] 从 RAT 检查中排除 dummy.git
- ARROW-5785 - Rust datafusion 实现不应依赖于 rustyline
- ARROW-5787 - [发布][Rust] 使用本地模块验证 RC
- ARROW-5793 - [发布] 在 dev/release/03-binary.sh 中避免重复的已知主机 SSH 错误
- ARROW-5794 - [发布] 跳过上传已上传的二进制文件
- ARROW-5795 - [发布] 为上传二进制文件添加缺失的等待
- ARROW-5796 - [发布][APT] 更新预期的包列表
- ARROW-5797 - [发布][APT] 更新支持的发行版
- ARROW-5813 - [C++] 支持检查不同连续张量的相等性
- ARROW-5818 - [Java][Gandiva] 支持可变长度输出向量
- ARROW-5820 - [发布] 从验证脚本中移除未定义变量检查
- ARROW-653 - [Python / C++] 添加调试函数以十六进制打印数组缓冲区内容
- ARROW-767 - [C++] 采用 FileSystem 抽象
- ARROW-835 - [格式] 添加 Timedelta 类型以描述时间间隔
- ARROW-840 - [Python] 提供 Python API 用于创建可在 Arrow IPC 中保留的用户定义数据类型
- ARROW-973 - [网站] 添加关于项目的常见问题页面
Bug 修复
- ARROW-1837 - [Java] 在集成测试中无法读取超出有符号范围的无符号整数
- ARROW-2119 - [C++][Java] 处理零记录批次的 Arrow 流
- ARROW-2136 - [Python] 从 pandas 转换时未检查不可为空的模式字段
- ARROW-2256 - [C++] 在 Ubuntu 16.04 上使用 LLVM apt 仓库,Fuzzer 构建开箱即用失败
- ARROW-2461 - [Python] 为 manylinux2010 标签构建 wheel 包
- ARROW-3344 - [Python] test_plasma.py 失败 (在 test_plasma_list 中)
- ARROW-3399 - [Python] 无法序列化 numpy 矩阵对象
- ARROW-3650 - [Python] 混合列索引被读回为字符串
- ARROW-3762 - [C++] 当 BinaryArray 容量溢出时,Parquet arrow::Table 读取出错
- ARROW-4021 - [Ruby] 在 msys2 上构建 red-arrow 时出错
- ARROW-4076 - [Python] 模式验证和过滤器
- ARROW-4139 - [Python] 如果设置了 UTF8 ConvertedType,则将 Parquet 列统计信息转换为 unicode
- ARROW-4301 - [Java][Gandiva] Maven 快照版本更新似乎没有更新 Gandiva 子模块
- ARROW-4324 - [Python] 从混合 numpy 标量列表创建数组时,数组 dtype 推断不正确
- ARROW-4350 - [Python] dtype=object 的数组无法转换为 list-of-list ListArray
- ARROW-4447 - [C++] 调查 libthift 的动态链接
- ARROW-4516 - [Python] 在没有 `_common_dataset` 但有空 `_tempfile` 的路径上创建 ParquetDataset 时出错
- ARROW-4523 - [JS] 添加行代理生成基准测试
- ARROW-4651 - [格式] Flight Location 应比 (host, port) 对更灵活
- ARROW-4675 - [Python] 在 py2 中序列化 bool ndarray 并在 py3 中反序列化时出错
- ARROW-4694 - [CI] detect-changes.py 不一致
- ARROW-4723 - [Python] 读取包含 parquet 文件的目录时跳过 _files
- ARROW-4725 - [C++] 在 MinGW 构建下禁用字典测试
- ARROW-4823 - [Python] read_csv 不应关闭它不拥有的文件句柄
- ARROW-4845 - [R] Windows MingW64 上的编译器警告
- ARROW-4851 - [Java] BoundsChecking.java 对旧 drill 参数的默认行为似乎不正确
- ARROW-4885 - [Python] read_csv() 无法处理 decimal128 列
- ARROW-4886 - [Rust] 将切片的原始数组转换为列表数组时行为不一致
- ARROW-4923 - 公开接受 long 和 double 输入的 Decimal 向量的 setter
- ARROW-4934 - [Python] 解决在 Python 3.8 中将成为错误的弃用通知
- ARROW-5019 - [C#] ArrowStreamWriter 在不可寻址的流上不起作用
- ARROW-5049 - [Python] 在 spark 中使用 pyarrow FileSystem 时找不到 org/apache/hadoop/fs/FileSystem 类
- ARROW-5051 - [GLib][Gandiva] 发布验证脚本中的测试失败
- ARROW-5058 - [发布] 02-source.sh 生成的电子邮件模板链接错误
- ARROW-5068 - [Gandiva][打包] 在 CMake 重构后修复 gandiva 夜间构建
- ARROW-5090 - 由于 dylib 中的 @rpath,Parquet 链接在 MacOS 上失败
- ARROW-5092 - [C#] Source Link 在 C# 发布脚本中不起作用
- ARROW-5095 - [Flight][C++] Flight DoGet 未公开服务器错误消息
- ARROW-5096 - [打包][deb] 缺少 plasma-store-server 包
- ARROW-5097 - [打包][CentOS6] arrow-lib 有无法解决的依赖项
- ARROW-5098 - [网站] 更新 0.13.0 的 APT 安装文档
- ARROW-5100 - [JS] 如果缓冲区共享相同的底层 ArrayBuffer,Writer 会交换字节顺序
- ARROW-5117 - [Go] 初始化构建器后追加零切片时出现 Panic
- ARROW-5119 - [Go] array.Boolean 的 Stringer 实现无效
- ARROW-5129 - [Rust][Parquet] 列写入器错误:添加新数据页时检查字典编码器
- ARROW-5130 - [Python] 在 Pyarrow 之后导入 TensorFlow 时出现段错误
- ARROW-5132 - [Java] 在 Windows 上使用 Visual Studio 2017 构建 gandiva_jni.dll 时出错
- ARROW-5138 - [Python/C++] 行组检索未正确恢复索引
- ARROW-5142 - [CI] 修复 AppVeyor 脚本中的 conda 调用
- ARROW-5144 - [Python] ParquetDataset 和 ParquetPiece 不可序列化
- ARROW-5146 - [开发] 合并脚本强制指定目录名
- ARROW-5147 - [C++] 构建时出错:找不到 DoubleConversion
- ARROW-5148 - [CI] [C++] LLVM 相关的编译错误
- ARROW-5149 - [打包][Wheel] 在 windows 构建中将 LLVM 固定到版本 7
- ARROW-5152 - [Python] 构建时出现 CMake 警告
- ARROW-5159 - 无法在 arrow crate 中构建 benches。
- ARROW-5160 - [C++] ABORT_NOT_OK 两次评估表达式
- ARROW-5166 - [Python][Parquet] uint64 列的统计信息可能溢出
- ARROW-5167 - [C++] 将 string-view-light 升级到最新版本
- ARROW-5169 - [Python] 在 Table.from_pandas 中,不可为空的字段被转换为可为空
- ARROW-5173 - [Go] 处理多个背靠背连接的流
- ARROW-5174 - [Go] 为 DataTypes 实现 Stringer
- ARROW-5177 - [Python] ParquetReader.read_column() 不检查边界
- ARROW-5183 - [CI] AppVeyor 上的 MinGW 构建失败
- ARROW-5184 - [Rust] 损坏的链接和其他文档警告
- ARROW-5194 - [C++][Plasma] TEST(PlasmaSerialization, GetReply) 失败
- ARROW-5195 - [Python] read_csv 忽略字符串类型上的 null_values
- ARROW-5201 - [Python] 在 Python 3.7 中,从 collections 导入 ABCs 已被弃用
- ARROW-5208 - [Python] 当存在掩码时,在 pa.array() 中转换期间结果类型不一致
- ARROW-5214 - [C++] 离线依赖下载器缺少一些库
- ARROW-5217 - [Rust] [CI] DataFusion 测试失败
- ARROW-5232 - [Java] 在 clear/setSafe 循环的情况下,值向量大小迅速增加
- ARROW-5233 - [Go] 迁移到新的 flatbuffers-v1.11.0
- ARROW-5237 - [Python] pandas 元数据中的 pandas_version 键不再被填充
- ARROW-5240 - [C++][CI] cmake_format 0.5.0 似乎导致构建失败
- ARROW-5242 - [C++] 由于缩窄转换,Arrow 无法在 Visual Studio 2017 Update 9 或更高版本上干净地编译
- ARROW-5243 - [Java][Gandiva] 添加 decimal 比较函数的测试
- ARROW-5245 - [C++][CI] 取消固定 cmake_format
- ARROW-5246 - [Go] 在 CI 中使用 Go-1.12
- ARROW-5249 - [Java] Flight 客户端在某些情况下无法正确处理身份验证
- ARROW-5253 - [C++] 外部 Snappy 在 Alpine 上失败
- ARROW-5254 - [Flight][Java] DoAction 不支持结果流
- ARROW-5255 - [Java] 实现用户定义数据类型 API
- ARROW-5260 - [Python][C++] 在一个全新的进程中从组件反序列化时崩溃
- ARROW-5274 - [JavaScript] countBy 的数组类型错误
- ARROW-5285 - [C++][Plasma] 删除 GPU 对象时未释放 GpuProcessHandle
- ARROW-5293 - [C++] 对 DictionaryArray 的 Take 内核不保留 ordered 标志
- ARROW-5294 - [CI] setuptools_scm 失败
- ARROW-5296 - [Java] 零星的 Flight 测试失败
- ARROW-5301 - [Python] parquet 文档中关于 nthreads 参数的内容已过时
- ARROW-5306 - [CI] [GLib] 禁用 GTK-Doc
- ARROW-5308 - [Go] 移除已弃用的 Feather 格式
- ARROW-5314 - [Go] 带有偏移量的字符串数组打印不正确
- ARROW-5325 - [Archery][基准测试] 从 benchmark diff cli 命令输出格式正确的 jsonlines
- ARROW-5330 - [Python] [CI] 在 Travis-CI 上运行 Python Flight 测试
- ARROW-5332 - [R] R 包构建/安装失败:dyn.load() 中出错
- ARROW-5348 - [CI] [Java] Gandiva checkstyle 失败
- ARROW-5360 - [Rust] 在 nightly 2019-05-16+ 上,构建被 rustyline 破坏
- ARROW-5362 - [C++] 压缩往返测试可能导致一些清理工具失败
- ARROW-5371 - [发布] 为 dev/release/00-prepare.sh 添加测试
- ARROW-5373 - [Java] 为 Gandiva Java 构建添加缺失的细节
- ARROW-5376 - [C++] 在 gcc 5.4.0 上编译失败
- ARROW-5383 - [Go] 更新 IPC flatbuf (新的 Duration 类型)
- ARROW-5387 - [Go] 正确处理 List 的子切片
- ARROW-5388 - [Go] 在 array.NewChunked 中使用 arrow.TypeEqual
- ARROW-5390 - [CI] 在 Travis 上超出作业时间限制
- ARROW-5397 - 测试 Flight TLS 支持
- ARROW-5398 - [Python] Flight 测试因 URI 更改而中断
- ARROW-5403 - [C++] 在 Windows 共享构建中未传播测试失败
- ARROW-5411 - [C++][Python] 在 Mac OS Mojave 上构建时出现构建错误
- ARROW-5412 - [Java] 集成测试因 UnsupportedOperationException 异常而失败
- ARROW-5419 - [C++] CSV 的 strings_can_be_null 选项未完全遵循所有 null_values
- ARROW-5421 - [打包][Crossbow] 夜间测试配置中存在重复的键
- ARROW-5430 - [Python] 可以读取但无法写入按大整数分区的 parquet 文件
- ARROW-5435 - [Java] 为 IntervalYearVector#getAsStringBuilder 添加测试
- ARROW-5437 - [Python] parquet 测试中缺少 pandas pytest 标记
- ARROW-5446 - [C++] 使用 cmake 头文件安装目录而非 include 目录
- ARROW-5448 - [CI] AppVeyor 上的 MinGW 构建失败
- ARROW-5453 - [C++] 新发布的 cmake-format 0.5.2 导致构建中断
- ARROW-5455 - [Rust] 2019-05-30 的 Rust nightly 版本导致构建中断
- ARROW-5456 - [GLib][Plasma] 构建文档时可能使用了已安装的 plasma-glib
- ARROW-5457 - [GLib][Plasma] 测试用的环境变量名称错误
- ARROW-5459 - [Go] 为 Float16 数据类型实现 Stringer 接口
- ARROW-5462 - [Go] 支持写入零长度的 List
- ARROW-5479 - [Rust] [DataFusion] 测试时使用 ARROW_TEST_DATA 而不是相对路径
- ARROW-5487 - [CI] [Python] 文档构建失败
- ARROW-5493 - [Integration/Go] 为 IPC 集成测试添加 Go 支持
- ARROW-5507 - [Plasma] [CUDA] 编译错误
- ARROW-5514 - [C++] uint64 的打印器显示错误的值
- ARROW-5517 - [C++] 头文件收集的 CMake 逻辑应只考虑不含目录的文件名
- ARROW-5520 - [C++][打包] AArch64 上缺少 NVidia CUDA 工具包
- ARROW-5521 - [打包] 使用 Apache RAT 0.13 时许可证检查失败
- ARROW-5528 - 连接空的二进制数组时 Concatenate() 函数崩溃
- ARROW-5532 - [JS] 未读取字段元数据
- ARROW-5551 - [Go] 无效的 FixedSizeArray 表示
- ARROW-5553 - [Ruby] red-arrow gem 无法在 ruby:2.5 docker 镜像上编译
- ARROW-5576 - [C++] thrift_ep tarball 下载不稳定
- ARROW-5577 - [C++] Alpine Linux 上因 googletest 共享库导致链接失败
- ARROW-5583 - [Java] 当 NullableValueHolder 的 isSet 为 0 时,不应使用 buffer 字段
- ARROW-5584 - [Java] 在 FieldReader 的 javadoc 中为链接引用添加 import
- ARROW-5589 - [C++][Fuzzing] arrow-ipc-fuzzing-test 崩溃 2354085db0125113f04f7bd23f54b85cca104713
- ARROW-5592 - [Go] 实现 Duration 数组
- ARROW-5596 - [Python] Flight 测试在 Python 2.7 上失败
- ARROW-5601 - [gandiva] 使用字符串字段的 projector 出现错误
- ARROW-5603 - [Python] 注册 pytest 标记以避免警告
- ARROW-5605 - [C++][Fuzzing] arrow-ipc-fuzzing-test 崩溃 74aec871d14bb6b07c72ea8f0e8c9f72cbe6b73c
- ARROW-5606 - [Python] pandas.RangeIndex._start/_stop/_step 已被弃用
- ARROW-5608 - [C++][parquet] 使用 parquet::arrow::ColumnReader 时发生无效内存访问
- ARROW-5615 - [C++] 在 gcc 5.4.0 Ubuntu 16.04 上因 C++11 字符串字面量导致编译错误
- ARROW-5616 - [Python] 针对 Python 2.7 头文件的 C++ 构建失败
- ARROW-5617 - [C++] 使用 ARROW_BOOST_VENDORED=ON 时 thrift_ep 0.12.0 构建失败
- ARROW-5619 - [C++] get_apache_mirror.py 在 Python 3.5 下无法工作
- ARROW-5623 - [CI][GLib] 在 macOS 上失败
- ARROW-5624 - [C++] -Duriparser_SOURCE=BUNDLED 选项已损坏
- ARROW-5626 - [C++][Gandiva] 表达式缓存也应考虑精度和小数位数
- ARROW-5629 - [C++] 修复 Coverity 问题
- ARROW-5631 - [C++] CMake 3.2 构建已损坏
- ARROW-5648 - [C++] 在 mingw 上因缺少 codecvt 而构建失败
- ARROW-5654 - [C++] ChunkedArray 应验证数组的类型
- ARROW-5674 - [Python] test_parquet.py 中缺少 pandas pytest 标记
- ARROW-5675 - [文档] 修复描述在 macOS 上使用 Xcode IDE 进行编译/调试工作流程的文档中的拼写错误
- ARROW-5678 - [R][Lint] 修复 hadolint docker 代码检查错误
- ARROW-5693 - [Go] 跳过 Decimal128 的 IPC 集成测试
- ARROW-5697 - [GLib] c_glib/Dockerfile 已损坏
- ARROW-5698 - [R] r/Dockerfile 的 docker-compose 构建已损坏
- ARROW-5709 - [C++] gandiva-date_time_test 在 Windows 上失败
- ARROW-5714 - [JS] Int64Builder 在使用/不使用 BigNum 时的行为不一致
- ARROW-5723 - [Gandiva][Crossbow] 构建失败
- ARROW-5728 - [Python] [CI] Travis-CI 在 test_jvm.py 中出现故障
- ARROW-5730 - [Python][CI] 在 dask 集成测试中选择性地跳过测试用例
- ARROW-5732 - [C++] macOS 构建在 master 分支上因 pmmintrin.h 的警告而不稳定地失败
- ARROW-5735 - [C++] Appveyor 构建在 thrift_ep 构建阶段持续失败
- ARROW-5737 - [C++][Gandiva] Gandiva 无法在 manylinux 中构建
- ARROW-5738 - [Crossbow][Conda] OSX 软件包构建因缺少 intrinsics 而失败
- ARROW-5739 - [CI] 修复 docker python 构建
- ARROW-5750 - [Java] master 分支上的 Java 编译失败
- ARROW-5754 - [C++] ~GrpcStreamWriter 缺少 override?
- ARROW-5765 - [C++] TestDictionary.Validate 测试在发布构建时崩溃
- ARROW-5769 - [Java] org.apache.arrow.flight.TestTls 测试通过 dev/release/00-prepare.sh 运行时失败
- ARROW-5770 - [C++] 修复 result.h 中的 -Wpessimizing-move 警告
- ARROW-5771 - [Python] Docker python-nopandas 作业失败
- ARROW-5774 - [Java][文档] 在文档中说明 flight 需要检出 git 子模块
- ARROW-5781 - [Archery] 确保基准测试克隆接受 revision 中的远程仓库
- ARROW-5791 - [Python] pyarrow.csv.read_csv 挂起并耗尽所有内存
- ARROW-5816 - [发布] 并行 curl 在 verify-release-candidate-sh 中工作不可靠
- ARROW-5824 - [Gandiva] [C++] 修复 decimal null 问题
- ARROW-61 - [Java] 方法可能返回大于 long MAX_VALUE 的值