Apache Arrow 0.14.0 (2019 年 7 月 4 日)
这是一个主要版本,涵盖了超过 3 个月的开发。
下载
贡献者
此版本包含来自 78 位不同贡献者的 570 次提交。
$ git shortlog -sn apache-arrow-0.13.0..apache-arrow-0.14.0
67 Antoine Pitrou
62 Wes McKinney
37 Sebastien Binet
34 Sutou Kouhei
25 Kouhei Sutou
24 Neal Richardson
22 Romain Francois
21 Joris Van den Bossche
20 Benjamin Kietzman
19 Micah Kornfield
18 Krisztián Szűcs
16 David Li
16 François Saint-Jacques
14 Yosuke Shiro
11 Pindikura Ravindra
11 Praveen
10 liyafan82
10 tianchen
7 Kenta Murata
7 Neville Dipale
7 Renjie Liu
6 Chao Sun
6 Deepak Majeti
6 Hatem Helal
5 Andy Grove
4 Brian Hulette
4 Bryan Cutler
4 Eric Erhardt
4 Zhuo Peng
4 ptaylor
4 shengjun.li
3 Marco Neumann
3 Philipp Moritz
3 Prudhvi Porandla
3 Renat Valiullin
3 TP Boudreau
3 Zhiyuan Zheng
2 Fabio B. Silva
2 HyukjinKwon
2 John Muehlhausen
2 Prashanth Govindarajan
2 alexandreyc
2 shyam
1 Alex Sergeev
1 Anatoly Myachev
1 Anson Qian
1 Frank Wessels
1 Gidon Gershinsky
1 Guillaume Horel
1 Ivan Sadikov
1 Jamie Blondin
1 Javier Luraschi
1 Jim Walker
1 Johannes Luong
1 Jonathan A. Sternberg
1 Kevin Gurney
1 MASAMIKI
1 Mark Cafaro
1 Masayuki Takahashi
1 Miguel Cabrera
1 Nuno Sucena Almeida
1 Pearu Peterson
1 Robin Kåveland Hansen
1 Rok
1 Ryan Murray
1 Takuya Kato
1 Yngve Sekse Kristiansen
1 Yuqi Gu
1 Yurui Zhou
1 Zhijun Fu
1 daslu
1 dlekkas
1 emkornfield
1 praveenbingo
1 rjzamora
1 siddharth
1 tianchen92
1 tiger
补丁提交者
以下 Apache 提交者将贡献的补丁合并到存储库中。
$ git shortlog -csn apache-arrow-0.13.0..apache-arrow-0.14.0
213 Wes McKinney
67 Antoine Pitrou
40 Sutou Kouhei
36 Krisztián Szűcs
36 Sebastien Binet
34 Micah Kornfield
33 Kouhei Sutou
22 Pindikura Ravindra
19 Romain Francois
18 Chao Sun
16 François Saint-Jacques
10 Uwe L. Korn
6 Bryan Cutler
4 Brian Hulette
4 Yosuke Shiro
3 GitHub
2 Andy Grove
2 Philipp Moritz
2 Sidd
1 Deepak Majeti
1 Robert Nishihara
1 ptaylor
变更日志
新特性和改进
- ARROW-1012 - [C++] 创建一个可配置的 RecordBatchReader 实现,用于从 Apache Parquet 文件读取数据
- ARROW-1207 - [C++] 实现 Map 逻辑类型
- ARROW-1261 - [Java] 添加 Map 逻辑类型的容器类型
- ARROW-1278 - Fixed Size List 类型的集成测试
- ARROW-1279 - [集成][Java] Map 类型的集成测试
- ARROW-1280 - [C++] 实现 Fixed Size List 类型
- ARROW-1496 - [JS] 将覆盖率数据上传到 codecov.io
- ARROW-1558 - [C++] 实现布尔选择内核
- ARROW-1774 - [C++] 添加 "view" 函数,为兼容类型创建零拷贝视图(如果支持)
- ARROW-1957 - [Python] 使用新的 NANO LogicalType Parquet 单元写入纳秒时间戳
- ARROW-1983 - [Python] 添加写入 parquet `_metadata` 文件的能力
- ARROW-2057 - [Python] 配置 pyarrow.parquet.write_table 中的数据页面大小
- ARROW-2102 - [C++] 实现 take 内核函数 - 原始值类型
- ARROW-2103 - [C++] 实现 take 内核函数 - 字符串/二进制值类型
- ARROW-2104 - [C++] 实现 take 内核函数 - 嵌套数组值类型
- ARROW-2105 - [C++] 实现 take 内核函数 - 正确处理特殊索引
- ARROW-2217 - [C++] 添加选项以使用动态链接来处理压缩库依赖项
- ARROW-2298 - [Python] 添加选项,在转换为整数 Arrow 类型时,不将 NaN 视为空值
- ARROW-2412 - [集成] 添加嵌套字典集成测试
- ARROW-2467 - [Rust] 使用 Flatbuffers 生成代码
- ARROW-2517 - [Java] 添加列表
写入器 - ARROW-2707 - [C++] 使用 Column::Slice 实现 Table::Slice 方法
- ARROW-2796 - [C++] 简化 symbols.map 文件,在构建 libarrow_python 时使用
- ARROW-2818 - [Python] 将 SparseDataFrame 传递到 Table.from_pandas 时,提供更好的错误消息
- ARROW-2835 - [C++] ReadAt/WriteAt 与移动文件位置不一致
- ARROW-2969 - [R] 在包含每个单元格中数据帧的 "nested" data.frame 列和 StructArray 之间进行转换
- ARROW-2981 - [C++] 支持在代码库上运行 clang-tidy 的脚本/文档
- ARROW-3040 - [Go] 添加对比较数组的支持
- ARROW-3041 - [Go] 添加对 TimeArray 的支持
- ARROW-3052 - [C++] 检测 ORC 系统包
- ARROW-3087 - [C++] 添加用于比较操作到标量的内核
- ARROW-3144 - [C++] 将 "dictionary" 成员从 DictionaryType 移动到 ArrayData,以允许在 Array 块之间更改字典
- ARROW-3150 - [Python] 在 Linux 和 Windows 上发布启用 Flight 的 Python wheels
- ARROW-3166 - [C++] 合并 arrow/io 和 parquet-cpp 中使用的 IO 接口
- ARROW-3191 - [Java] 添加对 ArrowBuf 指向任意内存的支持。
- ARROW-3200 - [C++] 添加对读取带有字典的 Flight 流的支持
- ARROW-3290 - [C++] 用于安全 gRPC 的工具链支持
- ARROW-3294 - [C++] 在 Windows / Appveyor 上测试 Flight RPC
- ARROW-3314 - [R] 在构建时使用 pkg-config 设置 -rpath
- ARROW-3419 - [C++] 运行 include-what-you-use 检查作为夜间构建
- ARROW-3459 - [C++][Gandiva] 添加对可变长度输出向量的支持
- ARROW-3475 - [C++] Int64Builder.Finish(NumericArray
) - ARROW-3572 - [打包] 正确处理 crossbow 的 ssh 来源 URL
- ARROW-3671 - [Go] 实现 Interval 数组
- ARROW-3676 - [Go] 实现 Decimal128 数组
- ARROW-3679 - [Go] 实现 IPC 协议
- ARROW-3680 - [Go] 实现 Float16 数组
- ARROW-3686 - [Python] 支持在 to/from numpy 中使用掩码数组
- ARROW-3729 - [C++] 支持写入 TIMESTAMP_NANOS Parquet 元数据
- ARROW-3732 - [R] 添加将 RecordBatch 或 Schema 写入 Message 值,然后读回的函数
- ARROW-3758 - [R] 在 Windows 上构建 R 库,记录 Windows 开发人员的构建说明
- ARROW-3759 - [R][CI] 在 Appveyor 中构建和测试 Windows
- ARROW-3767 - [C++] 为 Null 到任何类型添加强制转换
- ARROW-3780 - [R] 获取数据失败:收集 int16 时数据无效
- ARROW-3791 - [C++] 在 CSV 文件中添加布尔值的类型推断
- ARROW-3794 - [R] 考虑将 INT8 映射到 integer() 而不是 raw()
- ARROW-3804 - [R] 考虑降低所需的 R 运行时
- ARROW-3810 - [R] Array 和 ChunkedArray 的 type= 参数
- ARROW-3811 - [R] struct 数组推断
- ARROW-3814 - [R] RecordBatch$from_arrays()
- ARROW-3815 - [R] 优化记录批处理工厂
- ARROW-3848 - [R] 允许 RandomAccessFile$Read() 中缺少 nbytes
- ARROW-3897 - [MATLAB] 添加 MATLAB 对将数字数据类型写入 Feather 文件的支持
- ARROW-3904 - [C++/Python] 验证 decimal128 类型的 scale 和 precision
- ARROW-4013 - [文档][C++] 记录如何在 MSYS2 上构建 Apache Arrow
- ARROW-4020 - [发布] 在发布投票通过后,从开发分发系统中删除源工件
- ARROW-4036 - [C++] 使状态代码可插拔
- ARROW-4047 - [Python] 在 Parquet 文档中记录 int96 时间戳的使用和选项
- ARROW-4086 - [Java] 添加用于调试分配失败的 API
- ARROW-4121 - [C++] 重构 InvertKernel 中的内存分配
- ARROW-4159 - [C++] 检查 -Wdocumentation 问题
- ARROW-4194 - [格式] Metadata.rst 未指定 Timestamp 类型的时区
- ARROW-4302 - [C++] 将 OpenSSL 添加到 C++ 构建工具链
- ARROW-4337 - [C#] Array / RecordBatch Builder Fluent API
- ARROW-4343 - [C++] 将尽可能完整的 Ubuntu Trusty / 14.04 构建添加到 docker-compose 设置
- ARROW-4356 - [CI] 为 turbodbc 添加集成(docker)测试
- ARROW-4452 - [Python] 序列化稀疏 torch 张量
- ARROW-4453 - [Python] 为 SparseTensor 创建 Cython 封装器
- ARROW-4467 - [Rust] [DataFusion] 为 DataFusion 创建 REPL & Dockerfile
- ARROW-4503 - [C#] ArrowStreamReader 过度分配和复制数据
- ARROW-4504 - [C++] 减少单元测试可执行文件的数量
- ARROW-4505 - [C++] 更好的 date32 PrettyPrint
- ARROW-4566 - [C++][Flight] 添加选项以针对在不同主机上运行的性能服务器运行 arrow-flight-benchmark
- ARROW-4596 - [Rust] [DataFusion] 实现 COUNT 聚合函数
- ARROW-4622 - [C++] [Python] UnionArray 中的 MakeDense 和 MakeSparse 应接受 Field 向量
- ARROW-4625 - [Flight] 封装服务器繁忙等待方法
- ARROW-4626 - [Flight] 将应用程序元数据字段添加到 DoGet
- ARROW-4627 - [Flight] 将应用程序元数据字段添加到 DoPut
- ARROW-4701 - [C++] 添加 JSON 分块器基准测试
- ARROW-4702 - [C++] 升级依赖版本
- ARROW-4708 - [C++] 添加多线程 JSON 读取器
- ARROW-4714 - [C++][Java] 提供 JNI 接口以通过 Arrow C++ 读取 ORC 文件
- ARROW-4717 - [C#] 考虑暴露 ValueTask 而不是 Task
- ARROW-4719 - [C#] 在 C# 中实现 ChunkedArray、Column 和 Table
- ARROW-4741 - [Java] 向所有类添加文档并为类 javadocs 启用 checkstyle
- ARROW-4787 - [C++] 在哈希内核操作中包含“null”值(可能带有启用/禁用选项)
- ARROW-4788 - [C++] 开发用于构造 StructArray 的不太冗长的 API
- ARROW-4800 - [C++] 创建/移植 StatusOr 实现以能够返回状态或类型
- ARROW-4805 - [Rust] 将时间数组写入 CSV
- ARROW-4806 - [Rust] 支持在转换内核中转换时间数组
- ARROW-4824 - [Python] read_csv 应接受 io.StringIO 对象
- ARROW-4827 - [C++] 实现两个 git 版本之间的基准比较
- ARROW-4847 - [Python] 添加 pyarrow.table 工厂函数,该函数根据输入类型分派到各种 ctors
- ARROW-4904 - [C++] 将 arrow/ipc/test-common.h 中的实现移至 libarrow_testing
- ARROW-4911 - [R] 支持为 Windows 构建软件包
- ARROW-4912 - [C++, Python] 允许指定 CSV 读取器的列名
- ARROW-4913 - [Java][Memory] 限制 ledgers 和 arrowbufs 的数量
- ARROW-4945 - [Flight] 在 Travis 中启用 Flight 集成测试
- ARROW-4956 - [C#] 允许 ArrowBuffers 在 C# 中包装外部 Memory
- ARROW-4959 - [Gandiva][Crossbow] 构建已损坏
- ARROW-4968 - [Rust] StructArray 构建器和 From<> 方法应检查字段类型是否与 schema 匹配
- ARROW-4971 - [Go] DataType 相等性
- ARROW-4972 - [Go] Array 相等性
- ARROW-4973 - [Go] Slice Array 相等性
- ARROW-4974 - [Go] Array 近似相等性
- ARROW-4990 - [C++] 用于比较数组与数组的内核
- ARROW-4993 - [C++] 在 CMake 配置结束时显示摘要
- ARROW-5000 - [Python] 修复 setup.py 中的弃用警告
- ARROW-5007 - [C++] 将 DCHECK 移出 sse-utils
- ARROW-5020 - [C++][Gandiva] 将 Gandiva 相关的 conda 包拆分为单独的 .yml conda env 文件
- ARROW-5027 - [Python] 添加 JSON 读取器
- ARROW-5038 - [Rust] [DataFusion] 实现 AVG 聚合函数
- ARROW-5039 - [Rust] [DataFusion] 修复 CAST 支持中的错误
- ARROW-5045 - [Rust] 代码覆盖率在 CI 中静默失败
- ARROW-5053 - [Rust] [DataFusion] 使用 env var 作为 arrow 测试数据的位置
- ARROW-5054 - [C++][Release] 在 verify-release-candidate.sh 中测试 Flight
- ARROW-5056 - [Packaging] 调整 conda recipes 以在 unix 系统上使用 ORC conda-forge 软件包
- ARROW-5061 - [Release] 提高 03-binary 性能
- ARROW-5062 - [Java] 为 Flight 遮蔽 Java Guava 依赖项
- ARROW-5063 - [Java] FlightClient 不应创建子分配器
- ARROW-5064 - [Release] 将 PKG_CONFIG_PATH 传递给验证脚本中的 glib
- ARROW-5066 - [Integration] 添加标志以在 integration/integration_test.py 中启用/禁用实现
- ARROW-5071 - [Benchmarking] 使用 archery 执行基准测试运行
- ARROW-5076 - [Packaging] 提高二进制文件上传后的性能
- ARROW-5077 - [Rust] 发布过程应更改 Cargo.toml 以使用发布版本
- ARROW-5078 - [Documentation] Sphinx 由于 RemovedInSphinx30Warning 而失败
- ARROW-5079 - [Release] 添加一个脚本以发布 C# 软件包
- ARROW-5080 - [Release] 添加一个脚本以发布 Rust 软件包
- ARROW-5081 - [C++] 在 CMake 配置中始终如一地使用 PATH_SUFFIXES
- ARROW-5082 - [Python][Packaging] 减小 macOS 和 manylinux1 wheels 的大小
- ARROW-5083 - [Developer] 在 merge_arrow_pr.py 脚本中,允许用户设置已发布的修复版本
- ARROW-5088 - [C++] 在发布模式下使用 BUILD_WARNING_LEVEL=CHECKIN 时,请勿设置 -Werror
- ARROW-5091 - [Flight] 将 FlightGetInfo 消息重命名为 FlightInfo
- ARROW-5093 - [Packaging] 添加对选择性二进制文件上传的支持
- ARROW-5094 - [Packaging] 添加 APT/Yum 验证脚本
- ARROW-5102 - [C++] 减少头文件依赖项
- ARROW-5108 - [Go] 实现从 Arrow 文件读取原始数组
- ARROW-5109 - [Go] 实现从 Arrow 文件读取二进制/字符串数组
- ARROW-5110 - [Go] 实现从 Arrow 文件读取结构体数组
- ARROW-5111 - [Go] 实现从 Arrow 文件读取列表数组
- ARROW-5112 - [Go] 实现将数组写入 Arrow 文件
- ARROW-5113 - [C++][Flight] C++ 中用于 DoPut 的单元测试
- ARROW-5115 - [JS] 实现向量构建器
- ARROW-5116 - [Rust] 将内核相关文件移动到 compute/kernels 下
- ARROW-5124 - [C++] 在 MinGW 构建中添加对 Parquet 的支持
- ARROW-5126 - [Rust] [Parquet] 将 parquet 列描述符转换为 arrow 数据类型
- ARROW-5127 - [Rust] [Parquet] 添加页面迭代器
- ARROW-5136 - [Flight] 实现调用选项(超时)
- ARROW-5137 - [Flight] 实现身份验证 API
- ARROW-5145 - [C++] 发布模式缺乏便捷的输入验证
- ARROW-5150 - [Ruby] 添加 Arrow::Table#raw_records
- ARROW-5155 - [GLib][Ruby] 添加对从数据类型构建联合数组的支持
- ARROW-5157 - [Website] 将 MATLAB 添加到由 Apache Arrow 提供支持的页面
- ARROW-5162 - [Rust] [Parquet] 将 mod reader 重命名为 arrow。
- ARROW-5163 - [Gandiva] 转换 timestamp/date 时错误地将 0097 年评估为 1997 年
- ARROW-5164 - [Gandiva] [C++] 引入 32 位哈希函数
- ARROW-5165 - [Python][Documentation] 构建文档不建议分配 $ARROW_BUILD_TYPE
- ARROW-5168 - [GLib] 添加 garrow_array_take()
- ARROW-5171 - [C++] 在比较枚举选项中使用 LESS 而不是 LOWER。
- ARROW-5172 - [Go] 实现从 Arrow 文件读取固定大小的二进制数组
- ARROW-5178 - [Python] 允许从 Python dict 创建 Table
- ARROW-5179 - [Python] 在 Python 3.7+ 上返回纯 dict,而不是 OrderedDict
- ARROW-5185 - [C++] 添加对使用 CMake 配置文件进行 Boost 的支持
- ARROW-5187 - [Rust] 将 StructArray 平展为 RecordBatch 的能力
- ARROW-5188 - [Rust] 为 StructArray 添加时间构建器
- ARROW-5189 - [Rust] [Parquet] 格式化 parquet 行中的各个字段
- ARROW-5190 - [R] 讨论:R 软件包中的 tibble 依赖项
- ARROW-5191 - [Rust] 公开 CSV 和 JSON 读取器模式
- ARROW-5203 - [GLib] 添加对比较过滤器的支持
- ARROW-5204 - [C++] 提高 BufferBuilder 性能
- ARROW-5212 - [Go] Go 库中的 Array BinaryBuilder 无法调整值缓冲区的大小
- ARROW-5218 - [C++] 在指定第三方库位置时改进构建
- ARROW-5219 - [C++] 使用 Ninja 时并行构建 protobuf_ep
- ARROW-5222 - [Python] 在 MacOS 上为开发安装 pyarrow 的问题
- ARROW-5225 - [Java] 提高 BaseValueVector#getValidityBufferSizeFromCount 的性能
- ARROW-5226 - [Gandiva] 支持十进制的比较运算符
- ARROW-5238 - [Python] 提高 pyarrow.dictionary 函数的可用性
- ARROW-5241 - [Python] 添加禁用将统计信息写入 parquet 文件的选项
- ARROW-5250 - [Java] 删除方法上的 javadoc 抑制。
- ARROW-5252 - [C++] 更改 variant 实现
- ARROW-5256 - [Packaging][deb] 无法使用 LLVM 7.1.0 构建
- ARROW-5257 - [Website] 更新站点以使用“官方” Apache Arrow 徽标,并添加清晰标记的徽标链接
- ARROW-5258 - [C++/Python] 向调用者公开数据集块的文件元数据
- ARROW-5261 - [C++] 完成 Duration 和 Interval 的标量类型实现
- ARROW-5262 - [Python] 修复拼写错误
- ARROW-5264 - [Java] 允许通过环境变量启用/禁用边界检查
- ARROW-5266 - [Go] 实现 Float16 的读/写 IPC
- ARROW-5268 - [GLib] 添加 GArrowJSONReader
- ARROW-5269 - [C++] 将基准测试候选列表列入回归检查的白名单
- ARROW-5275 - [C++] 编写通用文件系统测试
- ARROW-5281 - [Rust] [Parquet] 将 DataPageBuilder 移动到 test_common
- ARROW-5284 - [Rust] 使用 std::alloc 替换 libc 进行内存分配
- ARROW-5286 - [Python] 在 Table.from_pandas 中支持 Structs,给定已知 schema
- ARROW-5288 - [文档] 丰富贡献指南
- ARROW-5289 - [C++] 将 arrow/util/concatenate.h 移动到 arrow/array/
- ARROW-5290 - [Java] 提供一个标志来启用/禁用 vectors 的 get 方法中的 null 检查
- ARROW-5291 - [Python] 为 Array 上的 "take" 内核添加包装器
- ARROW-5298 - [Rust] 为 Buffer 添加调试实现
- ARROW-5299 - [C++] ListArray 比较不正确
- ARROW-5309 - [Python] 为返回新对象的 Python “append” 方法添加说明
- ARROW-5311 - [C++] 在 Take 内核中返回更具体的无效 Status
- ARROW-5313 - [Format] Field 表上的注释有点令人困惑
- ARROW-5317 - [Rust] [Parquet] 为 SerializedFileReader 实现 IntoIterator
- ARROW-5319 - [CI] 使用 MinGW 构建启用 ccache
- ARROW-5321 - [Gandiva][C++] 为 utf8 和 binary 类型添加 isnull 和 isnotnull
- ARROW-5323 - [CI] 将压缩用于 clcache
- ARROW-5328 - [R] 添加 shell 脚本以在本地进行完整的包重建和测试
- ARROW-5329 - 添加对在 MATLAB 中直接构建 MATLAB 接口到 Feather 的支持
- ARROW-5334 - [C++] 为了保持一致性,向 arrow::Integer, arrow::FloatingPoint 类名称添加 “Type”
- ARROW-5335 - [Python] 在转换为 pandas 时,引发变量字典错误
- ARROW-5339 - [C++] 将 jemalloc 添加到第三方依赖下载脚本
- ARROW-5341 - [C++] 添加有关本地修复和测试 -Wdocumentation clang 警告的说明
- ARROW-5342 - [Format] 在 IPC 协议中形式化扩展类型元数据
- ARROW-5346 - [C++] 恢复在供应商日期代码中限定持续时间的更改
- ARROW-5349 - [Python/C++] 提供一种在 parquet ColumnChunkMetaData 中指定文件路径的方法
- ARROW-5361 - [R] 遵循来自 ARROW-3144 的 DictionaryType/DictionaryArray 更改
- ARROW-5363 - [GLib] 修复编码风格
- ARROW-5364 - [C++] 在 BuildUtils.cmake 注释中使用 ASCII 而不是 UTF-8
- ARROW-5365 - [C++][CI] 将 UBSan 和 ASAN 添加到 CI 中
- ARROW-5368 - [C++] 默认情况下使用 MinGW 禁用 jemalloc
- ARROW-5369 - [C++] 添加对 Windows 上 glog 的支持
- ARROW-5370 - [C++] 默认情况下检测系统 uriparser
- ARROW-5372 - [GLib] 添加对 null/boolean 值 CSV 读取选项的支持
- ARROW-5378 - [C++] 添加本地 FileSystem 实现
- ARROW-5380 - [C++] 修复并启用 UBSan 以进行未对齐的访问。
- ARROW-5384 - [Go] 添加 FixedSizeList 数组
- ARROW-5389 - [C++] 添加一个内部临时目录 API
- ARROW-5392 - [C++][CI][MinGW] 在 AppVeyor 上禁用静态库构建
- ARROW-5393 - [R] 为 read_parquet() 添加测试和示例
- ARROW-5395 - [C++] 在文件格式中利用流 EOS
- ARROW-5396 - [JS] 确保 reader 和 writer 支持没有 RecordBatches 的文件和流
- ARROW-5401 - [CI] [C++] 在 Travis-CI 上打印 ccache 统计信息
- ARROW-5404 - [C++] nonstd::string_view 与 c++17 中的 std::string_view 冲突
- ARROW-5407 - [C++] 集成测试 Travis CI 条目构建许多不必要的目标
- ARROW-5413 - [C++] CSV 读取器不删除 BOM
- ARROW-5415 - [Release] 发布脚本应该在所有地方更新 R 版本
- ARROW-5416 - [网站] 将 Homebrew 添加到项目安装页面
- ARROW-5418 - [CI][R] 运行代码覆盖率并报告给 codecov.io
- ARROW-5420 - [Java] 在 VariableWidthVector 中实现或删除 getCurrentSizeInBytes
- ARROW-5427 - [Python] RangeIndex 序列化变更的影响
- ARROW-5428 - [C++] 添加在 arrow::io::BufferedInputStream 中设置 “read extent” 的选项
- ARROW-5429 - [Java] 提供替代的缓冲区分配策略
- ARROW-5432 - [Python] 向 pyarrow.NativeFile 添加 ‘read_at’ 方法
- ARROW-5433 - [C++][Parquet] 改进 parquet-reader 列信息
- ARROW-5434 - [Java] 引入包装器以实现 ARROW-3191 中 ArrowBuf 更改的向后兼容性
- ARROW-5436 - [Python] 在 parquet.read_table 中公开 filters 参数
- ARROW-5438 - [JS] 在文件格式中利用流 EOS
- ARROW-5441 - [C++] 实现 FindArrowFlight.cmake
- ARROW-5442 - [网站] 阐明什么使发布工件成为 “官方” 的
- ARROW-5443 - [Gandiva][Crossbow] 关闭 parquet 加密
- ARROW-5447 - [CI] [Ruby] CI 在 AppVeyor 上失败
- ARROW-5449 - [C++] 本地文件系统实现:调查 Windows UNC 路径
- ARROW-5451 - [C++][Gandiva] 为 decimals 添加 round 函数
- ARROW-5452 - [R] 添加文档网站 (pkgdown)
- ARROW-5461 - [Java] 为 Float8Vector 和 allocators 添加微基准测试
- ARROW-5463 - [Rust] 为 Buffer 实现 AsRef
- ARROW-5464 - [Archery] Bad –benchmark-filter 默认值
- ARROW-5465 - [Crossbow] 支持将提交的作业定义 yaml 写入文件
- ARROW-5466 - [Java] 在 Travis CI 中 Dockerize Java 构建,在单个条目中运行多个 JDK
- ARROW-5467 - [Go] 实现 Time32/Time64 数组的读/写 IPC
- ARROW-5468 - [Go] 实现 Timestamp 数组的读/写 IPC
- ARROW-5469 - [Go] 实现 Date32/Date64 数组的读/写 IPC
- ARROW-5470 - [CI] C++ 本地文件系统补丁破坏 Travis R 作业
- ARROW-5472 - [Development] 如果未设置任何 JIRA 组件,则向 PR 合并工具添加警告
- ARROW-5474 - [C++] 文档化所需的 Boost 版本
- ARROW-5476 - [Java][Memory] 修复 Netty ArrowBuf Slice
- ARROW-5477 - [C++] 检查所需的 RapidJSON 版本
- ARROW-5478 - [Packaging] 放弃 Ubuntu 14.04 支持
- ARROW-5481 - [GLib] garrow_seekable_input_stream_peek() 缺少 “error” 参数文档
- ARROW-5483 - [Java] 添加 ValueVector 构造函数,该构造函数接受 Field 对象
- ARROW-5485 - [Gandiva][Crossbow] OSx 构建失败
- ARROW-5486 - [GLib] 添加 gandiva::FunctionRegistry 和相关内容的绑定
- ARROW-5488 - [R] 在 C++ lib 不可用时进行处理
- ARROW-5490 - [C++] 移除 ARROW_BOOST_HEADER_ONLY
- ARROW-5491 - [C++] 移除 MACRO 定义后不必要的分号
- ARROW-5492 - [R] 将 “col_select” 参数添加到 read_* 函数以读取列的子集
- ARROW-5495 - [C++] 始终使用 HTTPS 下载依赖项
- ARROW-5496 - [R][CI] 修复 R codecov.io 报告中的相对路径
- ARROW-5498 - [C++] 使用 Flatbuffers 1.11.0 和 MinGW 构建失败
- ARROW-5500 - [R] read_csv_arrow() 签名应与 readr::read_csv() 匹配
- ARROW-5503 - [R] 添加 read_json()
- ARROW-5504 - [R] 将 use_threads 参数移动到全局选项
- ARROW-5509 - [R] write_parquet()
- ARROW-5511 - [打包] 在 Conda 包中启用 Flight
- ARROW-5512 - [C++] 为 Datasets 项目起草初始公共 API
- ARROW-5513 - [Java] 重构 getstartOffset 的方法名以使用驼峰命名法
- ARROW-5516 - [Python] pyarrow 的开发页面在使用 pip 时缺少依赖项
- ARROW-5518 - [Java] 在 allocateNew 和 clear 时将 VectorSchemaRoot 的 rowCount 设置为 0
- ARROW-5524 - [C++] 如果未找到 OpenSSL,则在 CMake 中关闭 PARQUET_BUILD_ENCRYPTION
- ARROW-5526 - [开发者] 在 GitHub 问题模板中添加更醒目的通知,以将错误报告定向到 JIRA
- ARROW-5529 - [Flight] 允许使用多个 TLS 证书进行服务
- ARROW-5531 - [Python] 在 Array.from_buffers 中支持 binary、utf8 和嵌套类型
- ARROW-5533 - [Plasma] Plasma 客户端应该是线程安全的
- ARROW-5534 - [GLib] 添加 garrow_table_concatenate()
- ARROW-5535 - [GLib] 添加 garrow_table_slice()
- ARROW-5537 - [JS] 在 RecordBatchWriter 和 DictionaryBuilder 中支持增量字典
- ARROW-5538 - [C++] 将最低 OpenSSL 版本限制为 1.0.2
- ARROW-5541 - [R] 从负 int32 到 uint32 和 uint64 的转换现在是安全的
- ARROW-5544 - [Archery] 在回归时,`benchmark diff` 子命令不应返回非零值
- ARROW-5545 - [C++][文档] 在 C++ API 文档中阐明带时区的时间戳的 UTC 值预期
- ARROW-5547 - [C++][FlightRPC] 未提供 arrow-flight.pc
- ARROW-5552 - [Go] 使 Schema 和 Field 实现 Stringer
- ARROW-5554 - 为 arrow::Concatenate 添加一个 Python 包装器
- ARROW-5555 - [R] 添加 install_arrow() 函数以帮助用户获取 C++ 运行时库
- ARROW-5556 - [文档] 记录 JSON 读取器
- ARROW-5557 - [C++] 调查 VisitBitsUnrolled 在不同平台上的性能
- ARROW-5564 - [C++] 将 uriparser 添加到 conda-forge
- ARROW-5565 - [Python] 记录在使用 pyarrow 时如何使用 gdb
- ARROW-5567 - [C++] 修复 memory-benchmark 的构建错误
- ARROW-5574 - [R] read_arrow() 的文档错误
- ARROW-5580 - 更正 Gandiva 中时间戳函数的定义
- ARROW-5581 - [Java] 为向量排序提供接口和初始实现
- ARROW-5582 - [Go] 添加对比较 Records 的支持
- ARROW-5586 - [R] 将 LIST 类型的 Array 转换为 R 列表
- ARROW-5587 - [Java] 为 Java 代码添加更多 maven 样式检查
- ARROW-5590 - [R] 如果可能,在同一 CI 条目中运行 “no libarrow” R 构建
- ARROW-5591 - [Go] 实现 Duration & Intervals 的读/写 IPC
- ARROW-5597 - [打包][deb] 添加 Flight 包
- ARROW-5600 - [R] R 包命名空间清理
- ARROW-5602 - [Java][Gandiva] 为小数舍入函数添加测试
- ARROW-5604 - [Go] 提高 type-traits 的测试覆盖率
- ARROW-5609 - [C++] 设置 CMP0068 CMake 策略以避免 macOS 警告
- ARROW-5612 - [Python][文档] 阐明 date_as_object 选项行为
- ARROW-5621 - [Go] 实现 Decimal128 数组的读/写 IPC
- ARROW-5622 - [C++][Dataset] 未提供 arrow-dataset.pc
- ARROW-5625 - [R] 将 struct 类型的 Array 转换为数据帧列
- ARROW-5632 - [文档] 添加一些文档,描述在 macOS 上使用 Xcode IDE 的编译/调试工作流程
- ARROW-5633 - [Python] 在 Linux wheels 中启用 bz2
- ARROW-5635 - [C++] 支持“压缩”表
- ARROW-5637 - [Gandiva] [Java] 完成 IN 表达式
- ARROW-5639 - [Java] 从 getOffsetBufferValueCapacity 中删除浮点计算
- ARROW-5641 - [GLib] 从 Git 目标中删除由 GNU Autotools 生成的枚举文件
- ARROW-5643 - [Flight] 添加覆盖主机名检查的能力
- ARROW-5650 - [Python] 更新 manylinux 依赖项版本
- ARROW-5652 - [CI] 修复 iwyu docker 镜像
- ARROW-5656 - [Python] 在 macOS 上启用 Flight wheels
- ARROW-5659 - [C++] 添加对查找由 Homebrew 安装的 OpenSSL 的支持
- ARROW-5660 - [GLib][CI] 使用最新的 macOS 镜像和所有基于 Homebrew 的库
- ARROW-5661 - 在 Gandiva 中支持小数的哈希函数
-
ARROW-5662 - [C++] 添加对 BOOST_SOURCE=AUTO 的支持 捆绑 系统 - ARROW-5663 - [打包][RPM] 更新 0.14.0 的 CentOS 包
- ARROW-5664 - [Crossbow] 在 CircleCI 上而不是 Travis 上执行 nightly crossbow 测试
- ARROW-5668 - [Python] 在 Schema.__repr__ 中为不可为空的字段显示 “not null”
- ARROW-5669 - [Crossbow] manylinux1 wheel 构建失败
- ARROW-5670 - [Crossbow] get_apache_mirror.py 在 macOS 上使用 Python 3.5 时出现 TLS 错误
- ARROW-5671 - [crossbow] mac os python wheels 构建失败
- ARROW-5672 - [Java] 重构冗余方法修饰符
- ARROW-5683 - [R] 将 snappy 添加到 Rtools Windows 构建
- ARROW-5684 - [打包][deb] 添加对 Ubuntu 19.04 的支持
- ARROW-5685 - [打包][deb] 添加对 Apache Arrow Datasets 的支持
- ARROW-5687 - [C++] 删除 ARROW_BOOST_VENDORED 的剩余用法
- ARROW-5690 - [打包][Python] macOS wheels 损坏:缺少 libprotobuf.18.dylib
- ARROW-5694 - [Python] 转换为 pandas 时不支持小数列表
- ARROW-5695 - [C#][Release] 在 verify-release-candidate.sh 中运行 sourcelink 测试
- ARROW-5696 - [Gandiva] [C++] 引入 castVarcharVarchar
- ARROW-5699 - [C++] 优化 CSV 中 Decimal128 的解析
- ARROW-5701 - [C++][Gandiva] 仅为所需的选择向量类型构建表达式
- ARROW-5702 - [C++] parquet::arrow::FileReader::GetSchema()
- ARROW-5704 - [C++] 停止对 SparseTensorImpl 类使用 ARROW_TEMPLATE_EXPORT
- ARROW-5705 - [Java] 优化 BaseValueVector#computeCombinedBufferSize 逻辑
- ARROW-5706 - [Java] 删除 getValidityBufferValueCapacity 中的类型转换
- ARROW-5707 - [Java] 改进 ArrowRecordBatch 的性能和代码结构
- ARROW-5710 - [C++] 允许在 Windows 上使用 Ninja 编译 Gandiva
- ARROW-5718 - [R] 在 record_batch() 和 table() 中自动拼接数据帧
- ARROW-5721 - [Rust] 将数组相关代码移动到单独的模块中
- ARROW-5724 - [R] [CI] AppVeyor 构建应使用 ccache
- ARROW-5725 - [Crossbow] 将 conda 配方移植到 azure pipelines
- ARROW-5726 - [Java] 为 int 向量实现一个通用接口
- ARROW-5727 - [Python] [CI] 在运行测试之前安装 pytest-faulthandler
- ARROW-5748 - [打包][deb] 添加对 Debian GNU/Linux buster 的支持
- ARROW-5749 - [Python] 添加 Table::CombineChunks() 的 Python 绑定
- ARROW-5751 - [打包][Python] Python macOS wheels 具有对 libcares 的动态依赖
- ARROW-5752 - [Java] 提高 ArrowBuf#setZero 的性能
- ARROW-5755 - [Rust] [Parquet] 为 Type 添加派生的 clone
- ARROW-5768 - [Release] CHANGELOG.md 末尾有多余的换行符
- ARROW-5773 - [R] 在发布前清理文档
- ARROW-5780 - [C++] 为 Decimal128 操作添加基准测试
- ARROW-5782 - [Release] 在 dev/release/01-perform.sh 中设置 Flight 的测试数据
- ARROW-5783 - [Release][C#] 从 RAT 检查中排除 dummy.git
- ARROW-5785 - Rust datafusion 实现不应依赖 rustyline
- ARROW-5787 - [Release][Rust] 使用本地模块验证 RC
- ARROW-5793 - [Release] 避免 dev/release/03-binary.sh 中重复的已知主机 SSH 错误
- ARROW-5794 - [Release] 跳过上传已上传的二进制文件
- ARROW-5795 - [Release] 在上传二进制文件时添加缺少的等待
- ARROW-5796 - [Release][APT] 更新预期的软件包列表
- ARROW-5797 - [Release][APT] 更新支持的发行版
- ARROW-5813 - [C++] 支持检查不同连续张量的相等性
- ARROW-5818 - [Java][Gandiva] 支持变长输出向量
- ARROW-5820 - [Release] 从验证脚本中移除未定义的变量检查
- ARROW-653 - [Python / C++] 添加调试函数以十六进制打印数组的缓冲区内容
- ARROW-767 - [C++] 采用文件系统抽象
- ARROW-835 - [Format] 添加 Timedelta 类型以描述时间间隔
- ARROW-840 - [Python] 提供 Python API 用于创建可以保留 Arrow IPC 的用户定义数据类型
- ARROW-973 - [Website] 添加关于项目的 FAQ 页面
Bug 修复
- ARROW-1837 - [Java] 无法读取集成测试中位宽的带符号范围之外的无符号整数
- ARROW-2119 - [C++][Java] 处理具有零记录批次的 Arrow 流
- ARROW-2136 - [Python] 从 pandas 转换时未检查不可为空的模式字段
- ARROW-2256 - [C++] 使用 LLVM apt 仓库时,模糊测试构建在 Ubuntu 16.04 上直接失败
- ARROW-2461 - [Python] 为 manylinux2010 标签构建 wheel
- ARROW-3344 - [Python] test_plasma.py 失败 (在 test_plasma_list 中)
- ARROW-3399 - [Python] 无法序列化 numpy 矩阵对象
- ARROW-3650 - [Python] 混合列索引被读取回为字符串
- ARROW-3762 - [C++] 当 BinaryArray 容量溢出时,Parquet arrow::Table 读取错误
- ARROW-4021 - [Ruby] 在 msys2 上构建 red-arrow 时出错
- ARROW-4076 - [Python] 模式验证和过滤器
- ARROW-4139 - [Python] 如果设置了 UTF8 ConvertedType,则将 Parquet 列统计信息转换为 Unicode
- ARROW-4301 - [Java][Gandiva] Maven 快照版本更新似乎没有更新 Gandiva 子模块
- ARROW-4324 - [Python] 从混合 numpy 标量列表创建时,Array dtype 推断不正确
- ARROW-4350 - [Python] dtype=object 数组无法转换为列表的 ListArray
- ARROW-4447 - [C++] 研究 libthrift 的动态链接
- ARROW-4516 - [Python] 在没有 `_common_dataset` 但有空 `_tempfile` 的路径上创建 ParquetDataset 时出错
- ARROW-4523 - [JS] 添加行代理生成基准
- ARROW-4651 - [Format] Flight Location 应该比(主机,端口)对更灵活
- ARROW-4675 - [Python] 在 py2 中序列化 bool ndarray 并在 py3 中反序列化时出错
- ARROW-4694 - [CI] detect-changes.py 不一致
- ARROW-4723 - [Python] 读取包含 parquet 文件的目录时跳过 _files
- ARROW-4725 - [C++] 字典测试在 MinGW 构建下被禁用
- ARROW-4823 - [Python] read_csv 不应关闭它不拥有的文件句柄
- ARROW-4845 - [R] Windows MingW64 上的编译器警告
- ARROW-4851 - [Java] BoundsChecking.java 旧 Drill 参数的默认行为似乎不正确
- ARROW-4885 - [Python] read_csv() 无法处理 decimal128 列
- ARROW-4886 - [Rust] 将切片的原始数组转换为列表数组时行为不一致
- ARROW-4923 - 公开 Decimal 向量的 setter,该 setter 接受 long 和 double 输入
- ARROW-4934 - [Python] 解决将在 Python 3.8 中出现错误的弃用通知
- ARROW-5019 - [C#] ArrowStreamWriter 在不可搜索的流上不起作用
- ARROW-5049 - [Python] 在 spark 中使用 pyarrow FileSystem 时找不到 org/apache/hadoop/fs/FileSystem 类
- ARROW-5051 - [GLib][Gandiva] 发布验证脚本中的测试失败
- ARROW-5058 - [Release] 02-source.sh 生成带有错误链接的电子邮件模板
- ARROW-5068 - [Gandiva][Packaging] 修复 CMake 重构后的 gandiva nightly 构建
- ARROW-5090 - 由于 dylib 中的 @rpath,Parquet 链接在 MacOS 上失败
- ARROW-5092 - [C#] Source Link 不适用于 C# 发布脚本
- ARROW-5095 - [Flight][C++] Flight DoGet 未暴露服务器错误消息
- ARROW-5096 - [Packaging][deb] 缺少 plasma-store-server 软件包
- ARROW-5097 - [Packaging][CentOS6] arrow-lib 具有无法解析的依赖项
- ARROW-5098 - [Website] 更新 0.13.0 的 APT 安装文档
- ARROW-5100 - [JS] 如果缓冲区共享同一个底层 ArrayBuffer,则 Writer 交换字节顺序
- ARROW-5117 - [Go] 在初始化构建器后附加零切片时发生 panic
- ARROW-5119 - [Go] array.Boolean 的无效 Stringer 实现
- ARROW-5129 - [Rust][Parquet] 列写入器错误:添加新数据页时检查字典编码器
- ARROW-5130 - [Python] 在 Pyarrow 之后导入 TensorFlow 时发生段错误
- ARROW-5132 - [Java] 使用 Visual Studio 2017 在 Windows 上构建 gandiva_jni.dll 时出错
- ARROW-5138 - [Python/C++] 行组检索无法正确恢复索引
- ARROW-5142 - [CI] 修复 AppVeyor 脚本中的 conda 调用
- ARROW-5144 - [Python] ParquetDataset 和 ParquetPiece 不可序列化
- ARROW-5146 - [Dev] 合并脚本强制目录名
- ARROW-5147 - [C++] 构建时出错:找不到 DoubleConversion
- ARROW-5148 - [CI] [C++] 与 LLVM 相关的编译错误
- ARROW-5149 - [Packaging][Wheel] 在 Windows 构建中将 LLVM 锁定到版本 7
- ARROW-5152 - [Python] 构建时的 CMake 警告
- ARROW-5159 - 无法在 arrow crate 中构建 benches。
- ARROW-5160 - [C++] ABORT_NOT_OK 表达式求值两次
- ARROW-5166 - [Python][Parquet] uint64 列的统计信息可能溢出
- ARROW-5167 - [C++] 将 string-view-light 升级到最新版本
- ARROW-5169 - [Python] 在 Table.from_pandas 中,不可为空的字段被转换为可为空的字段
- ARROW-5173 - [Go] 处理多个串联的背靠背流
- ARROW-5174 - [Go] 为 DataTypes 实现 Stringer
- ARROW-5177 - [Python] ParquetReader.read_column() 不检查边界
- ARROW-5183 - [CI] AppVeyor 上的 MinGW 构建失败
- ARROW-5184 - [Rust] 断开的链接和其他文档警告
- ARROW-5194 - [C++][Plasma] TEST(PlasmaSerialization, GetReply) 正在失败
- ARROW-5195 - [Python] read_csv 忽略字符串类型的 null_values
- ARROW-5201 - [Python] 从集合导入 ABC 在 Python 3.7 中已弃用
- ARROW-5208 - [Python] 存在掩码时,pa.array() 中强制转换期间导致的结果类型不一致
- ARROW-5214 - [C++] 离线依赖下载器缺少一些库
- ARROW-5217 - [Rust] [CI] DataFusion 测试失败
- ARROW-5232 - [Java] 在 clear/setSafe 循环的情况下,值向量大小快速增加
- ARROW-5233 - [Go] 迁移到新的 flatbuffers-v1.11.0
- ARROW-5237 - [Python] pandas 元数据中的 pandas_version 键不再填充
- ARROW-5240 - [C++][CI] cmake_format 0.5.0 似乎使构建失败
- ARROW-5242 - [C++] 由于缩小,Arrow 无法使用 Visual Studio 2017 Update 9 或更高版本进行干净编译
- ARROW-5243 - [Java][Gandiva] 添加 decimal 比较函数的测试
- ARROW-5245 - [C++][CI] 取消固定 cmake_format
- ARROW-5246 - [Go] 在 CI 中使用 Go-1.12
- ARROW-5249 - [Java] Flight 客户端在某些情况下无法正确处理身份验证
- ARROW-5253 - [C++] 外部 Snappy 在 Alpine 上失败
- ARROW-5254 - [Flight][Java] DoAction 不支持结果流
- ARROW-5255 - [Java] 实现用户定义的数据类型 API
- ARROW-5260 - [Python][C++] 从一个全新的进程中的组件反序列化时崩溃
- ARROW-5274 - [JavaScript] countBy 的错误数组类型
- ARROW-5285 - [C++][Plasma] 当 GPU 对象被删除时,GpuProcessHandle 没有被释放
- ARROW-5293 - [C++] DictionaryArray 上的 Take kernel 没有保留 ordered 标志
- ARROW-5294 - [CI] setuptools_scm 失败
- ARROW-5296 - [Java] 零星的 Flight 测试失败
- ARROW-5301 - [Python] parquet 文档中关于 nthreads 参数的信息已过时
- ARROW-5306 - [CI] [GLib] 禁用 GTK-Doc
- ARROW-5308 - [Go] 移除已弃用的 Feather 格式
- ARROW-5314 - [Go] 带有 Offsets 的字符串数组的打印不正确
- ARROW-5325 - [Archery][Benchmark] 从 benchmark diff cli 命令输出格式正确的 jsonlines
- ARROW-5330 - [Python] [CI] 在 Travis-CI 上运行 Python Flight 测试
- ARROW-5332 - [R] R 包构建/安装失败:dyn.load() 中的错误
- ARROW-5348 - [CI] [Java] Gandiva checkstyle 失败
- ARROW-5360 - [Rust] 构建因 rustyline 在 nightly 2019-05-16+ 上中断
- ARROW-5362 - [C++] 压缩往返测试可能导致某些 sanitizers 失败
- ARROW-5371 - [Release] 为 dev/release/00-prepare.sh 添加测试
- ARROW-5373 - [Java] 添加 Gandiva Java 构建的缺失细节
- ARROW-5376 - [C++] 在 gcc 5.4.0 上的编译失败
- ARROW-5383 - [Go] 更新 IPC flatbuf (新的 Duration 类型)
- ARROW-5387 - [Go] 正确处理 List 的子切片
- ARROW-5388 - [Go] 在 array.NewChunked 中使用 arrow.TypeEqual
- ARROW-5390 - [CI] Travis 上的作业时间限制超出
- ARROW-5397 - 测试 Flight TLS 支持
- ARROW-5398 - [Python] Flight 测试因 URI 更改而中断
- ARROW-5403 - [C++] 测试失败没有在 Windows 共享构建中传播
- ARROW-5411 - [C++][Python] 在 Mac OS Mojave 上构建时出现构建错误
- ARROW-5412 - [Java] 集成测试失败,出现 UnsupportedOperationException
- ARROW-5419 - [C++] CSV strings_can_be_null 选项不尊重所有 null_values
- ARROW-5421 - [Packaging][Crossbow] 夜间测试配置中存在重复的键
- ARROW-5430 - [Python] 可以读取但不能写入基于 large ints 分区的 parquet
- ARROW-5435 - [Java] 为 IntervalYearVector#getAsStringBuilder 添加测试
- ARROW-5437 - [Python] Parquet 测试中缺少 pandas pytest marker
- ARROW-5446 - [C++] 使用 cmake 头部安装目录代替 include
- ARROW-5448 - [CI] AppVeyor 上的 MinGW 构建失败
- ARROW-5453 - [C++] 刚刚发布的 cmake-format 0.5.2 破坏了构建
- ARROW-5455 - [Rust] 构建因 2019-05-30 Rust nightly 而中断
- ARROW-5456 - [GLib][Plasma] 安装的 plasma-glib 可能会在构建文档时被使用
- ARROW-5457 - [GLib][Plasma] 用于测试的环境变量名称错误
- ARROW-5459 - [Go] 为 Float16 DataType 实现 Stringer
- ARROW-5462 - [Go] 支持写入零长度 List
- ARROW-5479 - [Rust] [DataFusion] 使用 ARROW_TEST_DATA 代替相对路径进行测试
- ARROW-5487 - [CI] [Python] 文档构建失败
- ARROW-5493 - [Integration/Go] 为 IPC 集成测试添加 Go 支持
- ARROW-5507 - [Plasma] [CUDA] 编译错误
- ARROW-5514 - [C++] uint64 的打印机显示错误的值
- ARROW-5517 - [C++] 头部集合 CMake 逻辑应仅考虑不包含目录的文件名
- ARROW-5520 - [C++][Packaging] AArch64C 上没有 NVidia CUDA 工具包
- ARROW-5521 - [Packaging] 许可证检查失败,出现 Apache RAT 0.13
- ARROW-5528 - 连接空二进制数组时,Concatenate() 崩溃。
- ARROW-5532 - [JS] 未读取字段元数据
- ARROW-5551 - [Go] 无效的 FixedSizeArray 表示
- ARROW-5553 - [Ruby] red-arrow gem 无法在 ruby:2.5 docker 镜像上编译
- ARROW-5576 - [C++] 不稳定的 thrift_ep tarball 下载
- ARROW-5577 - [C++] 由于 Alpine Linux 上的 googletest 共享库而链接失败
- ARROW-5583 - [Java] 当 NullableValueHolder 的 isSet 为 0 时,不应使用 buffer 字段
- ARROW-5584 - [Java] 在 FieldReader javadoc 中添加链接引用的导入
- ARROW-5589 - [C++][Fuzzing] arrow-ipc-fuzzing-test 崩溃 2354085db0125113f04f7bd23f54b85cca104713
- ARROW-5592 - [Go] 实现 Duration 数组
- ARROW-5596 - [Python] Flight 测试在 Python 2.7 上失败
- ARROW-5601 - [gandiva] 带有字符串字段的投影仪出错
- ARROW-5603 - [Python] 注册 pytest markers 以避免警告
- ARROW-5605 - [C++][Fuzzing] arrow-ipc-fuzzing-test 崩溃 74aec871d14bb6b07c72ea8f0e8c9f72cbe6b73c
- ARROW-5606 - [Python] pandas.RangeIndex._start/_stop/_step 已弃用
- ARROW-5608 - [C++][parquet] 使用 parquet::arrow::ColumnReader 时发生无效内存访问
- ARROW-5615 - [C++] 由于 gcc 5.4.0 Ubuntu 16.04 上的 C++11 字符串字面量导致的编译错误
- ARROW-5616 - [Python] C++ 构建针对 Python 2.7 头部文件失败
- ARROW-5617 - [C++] 当使用 ARROW_BOOST_VENDORED=ON 时,thrift_ep 0.12.0 构建失败
- ARROW-5619 - [C++] get_apache_mirror.py 无法与 Python 3.5 一起使用
- ARROW-5623 - [CI][GLib] 在 macOS 上失败
- ARROW-5624 - [C++] -Duriparser_SOURCE=BUNDLED 已损坏
- ARROW-5626 - [C++][Gandiva] 表达式缓存也应考虑精度和比例
- ARROW-5629 - [C++] 修复 Coverity 问题
- ARROW-5631 - [C++] CMake 3.2 构建已损坏
- ARROW-5648 - [C++] 在没有 codecvt 的 mingw 上构建失败
- ARROW-5654 - [C++] ChunkedArray 应该验证数组的类型
- ARROW-5674 - [Python] test_parquet.py 中缺少 pandas pytest markers
- ARROW-5675 - [Doc] 修复文档中描述在 macOS 上使用 Xcode IDE 进行编译/调试工作流程的错别字
- ARROW-5678 - [R][Lint] 修复 hadolint docker linting 错误
- ARROW-5693 - [Go] 跳过 Decimal128 的 IPC 集成测试
- ARROW-5697 - [GLib] c_glib/Dockerfile 已损坏
- ARROW-5698 - [R] r/Dockerfile docker-compose 构建已损坏
- ARROW-5709 - [C++] Windows 上的 gandiva-date_time_test 失败
- ARROW-5714 - [JS] 有/没有 BigNum 的 Int64Builder 中的行为不一致
- ARROW-5723 - [Gandiva][Crossbow] 构建失败
- ARROW-5728 - [Python] [CI] test_jvm.py 中的 Travis-CI 失败
- ARROW-5730 - [Python][CI] 在 dask 集成测试中选择性地跳过测试用例
- ARROW-5732 - [C++] macOS 构建在 master 上由于来自 pmmintrin.h 的警告而异常失败
- ARROW-5735 - [C++] Appveyor 构建在 thrift_ep 构建中持续失败
- ARROW-5737 - [C++][Gandiva] Gandiva 无法在 manylinux 中构建
- ARROW-5738 - [Crossbow][Conda] OSX 包构建因缺少 intrinsics 而失败
- ARROW-5739 - [CI] 修复 docker python 构建
- ARROW-5750 - [Java] Java 在 master 上编译失败
- ARROW-5754 - [C++] 缺少 ~GrpcStreamWriter 的 override?
- ARROW-5765 - [C++] TestDictionary.Validate 测试在 release 构建中崩溃
- ARROW-5769 - [Java] org.apache.arrow.flight.TestTls 通过 dev/release/00-prepare.sh 失败
- ARROW-5770 - [C++] 修复 result.h 中的 -Wpessimizing-move
- ARROW-5771 - [Python] Docker python-nopandas 作业失败
- ARROW-5774 - [Java][Documentation] 记录 flight 需要 checkout git 子模块
- ARROW-5781 - [Archery] 确保基准测试克隆接受修订中的 remotes
- ARROW-5791 - [Python] pyarrow.csv.read_csv 挂起 + 耗尽所有 RAM
- ARROW-5816 - [Release] 并行 curl 在 verify-release-candidate-sh 中无法可靠工作
- ARROW-5824 - [Gandiva] [C++] 修复 decimal null
- ARROW-61 - [Java] 方法可能返回大于 long MAX_VALUE 的值