Apache Arrow 0.8.0 (2017 年 12 月 18 日)
这是一个主要版本。
下载
贡献者
$ git shortlog -sn apache-arrow-0.7.1..apache-arrow-0.8.0
90 Wes McKinney
23 Phillip Cloud
21 Kouhei Sutou
13 Licht-T
12 Korn, Uwe
12 Philipp Moritz
12 Uwe L. Korn
10 Bryan Cutler
5 Li Jin
5 Robert Nishihara
4 Paul Taylor
4 siddharth
3 Max Risuhin
3 Stephanie
2 Rene Sugar
2 Heimir Sverrisson
2 Brian Hulette
2 Yuliya Feldman
2 dhirschf
2 Matthias Vallentin
1 vkorukanti
1 Andrew Andrade
1 Benjamin Goldberg
1 Ivan Sadikov
1 John Jenkins
1 Joris Van den Bossche
1 Lewis John McGibbney
1 Lu Qi
1 Manuel
1 Nick White
1 Ofek Lev
1 Shixiong Zhu
1 Siddharth Teotia
1 Stephen G
1 Victor Uriarte
1 Wataru Shimizu
1 ksdevlife
1 lmeyerov
1 rvernica
1 Amir Malekpour
补丁提交者
以下 Apache 提交者提交了对存储库的贡献补丁。
$ git shortlog -csn apache-arrow-0.7.0..apache-arrow-0.8.0
236 Wes McKinney
35 Uwe L. Korn
10 Philipp Moritz
5 Kouhei Sutou
1 Steven Phillips
变更日志
新特性和改进
- ARROW-1032 - [JS] 支持 custom_metadata
- ARROW-1047 - [Java] 添加通用的流写入器和读取器接口,它们与 IO / 消息框架分离
- ARROW-1087 - [Python] 添加 get_include 以公开包含头文件的目录
- ARROW-1114 - [C++] 创建 Record Batch Builder 类,作为将逐行数据转置为列的可重用且高效的方式
- ARROW-1134 - [C++] 允许 C++/CLI 项目使用 Arrow 构建
- ARROW-1178 - [Python] 创建 Table.from_pandas 的替代方案,该方案生成具有给定块大小的 RecordBatch 对象列表
- ARROW-1226 - [C++] 改进/更正 arrow::ipc 中的 doxygen 函数文档
- ARROW-1250 - [Python] 定义用于数组类型用户类型检查的 API
- ARROW-1369 - 在 javascript arrow 读取器库中支持布尔类型
- ARROW-1371 - [网站] 向网站添加“技术支持”页面
- ARROW-1455 - [Python] 添加 Dockerfile 以验证常规 CI 之外的 Dask 集成
- ARROW-1471 - [JAVA] 记录 ValueVector 更新的要求和非/要求
- ARROW-1472 - [JAVA] 设计更新的 ValueVector 对象层次结构
- ARROW-1473 - [JAVA] 创建原型代码层次结构(实施阶段 1)
- ARROW-1474 - [JAVA] ValueVector 层次结构(实施阶段 2)
- ARROW-1476 - [JAVA] 实施最终的 ValueVector 更新
- ARROW-1482 - [C++] 实施 date32 和 date64 之间的转换
- ARROW-1483 - [C++] 实施 time32 和 time64 之间的转换
- ARROW-1484 - [C++] 实施不同单位的时间戳和时间之间的(安全和不安全)转换
- ARROW-1486 - [C++] 确定 arrow::RecordBatch 是否需要可复制
- ARROW-1487 - [C++] 实施从 List<A> 到 List<B> 的转换,其中定义了从任何 A 到 B 的转换函数
- ARROW-1488 - [C++] 根据 internal::ArrayData 实施 ArrayBuilder::Finish
- ARROW-1498 - [GitHub] 添加 CONTRIBUTING.md 和 ISSUE_TEMPLATE.md
- ARROW-1503 - [Python] 在 pyarrow.serialize 中为 pandas 对象添加序列化回调
- ARROW-1522 - [C++] 在 pyarrow.serialize 中支持 pyarrow.Buffer 作为内置类型
- ARROW-1523 - [C++] 添加带有用于读取可能具有非零偏移的有效性位图的方法的辅助数据结构
- ARROW-1524 - [C++] 用于处理计算库中输入和输出的非零偏移的更优雅的解决方案
- ARROW-1525 - [C++] 更改 arrow/compare.h 中的函数以不返回 Status
- ARROW-1526 - [Python] 单元测试以执行 PARQUET-1100 中的代码路径
- ARROW-1535 - [Python] 启用 sdist 源 tarball 构建,假设主机系统上提供了 Arrow C++ 库
- ARROW-1538 - [C++] 在 .deb 打包自动化中支持 Ubuntu 14.04
- ARROW-1539 - [C++] 删除自 0.7.0 及更早版本以来已弃用的函数
- ARROW-1556 - [C++] 合并 PARQUET-1100 补丁中的 AssertArraysEqual 函数
- ARROW-1559 - [C++] “unique” 的内核实现(计算数组的不同元素)
- ARROW-1573 - [C++] 实施使用 DictionaryBuilder 计算字典索引的有状态内核函数
- ARROW-1575 - [Python] 添加 pyarrow.column 工厂函数
- ARROW-1577 - [JS] NPM 模块的软件包发布脚本
- ARROW-1588 - [C++/Format] 加强 Decimal 格式
- ARROW-1593 - [PYTHON] serialize_pandas 应该传递 preserve_index 关键字
- ARROW-1594 - [Python] 在 Table.from_pandas 中启用多线程转换
- ARROW-1600 - [C++] 来自 std::string 的零拷贝 Buffer 构造函数
- ARROW-1602 - [C++] 向 arrow::Array 添加 IsValid/IsNotNull 方法
- ARROW-1603 - [C++] 添加 BinaryArray 方法以获取作为 std::string 的值
- ARROW-1604 - [Python] 在 cast(…) 和各种 type= 参数中支持常见的类型别名
- ARROW-1605 - [Python] pyarrow.array 应该能够在没有显式转换的情况下生成更小的整数类型
- ARROW-1607 - [C++] 为 Decimal 实施 DictionaryBuilder
- ARROW-1613 - [Java] ArrowReader 不应关闭输入 ReadChannel
- ARROW-1616 - [Python] 向 RecordBatchStreamWriter 添加“write”方法,该方法根据需要分派到 write_table/write_back
- ARROW-1626 - 添加 make targets 以运行称为“infer”的过程间静态分析工具。
- ARROW-1627 - [JAVA] 减少堆使用量(阶段 2)- AllocationManager.BufferLedger 中的内存占用
- ARROW-1630 - [序列化] 支持 Python datetime 对象
- ARROW-1631 - [C++] 将 GRPC 添加到 ThirdpartyToolchain.cmake
- ARROW-1635 - 为 PMC 添加发布管理指南
- ARROW-1637 - [C++] 空类型的 IPC 往返
- ARROW-1641 - [C++] 不要包括
在公共标头中 - ARROW-1648 - C++:添加从 Dictionary[NullType] 到 NullType 的转换
- ARROW-1649 - C++:在 NullArray 的 PrettyPrint 中打印空值的数量
- ARROW-1651 - [JS] 表中的延迟行访问器
- ARROW-1652 - [JS] 将 Vector 分成 BatchVector 和 CompositeVector
- ARROW-1654 - [Python] pa.DataType 无法被 pickle
- ARROW-1662 - 将 OSX 依赖项管理移动到 brew bundle Brewfiles
- ARROW-1665 - [序列化] 在默认序列化上下文中支持更多自定义数据类型
- ARROW-1666 - [GLib] 在 Travis CI Mac 环境上启用 gtk-doc
- ARROW-1667 - [GLib] 支持 Meson
- ARROW-1671 - [C++] 更改 arrow::MakeArray 以不返回 Status
- ARROW-1675 - [Python] 在 FeatherWriter.write 中使用 RecordBatch.from_pandas
- ARROW-1677 - [博客] 添加关于 Ray 和 Arrow Python 序列化的博客文章
- ARROW-1679 - [GLib] 添加 garrow_record_batch_reader_read_next()
- ARROW-1683 - [Python] 将“TimestampType”恢复到 pyarrow 命名空间
- ARROW-1684 - [Python] 简化用于读取嵌套 Parquet 列的用户 API
- ARROW-1685 - [GLib] 添加 GArrowTableReader
- ARROW-1689 - [Python] 分类索引应该是零拷贝
- ARROW-1690 - [GLib] 添加 garrow_array_is_valid()
- ARROW-1691 - [Java] 使 Java Decimal 类型实现符合 ARROW-1588 中的格式决策
- ARROW-1697 - [GitHub] 添加 ISSUE_TEMPLATE.md
- ARROW-1701 - [序列化] 支持零拷贝 PyTorch Tensor 序列化
- ARROW-1702 - 更新 manylinux1 构建中的 jemalloc
- ARROW-1703 - [C++] 提供我们依赖的 jemalloc 的确切版本
- ARROW-1707 - 在移动到 GitBox 后更新开发 README
- ARROW-1710 - [Java] 在新的向量类层次结构中删除不可为空的向量
- ARROW-1716 - [Format/JSON] 在JSON中使用字符串整数值表示Decimal类型
- ARROW-1717 - [Java] 移除vector类中用于JSONReader/Writer的公共静态助手方法
- ARROW-1718 - [Python] 实现从时间戳到date32/date64的转换,并在Array.from_pandas中支持
- ARROW-1719 - [Java] 移除accessor/mutator
- ARROW-1721 - [Python] 在numpy_to_arrow.cc中不支持的地方支持空掩码
- ARROW-1724 - [Packaging] 支持Ubuntu 17.10
- ARROW-1725 - [Packaging] 上传Ubuntu 17.10的.deb包
- ARROW-1726 - [GLib] 添加设置描述以验证C GLib构建
- ARROW-1727 - [Format] 扩展Arrow流式传输格式,以允许新的字典和对现有字典的增量/添加
- ARROW-1728 - [C++] 在Travis CI中运行clang-format检查
- ARROW-1734 - C++/Python: 在列级别添加cast函数
- ARROW-1736 - [GLib] 添加GArrowCastOptions:allow-time-truncate
- ARROW-1737 - [GLib] 使用G_DECLARE_DERIVABLE_TYPE
- ARROW-1746 - [Python] 为Arch Linux添加构建依赖项
- ARROW-1747 - [C++] 不要导出静态链接库的符号
- ARROW-1748 - [GLib] 添加GArrowRecordBatchBuilder
- ARROW-1750 - [C++] 移除对arrow/util/random.h的需求
- ARROW-1752 - [Packaging] 为Debian和Ubuntu添加GPU包
- ARROW-1753 - [Python] 提供在序列化上下文中用register_type匹配子类的方法
- ARROW-1755 - [C++] 添加MSVC的构建选项以使用静态运行时库
- ARROW-1758 - [Python] 移除对象序列化的pickle=True选项
- ARROW-1763 - [Python] DataType应该是可哈希的
- ARROW-1765 - [Doc] 在C++ docker构建中使用conda的依赖项
- ARROW-1767 - [C++] 支持Windows上超过2GB的文件读写
- ARROW-1772 - [C++] 以parquet-cpp的风格添加public-api-test模块
- ARROW-1773 - [C++] 添加从日期/时间类型到兼容的带符号整数的转换
- ARROW-1775 - 能够中止已创建但未密封的Plasma对象
- ARROW-1777 - [C++] 添加静态构造函数ArrayData::Make以便在某些地方使用更友好的语法
- ARROW-1779 - [Java] 如果不将有效性向量归零,集成测试将会失败
- ARROW-1782 - [Python] 将压缩器公开为pyarrow.compress, pyarrow.decompress
- ARROW-1783 - [Python] 通过最小的内存分配/复制将SerializedPyObject转换为/从组件缓冲区序列
- ARROW-1784 - [Python] 通过分解BlockManager而不是强制转换为Arrow格式,在pyarrow.serialize中读取和写入pandas.DataFrame
- ARROW-1785 - [Format/C++/Java] 从Flatbuffers元数据中删除VectorLayout元数据
- ARROW-1787 - [Python] 支持以向后兼容的方式将parquet文件读取到DataFrames中
- ARROW-1794 - [C++/Python] 将DecimalArray重命名为Decimal128Array
- ARROW-1801 - [Docs] 更新安装说明以使用red-data-tools仓库
- ARROW-1802 - [GLib] 添加Arrow GPU支持
- ARROW-1806 - [GLib] 添加garrow_record_batch_writer_write_table()
- ARROW-1808 - [C++] 使RecordBatch接口虚拟化,以允许延迟物化列的记录批处理
- ARROW-1809 - [GLib] 对于GTK-Doc主文件,使用.xml代替.sgml
- ARROW-1810 - [Plasma] 移除测试shell脚本
- ARROW-1817 - 配置JsonFileReader以读取浮点数的NaN
- ARROW-1818 - 检查Java依赖项
- ARROW-1819 - [Java] 移除旧的vector类
- ARROW-1826 - [JAVA] 避免在单元格级别进行分支(copyFrom)
- ARROW-1827 - [Java] 添加checkstyle配置文件和头文件
- ARROW-1828 - [C++] 实现BooleanType的哈希内核专业化
- ARROW-1834 - [Doc] 在单独的构建文件夹中构建文档
- ARROW-1838 - [C++] 将compute::Datum统一用于内核的输入参数
- ARROW-1841 - [JS] 更新text-encoding-utf-8和tslib以支持node ESModules
- ARROW-1844 - [C++] 哈希内核的基本基准测试套件
- ARROW-1849 - [GLib] 将输入检查添加到GArrowRecordBatch
- ARROW-1850 - [C++] 在Writable::Write中使用const void*代替const uint8_t*
- ARROW-1854 - [Python] 提高序列化对象dtype ndarrays的性能
- ARROW-1855 - [GLib] 添加macOS上构建失败的解决方法
- ARROW-1857 - [Python] 为wheels中带有静态parquet的boost链接添加开关
- ARROW-1859 - [GLib] 添加GArrowDictionaryDataType
- ARROW-1862 - [GLib] 添加GArrowDictionaryArray
- ARROW-1864 - [Java] 将Netty升级到4.1.x
- ARROW-1867 - [Java] 从旧的vector类添加BitVector API
- ARROW-1874 - [GLib] 添加garrow_array_unique()
- ARROW-1878 - [GLib] 添加garrow_array_dictionary_encode()
- ARROW-1884 - [C++] 将JsonReader/JsonWriter类设为内部API
- ARROW-1885 - [Java] 恢复之前的MapVector类名称
- ARROW-1901 - [Python] 支持DaskFilesystem的递归mkdir
- ARROW-1902 - [Python] 从write_to_dataset中移除mkdir竞争条件
- ARROW-1905 - [Python] 在pyarrow.types中添加更多用于检查精确类型的函数
- ARROW-1911 - 将Graphistry添加到Arrow JS的验证点
- ARROW-480 - [Python] 添加Parquet列统计信息的访问器
- ARROW-504 - [Python] 添加适配器以用户选择的块大小将pandas.DataFrame写入流式传输格式
- ARROW-507 - [C++/Python] 从偏移量和值子数组构造List容器
- ARROW-541 - [JS] 实现JavaScript兼容的实现
- ARROW-571 - [Python] 添加API以从Arrow表逐步构建Parquet文件
- ARROW-587 - 将JIRA修复版本添加到合并工具
- ARROW-609 - [C++] 用于将自UNIX纪元以来的天数转换为int64日期的函数
- ARROW-838 - [Python] 从非pandas 1D NumPy数组高效构建数组
- ARROW-905 - [Docs] 添加Dockerfile以实现可重现的文档生成
- ARROW-942 - 支持在Python 2.7上进行集成测试
- ARROW-950 - [Site] 添加Google Analytics标签
- ARROW-972 - [Python] 为UnionArray添加测试用例和基本API
缺陷修复
- ARROW-1282 - Arrow的大内存重新分配导致jemalloc挂起
- ARROW-1341 - [C++] 反对arrow::MakeTable,转而使用来自ARROW-1334的新构造函数
- ARROW-1347 - [JAVA] List null类型应该对内部字段使用一致的名称
- ARROW-1398 - [Python] 不支持读取decimal(19,4)类型的列
- ARROW-1409 - [Format] 在元数据中的Buffer中使用“page”属性
- ARROW-1540 - [C++] 如果可能,修复cuda-test中的valgrind警告
- ARROW-1541 - [C++] arrow_gpu中的竞争条件
- ARROW-1543 - [C++] row_wise_conversion示例与ListBuilder构造函数参数不对应
- ARROW-1549 - [JS] 集成自动生成的Arrow测试文件
- ARROW-1555 - [Python] s3上的write_to_dataset
- ARROW-1584 - [PYTHON] 在空dataframe上serialize_pandas
- ARROW-1585 - serialize_pandas往返在整数列上失败
- ARROW-1586 - [PYTHON] serialize_pandas往返会丢失列名
- ARROW-1609 - Plasma:使用Xcode 9.0构建失败
- ARROW-1615 - 用于开发的CXX标志比Travis CI构建更宽松
- ARROW-1617 - [Python] 不要在python/cmake_modules中使用符号链接
- ARROW-1620 - Python: 从bintray下载manylinux1构建中的Boost
- ARROW-1624 - [C++] 针对Plasma / LLVM 4.0的编译器警告进行后续修复/调整,并添加到自述文件中
- ARROW-1625 - [Serialization] 正确支持OrderedDict
- ARROW-1629 - [C++] 修复infer工具标识的问题代码路径
- ARROW-1633 - [Python] 不理解numpy“unicode”数组
- ARROW-1640 - 解决Travis CI中的OpenSSL问题
- ARROW-1647 - [Plasma] 读取/写入消息时可能存在错误
- ARROW-1653 - [Plasma] 使用静态强制转换以避免编译器警告
- ARROW-1656 - [C++] Windows和Mac上的Endianness宏不正确
- ARROW-1657 - [C++] Arch Linux上多线程读取测试失败
- ARROW-1658 - [Python] 转换为pandas后,超出范围的字典索引会导致段错误
- ARROW-1663 - [Java] 跟进ARROW-1347并使schema向后兼容
- ARROW-1670 - [Python] 加速反序列化代码路径
- ARROW-1672 - [Python] 无法写入Feather字节列
- ARROW-1673 - [Python] NumPy 布尔数组在 NdarrayToTensor 往返过程中被转换为 uint8 数组
- ARROW-1676 - [C++] 在写入 Feather 格式时正确截断过大的有效性位图
- ARROW-1678 - [Python] numpy.float16 的不正确序列化
- ARROW-1680 - [Python] 在 from_pandas() 转换中未完成时间戳单位更改
- ARROW-1686 - 文档生成脚本在 site/java 下创建 “apidocs” 目录
- ARROW-1693 - [JS] 读取字典编码的集成测试文件时出错
- ARROW-1695 - [序列化] 修复自定义序列化器中创建的 numpy 数组的引用计数
- ARROW-1698 - [JS] 文件读取器尝试多次加载同一个字典批次
- ARROW-1704 - [GLib] 测试套件中的 Go 示例已损坏
- ARROW-1708 - [JS] Linter 问题导致主构建失败
- ARROW-1709 - [C++] Decimal.ToString 对于负比例不正确
- ARROW-1711 - [Python] flake8 检查仍然没有使构建失败
- ARROW-1714 - [Python] 没有命名的 pd.Series 名称被序列化为 u’None’
- ARROW-1720 - [Python] 尝试访问越界块时发生段错误
- ARROW-1723 - Windows: 构建 arrow 静态库时指定了 __declspec(dllexport)
- ARROW-1730 - [Python] 传递时间戳类型时,pyarrow.array 返回不正确的结果
- ARROW-1732 - [Python] 当 preserve_index=False 时,RecordBatch.from_pandas 在没有列的 DataFrame 上失败
- ARROW-1735 - [C++] Cast 内核无法写入切片输出数组
- ARROW-1738 - [Python] 使用单位 pa.array 进行错误的日期时间转换
- ARROW-1739 - [Python] 修复导致构建中断的 assertRaises 的用法
- ARROW-1742 - C++: clang-format 在 OSX 上无法正确检测到
- ARROW-1743 - [Python] 当索引包含 categorical 列时,Table to_pandas 失败
- ARROW-1745 - Mac OS 上的 plasma 测试编译失败
- ARROW-1749 - [C++] 处理需要显示 39 位数字的 Decimal128 值范围
- ARROW-1751 - [Python] Pandas 0.21.0 引入了 MultiIndex 构造的突破性 API 更改
- ARROW-1754 - [Python] 当索引名称与列名称相同时,修复有缺陷的 Parquet 往返
- ARROW-1756 - [Python] 在 Feather 写入/读取路径中观察到 int32 溢出
- ARROW-1762 - [C++] 语言环境的 unittest 失败
- ARROW-1764 - [Python] 为 Windows 开发安装说明添加 -c conda-forge
- ARROW-1766 - [GLib] 修复 OSX 上失败的构建
- ARROW-1768 - [Python] 修复 ParquetWriter.__del__ 中的抑制异常
- ARROW-1770 - [GLib] 修复 GLib 编译器警告
- ARROW-1771 - [C++] ARROW-1749 打破了 parquet-cpp 中的公共 API 测试
- ARROW-1776 - [C++[ 未定义 arrow::gpu::CudaContext::bytes_allocated()
- ARROW-1778 - [Python] 在 manylinux1 wheels 中静态地、私有地链接 parquet-cpp
- ARROW-1781 - [CI] Travis-CI 上的 OSX 构建经常超时
- ARROW-1788 - 当尝试中止断开连接的客户端的对象时,Plasma 存储崩溃
- ARROW-1791 - 集成测试生成超出合理范围的 date[DAY] 值
- ARROW-1793 - [集成] 修复 README.md 中的拼写错误
- ARROW-1800 - [C++] 修复并简化 random_decimals
- ARROW-1805 - [Python] 探索数据集时忽略非 parquet 文件
- ARROW-1811 - [C++/Python] 将所有基于 Decimal 的 API 重命名为 Decimal128
- ARROW-1812 - 在客户端断开连接期间迭代时,Plasma 存储修改哈希表
- ARROW-1821 - 添加集成测试用例以显式检查可选的有效性缓冲区
- ARROW-1829 - [Plasma] 清理驱逐策略簿记
- ARROW-1830 - [Python] 加载字典中的所有文件时出错
- ARROW-1836 - [C++] 修复 MSVC 构建中 arrow/util/variant.h 的 C4996 警告
- ARROW-1839 - [C++/Python] 添加 Decimal Parquet 读/写测试
- ARROW-1840 - [网站] 安装命令在 Windows10 anaconda 环境下失败。
- ARROW-1845 - [Python] 公开 Decimal128Type
- ARROW-1852 - [Plasma] 使检索管理器文件描述符为 const
- ARROW-1853 - [Plasma] 修复重试处理中的差一错误
- ARROW-1863 - [Python] PyObjectStringify 可以为更多类型的对象渲染类似字节的输出
- ARROW-1865 - [C++] 向空 Table 添加列失败
- ARROW-1869 - 修复 LowCostIdentityHashMap 中的拼写错误
- ARROW-1871 - [Python/C++] 附加具有不同比例的 Python Decimals 需要重新缩放
- ARROW-1873 - [Python] 加载总计 2GB 的 parquet 文件时发生段错误
- ARROW-1877 - JsonStringArrayList.equals 中的不正确比较
- ARROW-1879 - [Python] 如果未安装 dask,则不会跳过 Dask 集成测试
- ARROW-1881 - [Python] setuptools_scm 获取 JS 版本标签
- ARROW-1882 - [C++] 重新引入 DictionaryBuilder
- ARROW-1883 - [Python] BUG: 如果列不存在,则 Table.to_pandas 元数据检查失败
- ARROW-1889 - [Python] –exclude 在旧版本的 git 中不可用
- ARROW-1890 - [Python] date32 数组的掩码不起作用
- ARROW-1891 - [Python] 仅在使用 from_pandas 时,NaT date32 值才转换为 null
- ARROW-1892 - [Python] 未知的列表项类型:binary
- ARROW-1893 - [Python] test_primitive_serialization 在 Python 2.7.3 上失败
- ARROW-1895 - [Python] 将 field_name 添加到 pandas 索引元数据
- ARROW-1897 - [Python] Categoricals 的 pandas 元数据的 numpy_type 不正确
- ARROW-1904 - [C++] 弃用 PrimitiveArray::raw_values
- ARROW-1906 - [Python] 创建具有不同单位时间戳的 pyarrow.Array 不会被转换
- ARROW-1908 - [Python] 从具有重复列名的 pandas DataFrame 构建 arrow 表崩溃
- ARROW-1910 - CPP README Brewfile 链接不正确
- ARROW-1914 - [C++] 使用 -DARROW_GPU=on 时,make -j 可能无法构建
- ARROW-1915 - [Python] Parquet 测试应该是可选的
- ARROW-1916 - [Java] 不要从源代码发布中排除 java/dev/checkstyle
- ARROW-1917 - [GLib] 必须在 verify-release-candidate.sh 中设置 GI_TYPELIB_PATH
- ARROW-226 - [C++] libhdfs: 反馈以帮助确定打开文件路径的失败原因
- ARROW-641 - [C++] 如果 ARROW_HDFS=off,则不要构建/运行 io-hdfs-test