Apache Arrow 0.8.0 (2017年12月18日)
这是一个主要版本。
下载
贡献者
$ git shortlog -sn apache-arrow-0.7.1..apache-arrow-0.8.0
90 Wes McKinney
23 Phillip Cloud
21 Kouhei Sutou
13 Licht-T
12 Korn, Uwe
12 Philipp Moritz
12 Uwe L. Korn
10 Bryan Cutler
5 Li Jin
5 Robert Nishihara
4 Paul Taylor
4 siddharth
3 Max Risuhin
3 Stephanie
2 Rene Sugar
2 Heimir Sverrisson
2 Brian Hulette
2 Yuliya Feldman
2 dhirschf
2 Matthias Vallentin
1 vkorukanti
1 Andrew Andrade
1 Benjamin Goldberg
1 Ivan Sadikov
1 John Jenkins
1 Joris Van den Bossche
1 Lewis John McGibbney
1 Lu Qi
1 Manuel
1 Nick White
1 Ofek Lev
1 Shixiong Zhu
1 Siddharth Teotia
1 Stephen G
1 Victor Uriarte
1 Wataru Shimizu
1 ksdevlife
1 lmeyerov
1 rvernica
1 Amir Malekpour
补丁提交者
以下 Apache 提交者为代码仓库贡献了补丁。
$ git shortlog -csn apache-arrow-0.7.0..apache-arrow-0.8.0
236 Wes McKinney
35 Uwe L. Korn
10 Philipp Moritz
5 Kouhei Sutou
1 Steven Phillips
更新日志
新功能和改进
- ARROW-1032 - [JS] 支持 custom_metadata
- ARROW-1047 - [Java] 添加通用的流写入器和读取器接口,与 IO / 消息帧解耦
- ARROW-1087 - [Python] 添加 get_include 以暴露包含头文件的目录
- ARROW-1114 - [C++] 创建 Record Batch Builder 类,作为一种可重用且高效的方式,将逐行数据转换为列式数据
- ARROW-1134 - [C++] 允许 C++/CLI 项目使用 Arrow 进行构建
- ARROW-1178 - [Python] 为 Table.from_pandas 创建替代方案,该方案可以生成一个具有给定块大小的 RecordBatch 对象列表
- ARROW-1226 - [C++] 改进/修正 arrow::ipc 中的 doxygen 函数文档
- ARROW-1250 - [Python] 为数组类型的用户类型检查定义 API
- ARROW-1369 - 在 JavaScript Arrow 读取器库中支持布尔类型
- ARROW-1371 - [网站] 在网站上添加“技术支持”页面
- ARROW-1455 - [Python] 添加 Dockerfile 用于在常规 CI 之外验证 Dask 集成
- ARROW-1471 - [JAVA] 记录 ValueVector 更新的要求和非要求
- ARROW-1472 - [JAVA] 设计更新的 ValueVector 对象层次结构
- ARROW-1473 - [JAVA] 创建原型代码层次结构(实现阶段 1)
- ARROW-1474 - [JAVA] ValueVector 层次结构(实现阶段 2)
- ARROW-1476 - [JAVA] 实现最终的 ValueVector 更新
- ARROW-1482 - [C++] 实现 date32 和 date64 之间的转换
- ARROW-1483 - [C++] 实现 time32 和 time64 之间的转换
- ARROW-1484 - [C++] 实现不同单位的时间戳和时间之间的(安全和不安全)转换
- ARROW-1486 - [C++] 决定 arrow::RecordBatch 是否需要是可复制的
- ARROW-1487 - [C++] 实现从 List<A> 到 List<B> 的转换,其中定义了从任意 A 到 B 的转换函数
- ARROW-1488 - [C++] 基于 internal::ArrayData 实现 ArrayBuilder::Finish
- ARROW-1498 - [GitHub] 添加 CONTRIBUTING.md 和 ISSUE_TEMPLATE.md
- ARROW-1503 - [Python] 在 pyarrow.serialize 中为 pandas 对象添加序列化回调
- ARROW-1522 - [C++] 在 pyarrow.serialize 中支持 pyarrow.Buffer 作为内置类型
- ARROW-1523 - [C++] 为可能具有非零偏移量的有效性位图添加一个带有读取方法的辅助数据结构
- ARROW-1524 - [C++] 在计算库中为输入和输出的非零偏移量提供更优雅的处理方案
- ARROW-1525 - [C++] 更改 arrow/compare.h 中的函数,使其不返回 Status
- ARROW-1526 - [Python] 为 PARQUET-1100 中的代码路径编写单元测试
- ARROW-1535 - [Python] 假设主机系统上已有 Arrow C++ 库,使 sdist 源码包能够构建
- ARROW-1538 - [C++] 在 .deb 打包自动化中支持 Ubuntu 14.04
- ARROW-1539 - [C++] 移除 0.7.0 及之前版本中已弃用的函数
- ARROW-1556 - [C++] 从 PARQUET-1100 补丁中引入 AssertArraysEqual 函数
- ARROW-1559 - [C++] "unique"(计算数组中的不同元素)的内核实现
- ARROW-1573 - [C++] 实现使用 DictionaryBuilder 计算字典索引的有状态内核函数
- ARROW-1575 - [Python] 添加 pyarrow.column 工厂函数
- ARROW-1577 - [JS] 用于 NPM 模块的包发布脚本
- ARROW-1588 - [C++/格式] 强化 Decimal 格式
- ARROW-1593 - [PYTHON] serialize_pandas 应该传递 preserve_index 关键字
- ARROW-1594 - [Python] 在 Table.from_pandas 中启用多线程转换
- ARROW-1600 - [C++] 从 std::string 实现零拷贝的 Buffer 构造函数
- ARROW-1602 - [C++] 向 arrow::Array 添加 IsValid/IsNotNull 方法
- ARROW-1603 - [C++] 添加 BinaryArray 方法以 std::string 形式获取值
- ARROW-1604 - [Python] 在 cast(...) 和各种 type= 参数中支持通用类型别名
- ARROW-1605 - [Python] pyarrow.array 应该能够在无需显式转换的情况下生成更小的整数类型
- ARROW-1607 - [C++] 为 Decimals 实现 DictionaryBuilder
- ARROW-1613 - [Java] ArrowReader 不应关闭输入的 ReadChannel
- ARROW-1616 - [Python] 向 RecordBatchStreamWriter 添加“write”方法,该方法会根据情况分派到 write_table/write_back
- ARROW-1626 - 添加 make 目标来运行名为“infer”的跨过程静态分析工具。
- ARROW-1627 - [JAVA] 减少堆使用(阶段 2)- AllocationManager.BufferLedger 中的内存占用
- ARROW-1630 - [序列化] 支持 Python datetime 对象
- ARROW-1631 - [C++] 将 GRPC 添加到 ThirdpartyToolchain.cmake
- ARROW-1635 - 为 PMC 添加发布管理指南
- ARROW-1637 - [C++] 空类型的 IPC 往返
-
ARROW-1641 - [C++] 不在公共头文件中包含
io/hdfs.h - ARROW-1648 - C++: 添加从 Dictionary[NullType] 到 NullType 的转换
- ARROW-1649 - C++: 在 PrettyPrint for NullArray 中打印空值的数量
- ARROW-1651 - [JS] Table 中的延迟行访问器
- ARROW-1652 - [JS] 将 Vector 分离为 BatchVector 和 CompositeVector
- ARROW-1654 - [Python] pa.DataType 无法被 pickle
- ARROW-1662 - 将 OSX 依赖管理移至 brew bundle Brewfiles
- ARROW-1665 - [序列化] 在默认序列化上下文中支持更多自定义数据类型
- ARROW-1666 - [GLib] 在 Travis CI Mac 环境中启用 gtk-doc
- ARROW-1667 - [GLib] 支持 Meson
- ARROW-1671 - [C++] 更改 arrow::MakeArray 使其不返回 Status
- ARROW-1675 - [Python] 在 FeatherWriter.write 中使用 RecordBatch.from_pandas
- ARROW-1677 - [博客] 添加关于 Ray 和 Arrow Python 序列化的博客文章
- ARROW-1679 - [GLib] 添加 garrow_record_batch_reader_read_next()
- ARROW-1683 - [Python] 将 "TimestampType" 恢复到 pyarrow 命名空间
- ARROW-1684 - [Python] 简化用于读取嵌套 Parquet 列的用户 API
- ARROW-1685 - [GLib] 添加 GArrowTableReader
- ARROW-1689 - [Python] 分类索引应为零拷贝
- ARROW-1690 - [GLib] 添加 garrow_array_is_valid()
- ARROW-1691 - [Java] 使 Java Decimal 类型实现符合 ARROW-1588 中的格式决定
- ARROW-1697 - [GitHub] 添加 ISSUE_TEMPLATE.md
- ARROW-1701 - [序列化] 支持零拷贝 PyTorch Tensor 序列化
- ARROW-1702 - 在 manylinux1 构建中更新 jemalloc
- ARROW-1703 - [C++] 引入我们所依赖的 jemalloc 的确切版本
- ARROW-1707 - 在迁移到 GitBox 后更新开发者 README
- ARROW-1710 - [Java] 在新的向量类层次结构中移除不可为空的向量
- ARROW-1716 - [格式/JSON] 在 JSON 中为 Decimals 使用字符串整数值
- ARROW-1717 - [Java] 为 JSONReader/Writer 移除向量类中的公共静态辅助方法
- ARROW-1718 - [Python] 实现从时间戳到 date32/date64 的转换,并在 Array.from_pandas 中提供支持
- ARROW-1719 - [Java] 移除访问器/修改器
- ARROW-1721 - [Python] 在 numpy_to_arrow.cc 中尚不支持空值掩码的地方提供支持
- ARROW-1724 - [打包] 支持 Ubuntu 17.10
- ARROW-1725 - [打包] 为 Ubuntu 17.10 上传 .deb 包
- ARROW-1726 - [GLib] 添加设置说明以验证 C GLib 构建
- ARROW-1727 - [格式] 扩展 Arrow 流格式,以允许新的字典以及对现有字典的增量/补充
- ARROW-1728 - [C++] 在 Travis CI 中运行 clang-format 检查
- ARROW-1734 - C++/Python: 在列级别添加转换函数
- ARROW-1736 - [GLib] 添加 GArrowCastOptions:allow-time-truncate
- ARROW-1737 - [GLib] 使用 G_DECLARE_DERIVABLE_TYPE
- ARROW-1746 - [Python] 为 Arch Linux 添加构建依赖
- ARROW-1747 - [C++] 不导出静态链接库的符号
- ARROW-1748 - [GLib] 添加 GArrowRecordBatchBuilder
- ARROW-1750 - [C++] 移除对 arrow/util/random.h 的需求
- ARROW-1752 - [打包] 为 Debian 和 Ubuntu 添加 GPU 包
- ARROW-1753 - [Python] 在序列化上下文中提供 register_type 以匹配子类
- ARROW-1755 - [C++] 为 MSVC 添加使用静态运行时库的构建选项
- ARROW-1758 - [Python] 移除对象序列化中的 pickle=True 选项
- ARROW-1763 - [Python] DataType 应该是可哈希的
- ARROW-1765 - [文档] 在 C++ docker 构建中使用来自 conda 的依赖项
- ARROW-1767 - [C++] 在 Windows 上支持超过 2GB 的文件读写
- ARROW-1772 - [C++] 按照 parquet-cpp 的风格添加 public-api-test 模块
- ARROW-1773 - [C++] 添加从日期/时间类型到兼容的有符号整数的转换
- ARROW-1775 - 能够中止已创建但未封存的 Plasma 对象
- ARROW-1777 - [C++] 添加静态构造函数 ArrayData::Make 以在某些地方获得更好的语法
- ARROW-1779 - [Java] 如果不将有效性向量清零,集成测试会中断
- ARROW-1782 - [Python] 将压缩器暴露为 pyarrow.compress, pyarrow.decompress
- ARROW-1783 - [Python] 以最少的内存分配/复制将 SerializedPyObject 与其组件缓冲区序列相互转换
- ARROW-1784 - [Python] 通过分解 BlockManager 而不是强制转换为 Arrow 格式,在 pyarrow.serialize 中读写 pandas.DataFrame
- ARROW-1785 - [格式/C++/Java] 从 Flatbuffers 元数据中移除 VectorLayout 元数据
- ARROW-1787 - [Python] 以向后兼容的方式支持将 parquet 文件读入 DataFrame
- ARROW-1794 - [C++/Python] 将 DecimalArray 重命名为 Decimal128Array
- ARROW-1801 - [文档] 更新安装说明以使用 red-data-tools 仓库
- ARROW-1802 - [GLib] 添加 Arrow GPU 支持
- ARROW-1806 - [GLib] 添加 garrow_record_batch_writer_write_table()
- ARROW-1808 - [C++] 使 RecordBatch 接口虚拟化,以允许记录批次延迟实现列
- ARROW-1809 - [GLib] GTK-Doc 主文件使用 .xml 而不是 .sgml
- ARROW-1810 - [Plasma] 移除测试 shell 脚本
- ARROW-1817 - 配置 JsonFileReader 以读取浮点数的 NaN
- ARROW-1818 - 检查 Java 依赖项
- ARROW-1819 - [Java] 移除旧的向量类
- ARROW-1826 - [JAVA] 避免在单元格级别进行分支 (copyFrom)
- ARROW-1827 - [Java] 添加 checkstyle 配置文件和头文件
- ARROW-1828 - [C++] 实现 BooleanType 的哈希内核特化
- ARROW-1834 - [文档] 在单独的构建文件夹中构建文档
- ARROW-1838 - [C++] 对内核的输入参数统一使用 compute::Datum
- ARROW-1841 - [JS] 更新 text-encoding-utf-8 和 tslib 以支持 node ESModules
- ARROW-1844 - [C++] 用于哈希内核的基本基准测试套件
- ARROW-1849 - [GLib] 向 GArrowRecordBatch 添加输入检查
- ARROW-1850 - [C++] 在 Writable::Write 中使用 const void* 而不是 const uint8_t*
- ARROW-1854 - [Python] 提高序列化对象类型 ndarrays 的性能
- ARROW-1855 - [GLib] 添加 macOS 上构建失败的解决方法
- ARROW-1857 - [Python] 在 wheels 中为静态 parquet 添加 boost 链接开关
- ARROW-1859 - [GLib] 添加 GArrowDictionaryDataType
- ARROW-1862 - [GLib] 添加 GArrowDictionaryArray
- ARROW-1864 - [Java] 将 Netty 升级到 4.1.x
- ARROW-1867 - [Java] 添加来自旧向量类的 BitVector API
- ARROW-1874 - [GLib] 添加 garrow_array_unique()
- ARROW-1878 - [GLib] 添加 garrow_array_dictionary_encode()
- ARROW-1884 - [C++] 将 JsonReader/JsonWriter 类设为内部 API
- ARROW-1885 - [Java] 恢复之前的 MapVector 类名
- ARROW-1901 - [Python] 为 DaskFilesystem 支持递归 mkdir
- ARROW-1902 - [Python] 从 write_to_dataset 中移除 mkdir 竞态条件
- ARROW-1905 - [Python] 在 pyarrow.types 中添加更多用于检查确切类型的函数
- ARROW-1911 - 将 Graphistry 添加到 Arrow JS 的应用案例中
- ARROW-480 - [Python] 添加 Parquet 列统计信息的访问器
- ARROW-504 - [Python] 添加适配器,以用户选择的块大小将 pandas.DataFrame 写入流格式
- ARROW-507 - [C++/Python] 从偏移量和值子数组构造 List 容器
- ARROW-541 - [JS] 实现与 JavaScript 兼容的实现
- ARROW-571 - [Python] 添加 API 以从 Arrow 表增量构建 Parquet 文件
- ARROW-587 - 向合并工具添加 JIRA 修复版本
- ARROW-609 - [C++] 用于从 UNIX 纪元以来的天数转换为 int64 日期的函数
- ARROW-838 - [Python] 从非 pandas 的一维 NumPy 数组高效构建数组
- ARROW-905 - [文档] 添加 Dockerfile 用于可复现的文档生成
- ARROW-942 - 支持在 Python 2.7 上进行集成测试
- ARROW-950 - [网站] 添加 Google Analytics 标签
- ARROW-972 - [Python] 为 UnionArray 添加测试用例和基本 API
Bug 修复
- ARROW-1282 - Arrow 导致的大量内存重新分配在 jemalloc 中引起挂起
- ARROW-1341 - [C++] 弃用 arrow::MakeTable,改用 ARROW-1334 中的新构造函数
- ARROW-1347 - [JAVA] 列表空类型应为其内部字段使用一致的名称
- ARROW-1398 - [Python] 不支持读取 decimal(19,4) 类型的列
- ARROW-1409 - [格式] 在元数据的 Buffer 中使用 "page" 属性
- ARROW-1540 - [C++] 如果可能,修复 cuda-test 中的 valgrind 警告
- ARROW-1541 - [C++] arrow_gpu 的竞态条件问题
- ARROW-1543 - [C++] row_wise_conversion 示例与 ListBuilder 构造函数参数不对应
- ARROW-1549 - [JS] 集成自动生成的 Arrow 测试文件
- ARROW-1555 - [Python] 在 s3 上使用 write_to_dataset
- ARROW-1584 - [PYTHON] 对空 dataframe 使用 serialize_pandas
- ARROW-1585 - serialize_pandas 往返操作在整数列上失败
- ARROW-1586 - [PYTHON] serialize_pandas 往返操作丢失列名
- ARROW-1609 - Plasma: 使用 Xcode 9.0 构建失败
- ARROW-1615 - 用于开发的 CXX 标志比 Travis CI 构建更宽松
- ARROW-1617 - [Python] 不在 python/cmake_modules 中使用符号链接
- ARROW-1620 - Python: 在 manylinux1 构建中从 bintray 下载 Boost
- ARROW-1624 - [C++] 针对 Plasma / LLVM 4.0 的编译器警告进行后续修复/调整,并添加到 readme
- ARROW-1625 - [序列化] 正确支持 OrderedDict
- ARROW-1629 - [C++] 修复 infer 工具识别的有问题的代码路径
- ARROW-1633 - [Python] numpy "unicode" 数组无法被理解
- ARROW-1640 - 解决 Travis CI 中的 OpenSSL 问题
- ARROW-1647 - [Plasma] 读/写消息时可能存在的 bug
- ARROW-1653 - [Plasma] 使用静态转换以避免编译器警告。
- ARROW-1656 - [C++] 在 Windows 和 Mac 上的字节序宏不正确
- ARROW-1657 - [C++] 多线程读取测试在 Arch Linux 上失败
- ARROW-1658 - [Python] 超出边界的字典索引在转换为 pandas 后导致段错误
- ARROW-1663 - [Java] 跟进 ARROW-1347 并使 schema 向后兼容
- ARROW-1670 - [Python] 加快反序列化代码路径
- ARROW-1672 - [Python] 无法写入 Feather 字节列
- ARROW-1673 - [Python] NumPy布尔数组在NdarrayToTensor往返过程中被转换为uint8数组
- ARROW-1676 - [C++] 在写入 Feather 格式时正确截断超大的有效性位图
- ARROW-1678 - [Python] numpy.float16 序列化不正确
- ARROW-1680 - [Python] 在 from_pandas() 转换中未进行时间戳单位更改
- ARROW-1686 - 文档生成脚本在 site/java 下创建 "apidocs" 目录
- ARROW-1693 - [JS] 读取字典编码的集成测试文件时出错
- ARROW-1695 - [序列化] 修复在自定义序列化器中创建的 numpy 数组的引用计数问题
- ARROW-1698 - [JS] 文件读取器尝试多次加载同一个字典批次
- ARROW-1704 - [GLib] 测试套件中的 Go 示例已损坏
- ARROW-1708 - [JS] Linter 问题导致主构建中断
- ARROW-1709 - [C++] 对于负精度,Decimal.ToString 不正确
- ARROW-1711 - [Python] flake8 检查仍然未导致构建失败
- ARROW-1714 - [Python] 未命名的 pd.Series 名称被序列化为 u'None'
- ARROW-1720 - [Python] 尝试访问越界块时出现段错误
- ARROW-1723 - Windows: 构建 arrow 静态库时指定了 __declspec(dllexport)
- ARROW-1730 - [Python] 传递时间戳类型时 pyarrow.array 的结果不正确
- ARROW-1732 - [Python] 当 preserve_index=False 时,在没有列的 DataFrame 上 RecordBatch.from_pandas 失败
- ARROW-1735 - [C++] 转换内核无法写入切片后的输出数组
- ARROW-1738 - [Python] 使用带单位的 pa.array 进行日期时间转换时出错
- ARROW-1739 - [Python] 修复导致构建中断的 assertRaises 用法
- ARROW-1742 - C++: 在 OSX 上 clang-format 不再被正确检测
- ARROW-1743 - [Python] 当索引包含分类列时,Table to_pandas 失败
- ARROW-1745 - 在 Mac OS 的 plasma 测试中编译失败
- ARROW-1749 - [C++] 处理需要 39 位数字才能显示的 Decimal128 值范围
- ARROW-1751 - [Python] Pandas 0.21.0 引入了一个对 MultiIndex 构造的破坏性 API 更改
- ARROW-1754 - [Python] 修复当索引名称与列名称相同时 Parquet 往返操作中的错误
- ARROW-1756 - [Python] 在 Feather 读/写路径中观察到 int32 溢出
- ARROW-1762 - [C++] 语言环境的单元测试失败
- ARROW-1764 - [Python] 为 Windows 开发安装说明添加 -c conda-forge
- ARROW-1766 - [GLib] 修复 OSX 上构建失败的问题
- ARROW-1768 - [Python] 修复 ParquetWriter.del 中被抑制的异常
- ARROW-1770 - [GLib] 修复 GLib 编译器警告
- ARROW-1771 - [C++] ARROW-1749 破坏了 parquet-cpp 中的公共 API 测试
- ARROW-1776 - [C++] arrow::gpu::CudaContext::bytes_allocated() 未定义
- ARROW-1778 - [Python] 在 manylinux1 wheels 中静态、私有地链接 parquet-cpp
- ARROW-1781 - [CI] Travis-CI 上的 OSX 构建经常超时
- ARROW-1788 - Plasma store 在尝试中止已断开连接客户端的对象时崩溃
- ARROW-1791 - 集成测试生成的 date[DAY] 值超出了合理范围
- ARROW-1793 - [集成] 修复 README.md 中的一个拼写错误
- ARROW-1800 - [C++] 修复并简化 random_decimals
- ARROW-1805 - [Python] 在浏览数据集时忽略非 parquet 文件
- ARROW-1811 - [C++/Python] 将所有基于 Decimal 的 API 重命名为 Decimal128
- ARROW-1812 - Plasma store 在客户端断开连接期间迭代时修改哈希表
- ARROW-1821 - 添加集成测试用例以明确检查可选的有效性缓冲区
- ARROW-1829 - [Plasma] 清理驱逐策略的记录工作
- ARROW-1830 - [Python] 加载字典中的所有文件时出错
- ARROW-1836 - [C++] 修复 MSVC 构建中 arrow/util/variant.h 产生的 C4996 警告
- ARROW-1839 - [C++/Python] 添加 Decimal Parquet 读/写测试
- ARROW-1840 - [网站] 安装命令在 Windows10 anaconda 环境下失败。
- ARROW-1845 - [Python] 暴露 Decimal128Type
- ARROW-1852 - [Plasma] 使检索管理器文件描述符成为 const
- ARROW-1853 - [Plasma] 修复重试处理中的差一错误
- ARROW-1863 - [Python] PyObjectStringify 可以为更多类型的对象渲染类似字节的输出
- ARROW-1865 - [C++] 向空表中添加列失败
- ARROW-1869 - 修复 LowCostIdentityHashMap 中的拼写错误
- ARROW-1871 - [Python/C++] 附加具有不同小数位数的 Python Decimals 需要重新调整小数位数
- ARROW-1873 - [Python] 加载总计 2GB 的 parquet 文件时出现段错误
- ARROW-1877 - JsonStringArrayList.equals 中的不正确比较
- ARROW-1879 - [Python] 如果未安装 dask,则不会跳过 Dask 集成测试
- ARROW-1881 - [Python] setuptools_scm 会拾取 JS 版本标签
- ARROW-1882 - [C++] 重新引入 DictionaryBuilder
- ARROW-1883 - [Python] 错误: 如果列不存在,Table.to_pandas 的元数据检查会失败
- ARROW-1889 - [Python] --exclude 在旧版 git 中不可用
- ARROW-1890 - [Python] date32 数组的掩码不起作用
- ARROW-1891 - [Python] 只有在使用 from_pandas 时,NaT date32 值才会被转换为空值
- ARROW-1892 - [Python] 未知的列表项类型: binary
- ARROW-1893 - [Python] test_primitive_serialization 在 Python 2.7.3 上失败
- ARROW-1895 - [Python] 将 field_name 添加到 pandas 索引元数据中
- ARROW-1897 - [Python] Categoricals 的 pandas 元数据中的 numpy_type 不正确
- ARROW-1904 - [C++] 弃用 PrimitiveArray::raw_values
- ARROW-1906 - [Python] 创建具有不同单位时间戳的 pyarrow.Array 时未进行转换
- ARROW-1908 - [Python] 从具有重复列名的 pandas DataFrame 构建 arrow 表时崩溃
- ARROW-1910 - CPP README 中的 Brewfile 链接不正确
- ARROW-1914 - [C++] 使用 -DARROW_GPU=on 时,make -j 可能会构建失败
- ARROW-1915 - [Python] Parquet 测试应该是可选的
- ARROW-1916 - [Java] 不要从源码发布中排除 java/dev/checkstyle
- ARROW-1917 - [GLib] 必须在 verify-release-candidate.sh 中设置 GI_TYPELIB_PATH
- ARROW-226 - [C++] libhdfs: 提供反馈以帮助确定打开文件路径失败的原因
- ARROW-641 - [C++] 如果 ARROW_HDFS=off,则不构建/运行 io-hdfs-test