Apache Arrow 0.8.0 (2017年12月18日)
这是一个主要版本。
下载
贡献者
$ git shortlog -sn apache-arrow-0.7.1..apache-arrow-0.8.0
90 Wes McKinney
23 Phillip Cloud
21 Kouhei Sutou
13 Licht-T
12 Korn, Uwe
12 Philipp Moritz
12 Uwe L. Korn
10 Bryan Cutler
5 Li Jin
5 Robert Nishihara
4 Paul Taylor
4 siddharth
3 Max Risuhin
3 Stephanie
2 Rene Sugar
2 Heimir Sverrisson
2 Brian Hulette
2 Yuliya Feldman
2 dhirschf
2 Matthias Vallentin
1 vkorukanti
1 Andrew Andrade
1 Benjamin Goldberg
1 Ivan Sadikov
1 John Jenkins
1 Joris Van den Bossche
1 Lewis John McGibbney
1 Lu Qi
1 Manuel
1 Nick White
1 Ofek Lev
1 Shixiong Zhu
1 Siddharth Teotia
1 Stephen G
1 Victor Uriarte
1 Wataru Shimizu
1 ksdevlife
1 lmeyerov
1 rvernica
1 Amir Malekpour
补丁提交者
以下 Apache 提交者提交了对代码库的补丁。
$ git shortlog -csn apache-arrow-0.7.0..apache-arrow-0.8.0
236 Wes McKinney
35 Uwe L. Korn
10 Philipp Moritz
5 Kouhei Sutou
1 Steven Phillips
更新日志
新功能和改进
- ARROW-1032 - [JS] 支持 custom_metadata
- ARROW-1047 - [Java] 添加与 IO / 消息框架分离的通用流写入器和读取器接口
- ARROW-1087 - [Python] 添加 get_include 以公开包含头文件的目录
- ARROW-1114 - [C++] 创建记录批构建器类,作为一种可重用且高效的方式将逐行数据转换为列
- ARROW-1134 - [C++] 允许 C++/CLI 项目使用 Arrow 构建
- ARROW-1178 - [Python] 创建 Table.from_pandas 的替代方案,该方案生成具有给定块大小的 RecordBatch 对象列表
- ARROW-1226 - [C++] 改进/更正 arrow::ipc 中的 doxygen 函数文档
- ARROW-1250 - [Python] 定义数组类型的用户类型检查 API
- ARROW-1369 - 在 javascript arrow 读取器库中支持布尔类型
- ARROW-1371 - [网站] 在网站上添加“使用案例”页面
- ARROW-1455 - [Python] 添加 Dockerfile 用于在常规 CI 之外验证 Dask 集成
- ARROW-1471 - [JAVA] 记录 ValueVector 更新的要求和非要求
- ARROW-1472 - [JAVA] 设计更新的 ValueVector 对象层次结构
- ARROW-1473 - [JAVA] 创建原型代码层次结构(实施阶段 1)
- ARROW-1474 - [JAVA] ValueVector 层次结构(实施阶段 2)
- ARROW-1476 - [JAVA] 实施最终的 ValueVector 更新
- ARROW-1482 - [C++] 实现 date32 和 date64 之间的转换
- ARROW-1483 - [C++] 实现 time32 和 time64 之间的转换
- ARROW-1484 - [C++] 实现不同单位的时间戳和时间之间的转换(安全和不安全)
- ARROW-1486 - [C++] 决定 arrow::RecordBatch 是否需要可复制
- ARROW-1487 - [C++] 实现从 List<A> 到 List<B> 的转换,其中定义了从任何 A 到 B 的转换函数
- ARROW-1488 - [C++] 根据 internal::ArrayData 实现 ArrayBuilder::Finish
- ARROW-1498 - [GitHub] 添加 CONTRIBUTING.md 和 ISSUE_TEMPLATE.md
- ARROW-1503 - [Python] 在 pyarrow.serialize 中添加 pandas 对象的序列化回调
- ARROW-1522 - [C++] 在 pyarrow.serialize 中支持 pyarrow.Buffer 作为内置类型
- ARROW-1523 - [C++] 添加辅助数据结构,其中包含用于读取可能具有非零偏移量的有效位图的方法
- ARROW-1524 - [C++] 在计算库中处理输入和输出上的非零偏移量的更优雅的解决方案
- ARROW-1525 - [C++] 更改 arrow/compare.h 中的函数以不返回状态
- ARROW-1526 - [Python] 用于在 PARQUET-1100 中运行代码路径的单元测试
- ARROW-1535 - [Python] 启用 sdist 源代码压缩包以构建,假设 Arrow C++ 库在主机系统上可用
- ARROW-1538 - [C++] 在 .deb 打包自动化中支持 Ubuntu 14.04
- ARROW-1539 - [C++] 删除自 0.7.0 及更早版本以来已弃用的函数
- ARROW-1556 - [C++] 合并 PARQUET-1100 补丁中的 AssertArraysEqual 函数
- ARROW-1559 - [C++] “唯一”的内核实现(计算数组的不同元素)
- ARROW-1573 - [C++] 实现使用 DictionaryBuilder 计算字典索引的有状态内核函数
- ARROW-1575 - [Python] 添加 pyarrow.column 工厂函数
- ARROW-1577 - [JS] NPM 模块的包发布脚本
- ARROW-1588 - [C++/格式] 强化十进制格式
- ARROW-1593 - [PYTHON] serialize_pandas 应该传递 preserve_index 关键字
- ARROW-1594 - [Python] 在 Table.from_pandas 中启用多线程转换
- ARROW-1600 - [C++] 来自 std::string 的零拷贝缓冲区构造函数
- ARROW-1602 - [C++] 向 arrow::Array 添加 IsValid/IsNotNull 方法
- ARROW-1603 - [C++] 添加 BinaryArray 方法以将值作为 std::string 获取
- ARROW-1604 - [Python] 在 cast(…) 和各种 type= 参数中支持常见的类型别名
- ARROW-1605 - [Python] pyarrow.array 应该能够生成较小的整数类型而无需显式转换
- ARROW-1607 - [C++] 为十进制数实现 DictionaryBuilder
- ARROW-1613 - [Java] ArrowReader 不应关闭输入 ReadChannel
- ARROW-1616 - [Python] 向 RecordBatchStreamWriter 添加“write”方法,该方法根据需要分派到 write_table/write_back
- ARROW-1626 - 添加 make 目标以运行称为“infer”的过程间静态分析工具。
- ARROW-1627 - [JAVA] 减少堆使用量(阶段 2) - AllocationManager.BufferLedger 中的内存占用
- ARROW-1630 - [序列化] 支持 Python datetime 对象
- ARROW-1631 - [C++] 将 GRPC 添加到 ThirdpartyToolchain.cmake
- ARROW-1635 - 为 PMC 添加版本管理指南
- ARROW-1637 - [C++] null 类型的 IPC 往返
- ARROW-1641 - [C++] 不要包含
在公共头文件中 - ARROW-1648 - C++:添加从 Dictionary[NullType] 到 NullType 的转换
- ARROW-1649 - C++:在 NullArray 的 PrettyPrint 中打印空值的数量
- ARROW-1651 - [JS] 表中的惰性行访问器
- ARROW-1652 - [JS] 将 Vector 分成 BatchVector 和 CompositeVector
- ARROW-1654 - [Python] pa.DataType 无法腌制
- ARROW-1662 - 将 OSX 依赖项管理移动到 brew bundle Brewfiles 中
- ARROW-1665 - [序列化] 在默认序列化上下文中支持更多自定义数据类型
- ARROW-1666 - [GLib] 在 Travis CI Mac 环境中启用 gtk-doc
- ARROW-1667 - [GLib] 支持 Meson
- ARROW-1671 - [C++] 更改 arrow::MakeArray 以不返回状态
- ARROW-1675 - [Python] 在 FeatherWriter.write 中使用 RecordBatch.from_pandas
- ARROW-1677 - [博客] 添加关于 Ray 和 Arrow Python 序列化的博客文章
- ARROW-1679 - [GLib] 添加 garrow_record_batch_reader_read_next()
- ARROW-1683 - [Python] 将“TimestampType”恢复到 pyarrow 命名空间
- ARROW-1684 - [Python] 简化读取嵌套 Parquet 列的用户 API
- ARROW-1685 - [GLib] 添加 GArrowTableReader
- ARROW-1689 - [Python] 分类索引应该是零拷贝的
- ARROW-1690 - [GLib] 添加 garrow_array_is_valid()
- ARROW-1691 - [Java] 使 Java Decimal 类型实现符合 ARROW-1588 中的格式决策
- ARROW-1697 - [GitHub] 添加 ISSUE_TEMPLATE.md
- ARROW-1701 - [序列化] 支持零拷贝 PyTorch Tensor 序列化
- ARROW-1702 - 在 manylinux1 构建中更新 jemalloc
- ARROW-1703 - [C++] 我们依赖的 jemalloc 的供应商精确版本
- ARROW-1707 - 移动到 GitBox 后更新开发自述文件
- ARROW-1710 - [Java] 在新的向量类层次结构中删除不可为空的向量
- ARROW-1716 - [格式/JSON] 在 JSON 中使用字符串整数值表示十进制数
- ARROW-1717 - [Java] 删除 vector 类中用于 JSONReader/Writer 的公共静态辅助方法
- ARROW-1718 - [Python] 实现从 timestamp 到 date32/date64 的转换,并在 Array.from_pandas 中提供支持
- ARROW-1719 - [Java] 删除访问器/修改器
- ARROW-1721 - [Python] 在 numpy_to_arrow.cc 中不支持空掩码的地方提供支持
- ARROW-1724 - [打包] 支持 Ubuntu 17.10
- ARROW-1725 - [打包] 上传 Ubuntu 17.10 的 .deb 包
- ARROW-1726 - [GLib] 添加设置描述以验证 C GLib 构建
- ARROW-1727 - [格式] 扩展 Arrow 流格式以允许新的字典和对现有字典的增量/添加
- ARROW-1728 - [C++] 在 Travis CI 中运行 clang-format 检查
- ARROW-1734 - C++/Python:在列级别添加转换函数
- ARROW-1736 - [GLib] 添加 GArrowCastOptions:allow-time-truncate
- ARROW-1737 - [GLib] 使用 G_DECLARE_DERIVABLE_TYPE
- ARROW-1746 - [Python] 为 Arch Linux 添加构建依赖项
- ARROW-1747 - [C++] 不要导出静态链接库的符号
- ARROW-1748 - [GLib] 添加 GArrowRecordBatchBuilder
- ARROW-1750 - [C++] 消除对 arrow/util/random.h 的需求
- ARROW-1752 - [打包] 为 Debian 和 Ubuntu 添加 GPU 软件包
- ARROW-1753 - [Python] 在序列化上下文中提供使用 register_type 匹配子类的方法
- ARROW-1755 - [C++] 为 MSVC 添加使用静态运行时库的构建选项
- ARROW-1758 - [Python] 删除对象序列化中的 pickle=True 选项
- ARROW-1763 - [Python] DataType 应该是可哈希的
- ARROW-1765 - [文档] 在 C++ docker 构建中使用 conda 的依赖项
- ARROW-1767 - [C++] 在 Windows 上支持超过 2GB 的文件读写
- ARROW-1772 - [C++] 以 parquet-cpp 的样式添加 public-api-test 模块
- ARROW-1773 - [C++] 添加从日期/时间类型到兼容的有符号整数的转换
- ARROW-1775 - 能够中止已创建但未密封的 Plasma 对象
- ARROW-1777 - [C++] 添加静态构造函数 ArrayData::Make 以在某些地方使用更简洁的语法
- ARROW-1779 - [Java] 集成测试在未将有效性向量清零的情况下中断
- ARROW-1782 - [Python] 将压缩器公开为 pyarrow.compress, pyarrow.decompress
- ARROW-1783 - [Python] 将 SerializedPyObject 转换为组件缓冲区序列并从中转换,并最大限度地减少内存分配/复制
- ARROW-1784 - [Python] 通过分解 BlockManager 而不是强制转换为 Arrow 格式,在 pyarrow.serialize 中读写 pandas.DataFrame
- ARROW-1785 - [格式/C++/Java] 从 Flatbuffers 元数据中删除 VectorLayout 元数据
- ARROW-1787 - [Python] 以向后兼容的方式支持将 parquet 文件读取到 DataFrame 中
- ARROW-1794 - [C++/Python] 将 DecimalArray 重命名为 Decimal128Array
- ARROW-1801 - [文档] 更新安装说明以使用 red-data-tools 存储库
- ARROW-1802 - [GLib] 添加 Arrow GPU 支持
- ARROW-1806 - [GLib] 添加 garrow_record_batch_writer_write_table()
- ARROW-1808 - [C++] 将 RecordBatch 接口设为虚接口,以允许记录批次延迟实现列
- ARROW-1809 - [GLib] 将 GTK-Doc 主文件使用 .xml 代替 .sgml
- ARROW-1810 - [Plasma] 删除测试 shell 脚本
- ARROW-1817 - 将 JsonFileReader 配置为读取浮点数的 NaN
- ARROW-1818 - 检查 Java 依赖项
- ARROW-1819 - [Java] 删除旧的向量类
- ARROW-1826 - [JAVA] 避免在单元级别分支 (copyFrom)
- ARROW-1827 - [Java] 添加 checkstyle 配置文件和头文件
- ARROW-1828 - [C++] 为 BooleanType 实现哈希内核特化
- ARROW-1834 - [文档] 在单独的构建文件夹中构建文档
- ARROW-1838 - [C++] 统一使用 compute::Datum 作为内核的输入参数
- ARROW-1841 - [JS] 更新 text-encoding-utf-8 和 tslib 以支持 node ESModules
- ARROW-1844 - [C++] 哈希内核的基本基准测试套件
- ARROW-1849 - [GLib] 向 GArrowRecordBatch 添加输入检查
- ARROW-1850 - [C++] 在 Writable::Write 中使用 const void* 代替 const uint8_t*
- ARROW-1854 - [Python] 提高序列化对象 dtype ndarray 的性能
- ARROW-1855 - [GLib] 添加 macOS 上构建失败的解决方法
- ARROW-1857 - [Python] 添加在 wheel 中使用静态 parquet 进行 boost 链接的开关
- ARROW-1859 - [GLib] 添加 GArrowDictionaryDataType
- ARROW-1862 - [GLib] 添加 GArrowDictionaryArray
- ARROW-1864 - [Java] 将 Netty 升级到 4.1.x
- ARROW-1867 - [Java] 从旧的向量类添加 BitVector API
- ARROW-1874 - [GLib] 添加 garrow_array_unique()
- ARROW-1878 - [GLib] 添加 garrow_array_dictionary_encode()
- ARROW-1884 - [C++] 将 JsonReader/JsonWriter 类设为内部 API
- ARROW-1885 - [Java] 恢复以前的 MapVector 类名
- ARROW-1901 - [Python] 支持 DaskFilesystem 的递归 mkdir
- ARROW-1902 - [Python] 从 write_to_dataset 中删除 mkdir 竞争条件
- ARROW-1905 - [Python] 在 pyarrow.types 中添加更多用于检查精确类型的函数
- ARROW-1911 - 将 Graphistry 添加到 Arrow JS 的验证点
- ARROW-480 - [Python] 添加 Parquet 列统计信息的访问器
- ARROW-504 - [Python] 添加适配器,以用户选择的块大小将 pandas.DataFrame 写入流格式
- ARROW-507 - [C++/Python] 从偏移量和值子数组构造 List 容器
- ARROW-541 - [JS] 实现与 JavaScript 兼容的实现
- ARROW-571 - [Python] 添加 API 以从 Arrow 表增量构建 Parquet 文件
- ARROW-587 - 将 JIRA 修复版本添加到合并工具
- ARROW-609 - [C++] 用于将自 UNIX 纪元以来的天数转换为 int64 日期格式的函数
- ARROW-838 - [Python] 从非 pandas 一维 NumPy 数组高效构造数组
- ARROW-905 - [文档] 添加 Dockerfile 以实现可重复的文档生成
- ARROW-942 - 支持在 Python 2.7 上进行集成测试
- ARROW-950 - [网站] 添加 Google Analytics 代码
- ARROW-972 - [Python] 为 UnionArray 添加测试用例和基本 API
错误修复
- ARROW-1282 - Arrow 的大内存重新分配导致 jemalloc 挂起
- ARROW-1341 - [C++] 不推荐使用 arrow::MakeTable,改为使用 ARROW-1334 中的新构造函数
- ARROW-1347 - [JAVA] 列表空类型应为内部字段使用一致的名称
- ARROW-1398 - [Python] 不支持读取 decimal(19,4) 类型的列
- ARROW-1409 - [格式] 在元数据中为 Buffer 使用 “page” 属性
- ARROW-1540 - [C++] 如果可能,修复 cuda-test 中的 valgrind 警告
- ARROW-1541 - [C++] arrow_gpu 的竞争条件
- ARROW-1543 - [C++] row_wise_conversion 示例与 ListBuilder 构造函数参数不对应
- ARROW-1549 - [JS] 集成自动生成的 Arrow 测试文件
- ARROW-1555 - [Python] 在 s3 上使用 write_to_dataset
- ARROW-1584 - [PYTHON] 在空数据帧上使用 serialize_pandas
- ARROW-1585 - serialize_pandas 往返在整数列上失败
- ARROW-1586 - [PYTHON] serialize_pandas 往返丢失列名
- ARROW-1609 - Plasma:使用 Xcode 9.0 构建失败
- ARROW-1615 - 用于开发的 CXX 标志比 Travis CI 构建更宽松
- ARROW-1617 - [Python] 不要在 python/cmake_modules 中使用符号链接
- ARROW-1620 - Python:在 manylinux1 构建中从 bintray 下载 Boost
- ARROW-1624 - [C++] 对 Plasma / LLVM 4.0 的编译器警告进行后续修复/调整,并添加到自述文件中
- ARROW-1625 - [序列化] 正确支持 OrderedDict
- ARROW-1629 - [C++] 修复由 infer 工具识别出的有问题的代码路径
- ARROW-1633 - [Python] 无法识别 numpy “unicode” 数组
- ARROW-1640 - 解决 Travis CI 中的 OpenSSL 问题
- ARROW-1647 - [Plasma] 读取/写入消息时可能存在的错误。
- ARROW-1653 - [Plasma] 使用静态转换以避免编译器警告。
- ARROW-1656 - [C++] Windows 和 Mac 上的字节序宏不正确
- ARROW-1657 - [C++] Arch Linux 上的多线程读取测试失败
- ARROW-1658 - [Python] 转换为 pandas 后,越界字典索引导致段错误
- ARROW-1663 - [Java] 跟进 ARROW-1347 并使 schema 向后兼容
- ARROW-1670 - [Python] 加速反序列化代码路径
- ARROW-1672 - [Python] 无法写入 Feather 字节列
- ARROW-1673 - [Python] NumPy 布尔数组在 NdarrayToTensor 往返时转换为 uint8 数组
- ARROW-1676 - [C++] 在写入 Feather 格式时正确截断过大的有效位图
- ARROW-1678 - [Python] numpy.float16 的序列化不正确
- ARROW-1680 - [Python] from_pandas() 转换中未完成时间戳单位更改
- ARROW-1686 - 文档生成脚本在 site/java 下创建 “apidocs” 目录
- ARROW-1693 - [JS] 读取字典编码集成测试文件时出错
- ARROW-1695 - [序列化] 修复自定义序列化器中创建的 numpy 数组的引用计数
- ARROW-1698 - [JS] 文件读取器尝试多次加载相同的字典批次
- ARROW-1704 - [GLib] 测试套件中的 Go 示例已损坏
- ARROW-1708 - [JS] Linter 问题导致主构建中断
- ARROW-1709 - [C++] 对于负比例,Decimal.ToString 不正确
- ARROW-1711 - [Python] flake8 检查仍然不会导致构建失败
- ARROW-1714 - [Python] 未命名的 pd.Series 名称被序列化为 u’None’
- ARROW-1720 - [Python] 尝试访问越界块时出现段错误
- ARROW-1723 - Windows:构建 arrow 静态库时指定了 __declspec(dllexport)
- ARROW-1730 - [Python] 传递时间戳类型时 pyarrow.array 的结果不正确
- ARROW-1732 - [Python] 当 preserve_index=False 时,RecordBatch.from_pandas 在没有列的 DataFrame 上失败
- ARROW-1735 - [C++] 转换内核无法写入切片的输出数组
- ARROW-1738 - [Python] 使用单位时 pa.array 的日期时间转换错误
- ARROW-1739 - [Python] 修复导致构建中断的 assertRaises 的用法
- ARROW-1742 - C++: clang-format 在 OSX 上无法正确检测
- ARROW-1743 - [Python] 当索引包含分类列时,Table to_pandas 失败
- ARROW-1745 - Mac OS 上 Plasma 测试中的编译失败
- ARROW-1749 - [C++] 处理需要显示 39 位数字的 Decimal128 值范围
- ARROW-1751 - [Python] Pandas 0.21.0 引入了一个突破性的 MultiIndex 构造 API 更改
- ARROW-1754 - [Python] 当索引名称与列名相同时,修复错误的 Parquet 往返
- ARROW-1756 - [Python] 在 Feather 写入/读取路径中观察到 int32 溢出
- ARROW-1762 - [C++] 语言环境的单元测试失败
- ARROW-1764 - [Python] 为 Windows 开发安装说明添加 -c conda-forge
- ARROW-1766 - [GLib] 修复 OSX 上的构建失败
- ARROW-1768 - [Python] 修复 ParquetWriter.__del__ 中抑制的异常
- ARROW-1770 - [GLib] 修复 GLib 编译器警告
- ARROW-1771 - [C++] ARROW-1749 破坏了 parquet-cpp 中的公共 API 测试
- ARROW-1776 - [C++] arrow::gpu::CudaContext::bytes_allocated() 未定义
- ARROW-1778 - [Python] 在 manylinux1 wheel 中静态私有链接 parquet-cpp
- ARROW-1781 - [CI] Travis-CI 上的 OSX 构建经常超时
- ARROW-1788 - 尝试为断开连接的客户端中止对象时,Plasma 存储崩溃
- ARROW-1791 - 集成测试生成的 date[DAY] 值超出合理范围
- ARROW-1793 - [集成] 修复 README.md 中的拼写错误
- ARROW-1800 - [C++] 修复并简化 random_decimals
- ARROW-1805 - [Python] 在浏览数据集时忽略非 parquet 文件
- ARROW-1811 - [C++/Python] 将所有基于 Decimal 的 API 重命名为 Decimal128
- ARROW-1812 - Plasma 存储在客户端断开连接期间迭代时修改哈希表
- ARROW-1821 - 添加集成测试用例以显式检查可选的有效性缓冲区
- ARROW-1829 - [Plasma] 清理驱逐策略簿记
- ARROW-1830 - [Python] 加载字典中的所有文件时出错
- ARROW-1836 - [C++] 修复 MSVC 构建中 arrow/util/variant.h 的 C4996 警告
- ARROW-1839 - [C++/Python] 添加 Decimal Parquet 读/写测试
- ARROW-1840 - [网站] 安装命令在 Windows10 anaconda 环境中失败
- ARROW-1845 - [Python] 公开 Decimal128Type
- ARROW-1852 - [Plasma] 使检索管理器文件描述符成为 const
- ARROW-1853 - [Plasma] 修复重试处理中的一处偏差错误
- ARROW-1863 - [Python] PyObjectStringify 可以为更多类型的对象呈现类似字节的输出
- ARROW-1865 - [C++] 向空表添加列失败
- ARROW-1869 - 修复 LowCostIdentityHashMap 中的拼写错误
- ARROW-1871 - [Python/C++] 追加具有不同比例的 Python Decimal 需要重新缩放
- ARROW-1873 - [Python] 加载总共 2GB 的 parquet 文件时出现段错误
- ARROW-1877 - JsonStringArrayList.equals 中的比较不正确
- ARROW-1879 - [Python] 如果未安装 dask,则不会跳过 Dask 集成测试
- ARROW-1881 - [Python] setuptools_scm 获取 JS 版本标签
- ARROW-1882 - [C++] 重新引入 DictionaryBuilder
- ARROW-1883 - [Python] 错误:如果列不存在,Table.to_pandas 元数据检查将失败
- ARROW-1889 - [Python] –exclude 在较旧的 git 版本中不可用
- ARROW-1890 - [Python] date32 数组的掩码不起作用
- ARROW-1891 - [Python] 仅当使用 from_pandas 时,NaT date32 值才会转换为 null
- ARROW-1892 - [Python] 未知的列表项类型:binary
- ARROW-1893 - [Python] test_primitive_serialization 在 Python 2.7.3 上失败
- ARROW-1895 - [Python] 将 field_name 添加到 pandas 索引元数据
- ARROW-1897 - [Python] 分类变量的 pandas 元数据的 numpy_type 不正确
- ARROW-1904 - [C++] 弃用 PrimitiveArray::raw_values
- ARROW-1906 - [Python] 使用不同单位的时间戳创建 pyarrow.Array 时不会进行转换
- ARROW-1908 - [Python] 从具有重复列名的 pandas DataFrame 构造 arrow 表会导致崩溃
- ARROW-1910 - CPP README Brewfile 链接不正确
- ARROW-1914 - [C++] 使用 -DARROW_GPU=on 时,make -j 可能会构建失败
- ARROW-1915 - [Python] Parquet 测试应该是可选的
- ARROW-1916 - [Java] 不要从源代码版本中排除 java/dev/checkstyle
- ARROW-1917 - [GLib] 必须在 verify-release-candidate.sh 中设置 GI_TYPELIB_PATH
- ARROW-226 - [C++] libhdfs: 提供有助于确定打开文件路径失败原因的反馈
- ARROW-641 - [C++] 如果 ARROW_HDFS=off,则不要构建/运行 io-hdfs-test