Apache Arrow 0.12.0 (2019 年 1 月 20 日)
这是一个重要的版本,涵盖了超过 3 个月的开发。
下载
贡献者
此版本包含来自 77 位不同贡献者的 601 次提交。
$ git shortlog -sn apache-arrow-0.11.0..apache-arrow-0.12.0
94 Kouhei Sutou
76 Wes McKinney
61 Antoine Pitrou
60 Krisztián Szűcs
25 Pindikura Ravindra
25 Yosuke Shiro
21 Romain Francois
17 Chao Sun
16 Andy Grove
15 Korn, Uwe
15 Sebastien Binet
13 Paddy Horan
13 Philipp Moritz
10 François Saint-Jacques
9 Praveen
8 Robert Nishihara
7 Uwe L. Korn
6 Brian Hulette
6 Bryan Cutler
6 praveenbingo
6 suquark
5 Javier Luraschi
5 Kousuke Saruta
4 Tanya Schlusser
3 Benjamin Kietzman
3 Dimitri Vorona
3 James Lamb
3 Kenta Murata
3 Neville Dipale
3 Yuhong Guo
3 alexandreyc
2 Animesh Trivedi
2 Deepak Majeti
2 Dmitry Kalinkin
2 Hatem Helal
2 Kengo Seki
2 Micah Kornfield
2 Pearu Peterson
2 Yasuo Honda
2 jlapacik
2 ptaylor
2 shyam
1 Antonio Cavallo
1 Binyang2014
1 Bradley Skaggs
1 Brent Kerby
1 Bruno P. Kinoshita
1 Christopher Hutchinson
1 Dmitry Vukolov
1 Dominik Moritz
1 Dustin Long
1 Jacques Nadeau
1 Jeffrey Wong
1 Joris Van den Bossche
1 Justin Dunham
1 Li Jin
1 Renjie Liu
1 ShubhamChaurasia
1 Siddharth Dave
1 Suvayu Ali
1 Sweeney, Mack
1 Sylvain Joubert
1 Tim Paine
1 Todd Mostak
1 Vivekanand Vellanki
1 Yevgeni Litvin
1 Yuqi Gu
1 Zhenyuan Zhao
1 andrew
1 c-bata
1 cav71
1 kabukawa
1 m.wang
1 minmin.fmm
1 philjdf
1 sarutak
1 siddharth
1 zeroshade
补丁提交者
以下 Apache 提交者将贡献的补丁合并到存储库中。
$ git shortlog -csn apache-arrow-0.11.0..apache-arrow-0.12.0
297 Wes McKinney
79 Kouhei Sutou
76 Krisztián Szűcs
35 Antoine Pitrou
25 Korn, Uwe
25 Yosuke Shiro
16 Philipp Moritz
15 Andy Grove
14 Uwe L. Korn
6 Robert Nishihara
4 Brian Hulette
4 Sidd
3 Bryan Cutler
3 GitHub
变更日志
新特性与改进
- ARROW-1019 - [C++] 使用 Gzip 编解码器实现输入流和输出流
- ARROW-1423 - [C++] 从第三方用户提供的上下文句柄创建非拥有的 CudaContext
- ARROW-1492 - [C++] 类型转换函数内核套件
- ARROW-1688 - [Java] 在 checkstyle 警告时构建失败
- ARROW-1696 - [C++] 添加编解码器基准测试
- ARROW-1993 - [Python] 添加从 pandas.DataFrame 确定隐含 Arrow 模式的函数
- ARROW-2211 - [C++] 对整数使用更简单的哈希函数
- ARROW-2216 - [CI] CI 描述和环境变量具有误导性
- ARROW-2337 - [脚本] Windows 发布验证脚本应使用 boost DSOs 而不是静态链接
- ARROW-2475 - [格式] 令人困惑的数组长度描述
- ARROW-2483 - [Rust] 对布尔向量使用位打包
- ARROW-2504 - [网站] 添加 ApacheCon NA 链接
- ARROW-2535 - [Python] 提供检查 flake8 的 pre-commit hooks
- ARROW-2560 - [Rust] Rust README 应该包含特定于 Rust 的贡献信息
- ARROW-2624 - [Python] 用于 Arrow 转换和 Parquet 测试的随机模式和数据生成器
- ARROW-2637 - [C++/Python] 在 Alpine Linux 上进行开发的支持和说明
- ARROW-2653 - [C++] 重构哈希表支持
- ARROW-2670 - [C++/Python] 添加 Ubuntu 18.04 / gcc7 作为每日构建
- ARROW-2673 - [Python] 为 ARROW-2661 添加文档 + docstring
- ARROW-2684 - [Python] 各种文档改进
- ARROW-2712 - [C#] 初始 C# .NET 库
- ARROW-2720 - [C++] 清理 cmake CXX_STANDARD 和 PIC 标志设置
- ARROW-2759 - 导出 Plasma 的通知套接字
- ARROW-2803 - [C++] 将哈希函数放入 src/arrow/util
- ARROW-2807 - [Python] 在读取 Parquet 文件时,允许在 get_reader 中切换内存映射
- ARROW-2808 - [Python] 为 ProxyMemoryPool 添加单元测试,允许构建新的默认 MemoryPool
- ARROW-2919 - [C++] 改进列出空 HDFS 文件时的错误消息
- ARROW-2968 - [R] 从 Arrow 表到 R data.frame 的多线程转换
- ARROW-3020 - [Python] 添加允许空的 Parquet 行组的选项
- ARROW-3038 - [Go] 添加对 StringArray 的支持
- ARROW-3063 - [Go] 将支持/TODO 功能列表移动到 confluence
- ARROW-3070 - [发布] 在 ASF Bintray 帐户上而不是 dist/mirror 系统上托管 RC 和发布的二进制包
- ARROW-3108 - [C++] Table 实例的 arrow::PrettyPrint
- ARROW-3126 - [Python] 使 Buffered* IO 类可用于 Python,并将其合并到 input_stream、output_stream 工厂函数中
- ARROW-3131 - [Go] 为 Go-1.11 添加测试
- ARROW-3161 - [打包] 确保在 conda 和 wheel 构建中运行 pyarrow 单元测试
- ARROW-3169 - [C++] 将 array-test.cc 和 array.cc 分解为多个编译单元
- ARROW-3184 - [C++] 添加模块化构建目标、“all”目标,并在调用 make 或 ninja 时需要显式目标
- ARROW-3194 - [Java] 修复可变宽度向量的 spitAndTransfer 中的 setValueCount
- ARROW-3199 - [Plasma] 检查 recvmsg 和 sendmsg 中的 EAGAIN
- ARROW-3209 - [C++] 将 libarrow_gpu 重命名为 libarrow_cuda
- ARROW-3230 - [Python] ChunkedArray、Table 上缺少比较
- ARROW-3233 - [Python] pyarrow.cuda GPU 支持的 Sphinx 文档
- ARROW-3248 - [C++] Arrow 测试应具有标签“arrow”
- ARROW-3260 - [CI] 使 linting 成为一个单独的作业
- ARROW-3272 - [Java] 记录 checkstyle 与 Google 风格指南的偏差
- ARROW-3273 - [Java] checkstyle - 修复 javadoc 样式
- ARROW-3278 - [Python] 通过名称检索 StructType 和 StructArray 的字段
- ARROW-3291 - [C++] 用于从 std::string 构建 arrow::io::BufferReader 的便捷 API
- ARROW-3303 - [C++] 允许使用简化的 JSON 表示形式写入示例数组
- ARROW-3306 - [R] 不同种类的 arrow::Buffer 的对象和支持函数
- ARROW-3307 - [R] 将分块的 arrow::Column 转换为 R 向量
- ARROW-3310 - [R] 为各种 Arrow IO 接口创建包装类
- ARROW-3312 - [R] R 绑定 C++ 代码和主 C++ 代码库使用相同的 .clang-format 文件
- ARROW-3318 - [C++] 用于从 IPC 流或文件读取所有批次作为 arrow::Table 的便捷方法
- ARROW-3323 - [Java] checkstyle - 修复命名
- ARROW-3331 - [C++] 将 re2 添加到 ThirdpartyToolchain
- ARROW-3340 - [R] 支持日期和时间类
- ARROW-3347 - [Rust] 实现 PrimitiveArrayBuilder
- ARROW-3353 - [打包] 构建 python 3.7 wheels
- ARROW-3355 - [R] 支持因子
- ARROW-3358 - [Gandiva][C++] 将 gandiva/status.h 的用法替换为 arrow/status.h
- ARROW-3362 - [R] 防止空缓冲区
- ARROW-3366 - [R] 用于 docker-compose 设置的 Dockerfile
- ARROW-3368 - [Integration/CI/Python] 将 dask 集成测试添加到 docker-compose 设置
- ARROW-3380 - [Python] 支持从 gzipped 文件读取 CSV 文件等
- ARROW-3381 - [C++] 为 bz2 文件实现 InputStream
- ARROW-3383 - [Java] 在 Travis CI 中运行 Gandiva 测试
- ARROW-3384 - [Gandiva] 同步来自 gandiva repo 的剩余提交
- ARROW-3385 - [Java] [Gandiva] 自动部署 gandiva 快照 jar
- ARROW-3387 - [C++] 使用 UTF8 验证将二进制文件转换为字符串/utf8 的函数
- ARROW-3398 - [Rust] 更新现有 Builder 以在内部使用 MutableBuffer
- ARROW-3402 - [Gandiva][C++] 在预编译的 IR 例程中利用通用位图操作实现
- ARROW-3407 - [C++] 在 CSV 读取器转换选项中添加 UTF8 转换模式
- ARROW-3409 - [C++] 添加流式压缩接口
- ARROW-3421 - [C++] 将 include-what-you-use 设置添加到主 docker-compose.yml
- ARROW-3427 - [C++] 在 conda-forge 中为 double-conversion 包添加 Windows 支持和 Unix 静态库
- ARROW-3429 - [打包] 添加一个脚本来发布使用 dist.apache.orgtable bit 上的源档案的二进制文件
- ARROW-3430 - [打包] 添加一个变通方法来验证 0.11.0
- ARROW-3431 - [GLib] 将 Gemfile 包含到存档中
- ARROW-3432 - [打包] 变量未在 Subversion 提交消息中展开
- ARROW-3439 - [R] Feather 格式的 R 语言绑定
- ARROW-3440 - [Gandiva][C++] 移除过时的 cpp/src/gandiva/README.md,并将构建文档添加到 cpp/README.md
- ARROW-3441 - [Gandiva][C++] 生成更少的测试可执行文件
- ARROW-3442 - [C++] 使用动态链接进行单元测试,确保覆盖率在使用 clang 时正常工作
- ARROW-3450 - [R] 包装 MemoryMappedFile 类
- ARROW-3451 - [Python] 从 numba.cuda 创建的 CUcontext 分配 CUDA 内存
- ARROW-3455 - [Gandiva][C++] 支持 Gandiva 的 pkg-config
- ARROW-3456 - [CI] 重用 Docker 镜像并优化 docker-compose 容器
- ARROW-3460 - [打包] 添加一个脚本,用于在本地发布分支上 rebase master
- ARROW-3461 - [打包] 添加一个脚本,用于将 RC 工件作为官方版本上传
- ARROW-3462 - [打包] 更新 0.11.0 的 CHANGELOG
- ARROW-3463 - [网站] 更新 0.11.0
- ARROW-3465 - [文档] 修复 gen_apidocs 的 Docker 镜像
- ARROW-3469 - [Gandiva] 为 OSX 上的 Gandiva 添加 travis 条目
- ARROW-3472 - [Gandiva] 移除 gandiva helpers 库
- ARROW-3473 - [Format] 更新 Layout.md 文档,以阐明 64 位数组长度的使用
- ARROW-3474 - [GLib] 使用 get_schema 和 read_column 扩展 gparquet API
- ARROW-3479 - [R] 支持将 record_batch 写入为流
- ARROW-3482 - [C++] 默认情况下使用 JEMALLOC 构建
- ARROW-3487 - [Gandiva] 简化可能返回错误的 NULL_IF_NULL 函数
- ARROW-3488 - [打包] 为打包和测试分离 crossbow 任务定义文件
- ARROW-3489 - [Gandiva] 支持 in 表达式
- ARROW-3490 - [R] 将流式 arrow 对象输出到流
- ARROW-3492 - [C++] 并行构建 jemalloc
- ARROW-3493 - [Java] 文档 BOUNDS_CHECKING_ENABLED
- ARROW-3499 - [R] 公开 arrow::ipc::Message 类型
- ARROW-3501 - [Gandiva] 允许在 Ubuntu Trusty 和类似发行版上使用 gcc 4.8.x 构建
- ARROW-3504 - [Plasma] 添加 Plasma Client 支持,以便在没有 pyarrow 序列化的情况下 put/get 原始字节。
- ARROW-3505 - [R] 读取 record batch 和 table
- ARROW-3506 - [打包] docker-compose 镜像的夜间测试
- ARROW-3515 - 引入 NumericTensor 类
- ARROW-3518 - [C++] 自动检测 HOMEBREW_PREFIX
- ARROW-3519 - [Gandiva] 添加对可以返回可变长度输出的函数的支持
- ARROW-3521 - [GLib] 在 meson.build 中使用 find_program 运行 Python
- ARROW-3529 - [Ruby] 导入 Red Parquet
- ARROW-3530 - [Java/Python] 添加从 org.apache…pojo.Schema 到 pyarrow.Schema 的转换
- ARROW-3533 - [Python/文档] 使用 sphinx_rtd_theme 代替 Bootstrap
- ARROW-3536 - [C++] 快速 UTF8 验证函数
- ARROW-3537 - [Rust] 实现 Tensor 类型
- ARROW-3539 - [CI/打包] 更新脚本以针对 vendored jemalloc 构建
- ARROW-3540 - [Rust] 将 BooleanArray 合并到 PrimitiveArray 中
- ARROW-3542 - [C++] 从 CSV 构建数组时使用不安全的附加
- ARROW-3545 - [C++/Python] 使用 StructType 规范化子/字段术语
- ARROW-3547 - [R] 防止从 RecordBatch 读取时发生 Null 崩溃
- ARROW-3548 - 加快在对象存储中存储小对象的速度。
- ARROW-3551 - 将 “Powered By” 页面上的 MapD 更改为 OmniSci
- ARROW-3555 - [Plasma] 使用元数据统一 plasma client get 函数。
- ARROW-3556 - [CI] 禁用 Windows 上的优化
- ARROW-3557 - [Python] 在 Cython 源中设置 language_level
- ARROW-3558 - [Plasma] 移除 plasma client 对其创建的未密封对象调用 get 时出现的致命错误。
- ARROW-3559 - 静态链接 plasma_store_server 可执行文件的库。
- ARROW-3562 - [R] 禁止创建具有空 shared_ptr 的对象
- ARROW-3563 - [C++] 声明公共链接依赖项,以便 arrow_static, plasma_static 自动拉入传递依赖项
- ARROW-3566 - 阐明字典编码字段的类型应该是 encoded(index) 类型
- ARROW-3567 - [Gandiva] [GLib] 添加 Gandiva 的 GLib 绑定
- ARROW-3568 - [打包] 为 Windows wheels 运行 pyarrow 单元测试
- ARROW-3569 - [打包] 构建 conda 包时运行 pyarrow 单元测试
- ARROW-3574 - 修复 plasma 静态库与共享库之间的剩余错误。
- ARROW-3576 - [Python] 将压缩文件读取器公开为 NativeFile
- ARROW-3577 - [Go] 添加 ChunkedArray 的支持
- ARROW-3581 - [Gandiva][C++] ARROW_PROTOBUF_USE_SHARED 未被使用
- ARROW-3582 - [CI] Gandiva C++ 构建总是被触发
- ARROW-3583 - [Python/Java] 从 VectorSchemaRoot 创建 RecordBatch
- ARROW-3584 - [Go] 添加 Table 的支持
- ARROW-3587 - [Python] Arrow 对象(array、table、tensor 等)的有效序列化
- ARROW-3588 - [Java] checkstyle - 修复许可证
- ARROW-3589 - [Gandiva] 使在没有 JNI 的情况下编译 gandiva 成为可能
- ARROW-3591 - [R] 支持收集 decimal 类型
- ARROW-3592 - [Python] 获取 BinaryArray 值作为零拷贝内存视图
- ARROW-3597 - [Gandiva] gandiva 应该与 ADD_ARROW_TEST 集成以进行测试
- ARROW-3600 - [打包] 支持 Ubuntu 18.10
- ARROW-3601 - [Rust] 发布 0.11.0
- ARROW-3602 - [Gandiva] [Python] 为 Gandiva 添加初步的 Cython 绑定
- ARROW-3603 - [Gandiva][C++] 无法使用 vendored Boost 构建
- ARROW-3605 - 从 plasma 头文件中删除 AE 库。
- ARROW-3607 - [Java] 通过 JNI 为 plasma 提供 delete() 方法
- ARROW-3608 - [R] 支持 time32 和 time64 数组类型
- ARROW-3609 - [Gandiva] 将基准测试移出单元测试
- ARROW-3610 - [C++] 添加将 stl_allocator 转换为 arrow::MemoryPool 的接口
- ARROW-3611 - 当 pyarrow 序列化上下文被错误使用时,更快地给出错误。
- ARROW-3612 - [Go] 实现 RecordBatch 和 RecordBatchReader
- ARROW-3615 - [R] 支持 NaN
- ARROW-3616 - [Java] checkstyle - 修复剩余的编码检查
- ARROW-3618 - [打包/文档] 添加 `-c conda-forge` 选项以避免 PackagesNotFoundError
- ARROW-3620 - [Python] 在 Sphinx 中记录多线程选项并添加到 api.rst
- ARROW-3621 - [Go] 实现 TableBatchReader
- ARROW-3622 - [Go] 实现 Schema.Equal
- ARROW-3623 - [Go] 实现 Field.Equal
- ARROW-3624 - [Python/C++] 支持零大小的设备缓冲区
- ARROW-3626 - [Go] 添加一个 CSV TableReader
- ARROW-3629 - [Python] 将 write_to_dataset 添加到 Python Sphinx API 列表中
- ARROW-3630 - [Plasma] [GLib] 添加 Plasma 的 GLib 绑定
- ARROW-3632 - [打包] 在 dev/tasks/tasks.yml 和 dev/release/00-prepare.sh 中更新 deb 名称
- ARROW-3633 - [打包] 为 0.12.0 在 dev/tasks/tasks.yml 中更新 deb 名称
- ARROW-3636 - [C++/Python] 更新 arrow/python/pyarrow_api.h
- ARROW-3638 - [C++][Python] 将从 Feather 读取 Table 功能从 Python 移动到 C++
- ARROW-3639 - [打包] 运行 gandiva 夜间打包任务
- ARROW-3640 - [Go] 添加对 Tensors 的支持
- ARROW-3641 - [C++/Python] 从 Cython api 函数中移除 public 关键字
- ARROW-3642 - [C++] 添加 arrowConfig.cmake 生成
- ARROW-3645 - [Python] 在 Sphinx 中记录压缩支持
- ARROW-3646 - [Python] 添加便捷工厂来创建 IO 流
- ARROW-3647 - [R] 卸载 bit64 包后崩溃
- ARROW-3648 - [Plasma] 添加 API 以同时获取元数据和数据
- ARROW-3649 - [Rust] 重构 MutableBuffer 的 resize
- ARROW-3656 - [C++] 允许数字 CSV 字段中存在空格
- ARROW-3657 - [R] 需要 bit64 包
- ARROW-3659 - [C++] Clang Travis 构建(矩阵条目 2)可能实际上没有使用 clang
- ARROW-3660 - [C++] 不要不必要地锁定 MemoryMappedFile 以在只读文件中调整大小
- ARROW-3661 - [Gandiva][GLib] 改进常量名称
- ARROW-3662 - [C++] 向 MemoryMappedFile::GetSize 添加 const 重载
- ARROW-3664 - [Rust] 为 PrimitiveArrayBuilder 添加基准测试
- ARROW-3665 - [Rust] 实现 StructArrayBuilder
- ARROW-3666 - [C++] 提高 CSV 解析器性能
- ARROW-3672 - [Go] 实现 Time32 数组
- ARROW-3673 - [Go] 实现 Time64 数组
- ARROW-3674 - [Go] 实现 Date32 数组
- ARROW-3675 - [Go] 实现 Date64 数组
- ARROW-3677 - [Go] 实现 FixedSizedBinary 数组
- ARROW-3681 - [Go] 为 CSV 读取器添加基准测试
- ARROW-3682 - [Go] 从 CSV 读取器取消导出 encoding/csv.Reader
- ARROW-3683 - [Go] 向 CSV 读取器添加 functional-option 样式
- ARROW-3684 - [Go] 向 CSV 读取器添加块大小选项
- ARROW-3692 - [Gandiva] [Ruby] 添加 Gandiva 的 Ruby 绑定
- ARROW-3693 - [R] 空字符的无效缓冲区,带有空数据
- ARROW-3694 - [Java] 当日志级别被禁用时,避免多余的字符串创建
- ARROW-3695 - [Gandiva] 使用 add_arrow_lib()
- ARROW-3696 - [C++] 添加 feather::TableWriter::Write(table)
- ARROW-3697 - [Ruby] 添加 schema#[]
- ARROW-3701 - [Gandiva] 添加对十进制运算的支持
- ARROW-3708 - [Packaging] 夜间 CentOS 构建失败
- ARROW-3713 - [Rust] 实现 BinaryArrayBuilder
- ARROW-3718 - [Gandiva] 删除多余的 gtest 包含
- ARROW-3719 - [GLib] 支持从 Feather 读取/写入 table
- ARROW-3720 - [GLib] 使用 “indices” 而不是 “indexes”
- ARROW-3721 - [Gandiva] [Python] 支持所有 Gandiva 字面量
- ARROW-3722 - [C++] 允许指定 CSV 读取器的列类型
- ARROW-3723 - [Plasma] [Ruby] 添加 Plasma 的 Ruby 绑定
- ARROW-3724 - [GLib] 更新 gitignore
- ARROW-3725 - [GLib] 向 GArrowStructDataType 添加字段读取器
- ARROW-3726 - [Rust] CSV 读取器 & 写入器
- ARROW-3727 - [Python] 在 Sphinx 中记录 pyarrow.foreign_buffer, cuda.foreign_buffer 的使用
- ARROW-3731 - [R] 用于读取和写入 Parquet 文件的 R API
- ARROW-3733 - [GLib] 向 GArrowTable 和 GArrowColumn 添加 to_string()
- ARROW-3736 - [CI/Docker] docker-compose run cpp 中的 Ninja 测试挂起
- ARROW-3738 - [C++] 添加 CSV 转换选项来解析类似 ISO8601 的时间戳字符串
- ARROW-3741 - [R] 添加对 arrow::compute::Cast 的支持,以将 Arrow 数组从一种类型转换为另一种类型
- ARROW-3743 - [Ruby] 添加对保存/加载 Feather 的支持
- ARROW-3744 - [Ruby] 在 Arrow::Table#to_s 中使用 garrow_table_to_string()
- ARROW-3746 - [Gandiva] [Python] 使其可以列出在 Gandiva 中注册的所有函数
- ARROW-3747 - [C++] 翻转 arrow::Decimal128 中数据成员的顺序
- ARROW-3748 - [GLib] 添加 GArrowCSVReader
- ARROW-3749 - [GLib] 文档和测试用例名称中的拼写错误
- ARROW-3751 - [Python] 为 gandiva 添加更多 cython 绑定
- ARROW-3752 - [C++] 删除未使用的 status::ArrowError
- ARROW-3753 - [Gandiva] 删除调试打印
- ARROW-3755 - [GLib] 支持 CompressedInputStream, CompressedOutputStream
- ARROW-3760 - [R] 支持 Arrow CSV 读取器
- ARROW-3773 - [C++] 删除 parquet/arrow/arrow-reader-writer-test.cc 中重复的 AssertArraysEqual 代码
- ARROW-3778 - [C++] 不要将实现放在 test-util.h 中
- ARROW-3781 - [C++] 在 arrow::io::BufferedOutputStream 中配置缓冲区大小
- ARROW-3782 - [C++] 为 C++ 实现 BufferedReader
- ARROW-3784 - [R] 具有类型的数组在 x 不是向量时失败
- ARROW-3785 - [C++] 在 CI 工具链中使用 double-conversion conda 包
- ARROW-3787 - 实现 From
for BinaryArray - ARROW-3788 - [Ruby] 添加对用 C++ 编写的 CSV 解析器的支持
- ARROW-3795 - [R] 支持从 INT64 数组中检索 NAs
- ARROW-3796 - [Rust] 为 PrimitiveArrayBuilder 添加示例
- ARROW-3798 - [GLib] 添加对列类型 CSV 读取选项的支持
- ARROW-3800 - [C++] 提供 string_view 向后移植
- ARROW-3803 - [C++/Python] 分割 C++ 和 Python 单元测试 Travis CI 作业,一起运行所有 C++ 测试(包括 Gandiva)
- ARROW-3807 - [R] 缺少 Field API
- ARROW-3819 - [Packaging] 在编译器迁移后,更新 conda 变体文件以符合 feedstock
- ARROW-3821 - [Format/Documentation]: 修复 Flight.proto 注释中的拼写错误和语法问题
- ARROW-3823 - [R] + buffer.complex
- ARROW-3825 - [Python] Python README.md 没有显示如何运行单元测试套件
- ARROW-3830 - [GLib] 添加 GArrowCodec
- ARROW-3834 - [Doc] 合并 Python & C++ 并移动到顶级
- ARROW-3836 - [C++] 向 ADD_ARROW_BENCHMARK 添加 PREFIX 选项
- ARROW-3839 - [Rust] 添加在 CSV 读取器中推断模式的能力
- ARROW-3841 - [C++] warning: catching polymorphic type by value
- ARROW-3842 - [R] RecordBatchStreamWriter api
- ARROW-3844 - [C++] 删除 ARROW_USE_SSE 和 ARROW_SSE3
- ARROW-3845 - [Gandiva] [GLib] 添加 GGandivaNode
- ARROW-3847 - [GLib] 删除不必要的 “\”。
- ARROW-3849 - 利用 Armv8 crc32 扩展指令来加速 Arm64 的哈希计算。
- ARROW-3851 - [C++] “make check-format” 很慢
- ARROW-3852 - [C++] used uninitialized warning
- ARROW-3853 - [C++] 实现字符串到时间戳转换
- ARROW-3854 - [GLib] 弃用 garrow_gio_{input,output}_stream_get_raw()
- ARROW-3855 - [Rust] Schema/Field/Datatype 应该实现 serde traits
- ARROW-3856 - [Ruby] 支持压缩的 CSV 保存/加载
- ARROW-3858 - [GLib] 使用 {class_name}_get_instance_private
- ARROW-3859 - [Java] 修复 ComplexWriter 向后不兼容的更改
- ARROW-3860 - [Gandiva] [C++] 添加在构建 libgandiva_jni.so 时使用 -static-libstdc++ 的选项
- ARROW-3862 - [C++] 改进依赖项下载脚本
- ARROW-3863 - [GLib] 将 travis_retry 与 brew bundle 命令一起使用
- ARROW-3864 - [GLib] 添加对 allow-float-truncate cast 选项的支持
- ARROW-3865 - [Packaging] 向 conda forge recipes 和 windows wheel build 添加 double-conversion 依赖项
- ARROW-3867 - [Documentation] 将二进制版本工件上传到 Bintray
- ARROW-3868 - [Rust] 在 CI 中针对 nightly Rust 进行构建
- ARROW-3870 - [C++] 向 InputStream API 添加 Peek
- ARROW-3871 - [R] 将 C++ GetValuesSafely 的用法替换为 ArrayData 上的新方法
- ARROW-3878 - [Rust] 改进基本类型
- ARROW-3880 - [Rust] PrimitiveArray
应该支持简单的数学运算 - ARROW-3883 - [Rust] 更新 Rust README 以反映新功能
- ARROW-3884 - [Python] 向 manylinux1 基础镜像添加 LLVM6
- ARROW-3885 - [Rust] 将版本更新到 0.12.0 并更新 wiki 上的发布说明
- ARROW-3886 - [C++] ARROW-3831 的其他测试用例
- ARROW-3891 - [Java] 用简单的位图操作替换 Long.bitCount
- ARROW-3893 - [C++] 提高自适应 int 构建器的性能
- ARROW-3895 - [Rust] CSV 读取器应该返回 Result<Option<» 而不是 Option<Result<»
- ARROW-3900 - [GLib] 添加 garrow_mutable_buffer_set_data()
- ARROW-3905 - [Ruby] 添加 StructDataType#[]
- ARROW-3906 - [C++] 将 builder.cc 分解为多个编译单元
- ARROW-3908 - [Rust] 更新 rust dockerfile 以使用 nightly 工具链
- ARROW-3910 - [Python] 在实现逻辑去重后,在 *.to_pandas 中将 date_as_object 默认设置为 True
- ARROW-3911 - [Python] 在 Table.to_pandas 内部逻辑中去除 datetime.date 对象的重复
- ARROW-3912 - [Plasma][GLib] 添加对创建和引用对象的支持
- ARROW-3913 - [Gandiva] [GLib] 添加 GGandivaLiteralNode
- ARROW-3914 - [C++/Python/打包] 用于 Alpine linux 的 Docker-compose 设置
- ARROW-3916 - [Python] 在 `ParquetWriter` 构造函数中支持调用者提供的文件系统
- ARROW-3922 - [C++] 改进位图操作的性能
- ARROW-3924 - [打包][Plasma] 添加对 Plasma deb/rpm 包的支持
- ARROW-3925 - [Python] 在 conda 环境中的 Linux/macOS 依赖项中包含 autoconf
- ARROW-3928 - [Python] 添加选项以在 Table.to_pandas 转换路径中删除重复的 PyBytes / PyString / PyUnicode 对象
- ARROW-3929 - [Go] 改进 CSV 读取器的内存使用,以提高运行时性能
- ARROW-3930 - [C++] 随机测试数据生成速度慢
- ARROW-3932 - [Python/文档] 在 Sphinx 文档中包含 Benchmarks.md
- ARROW-3934 - [Gandiva] 如果 ARROW_GANDIVA_BUILD_TESTS=off,则不要编译预编译测试
- ARROW-3938 - [打包] 停止引用 java/pom.xml 以获取版本信息
- ARROW-3939 - [Rust] 删除 ListArrayBuilder 的宏定义
- ARROW-3945 - [网站] 关于 Gandiva 代码捐赠的博客文章
- ARROW-3946 - [GLib] 添加对 union 的支持
- ARROW-3948 - [CI][GLib] 将 Homebrew 设置为超时
- ARROW-3950 - [Plasma] 不要在导入时强制加载 TensorFlow op
- ARROW-3952 - [Rust] 在 Cargo.toml 中指定 edition=”2018”
- ARROW-3958 - [Plasma] 减少 IPC 的数量
- ARROW-3959 - [Rust] 时间和时间戳支持
- ARROW-3960 - [Rust] 删除 Rust 2018 的 extern crate
- ARROW-3963 - [打包/Docker] 用于构建 sphinx 文档的 Nightly 测试
- ARROW-3964 - [Go] 更易读的 csv.Reader 示例
- ARROW-3967 - [Gandiva] [C++] 使 gandiva/node.h 公开
- ARROW-3970 - [Gandiva][C++] 删除不必要的 boost 依赖项
- ARROW-3971 - [Python] 删除在 0.11 及之前版本中已弃用的 API
- ARROW-3974 - [C++] 在 array/builder.h 中合并 field_builders_ 和 children_ 成员
- ARROW-3982 - [C++] 允许在简单的 JSON 格式中使用“binary”输入
- ARROW-3983 - [Gandiva][Crossbow] 在打包时使用静态 boost
- ARROW-3984 - [C++] 如果用户遇到 zstd ExternalProject 路径,则退出并显示错误
- ARROW-3986 - [C++] 编写散文文档
- ARROW-3988 - [C++] 默认情况下不在构建系统中构建单元测试
- ARROW-3993 - [JS] CI 作业失败
- ARROW-3994 - [C++] 删除 ARROW_GANDIVA_BUILD_TESTS 选项
- ARROW-3995 - [CI] 在 Travis Matrix 中使用可理解的名称
- ARROW-3997 - [C++] [Doc] 阐明字典编码整数的有符号性(和宽度?)
- ARROW-4002 - [C++][Gandiva] 删除 CMake 版本检查
- ARROW-4004 - [GLib] 将 GPU 替换为 CUDA
- ARROW-4005 - [Plasma] [GLib] 添加 gplasma_client_disconnect()
- ARROW-4006 - 添加 CODE_OF_CONDUCT.md
- ARROW-4009 - [CI] 在不同的构建中运行 Valgrind 和 C++ 代码覆盖率
- ARROW-4015 - [Plasma] 删除 plasma manager 的旧接口
- ARROW-4017 - [C++] 检查和更新 vendored 库
- ARROW-4026 - [C++] 为单元测试使用单独的模块化 $COMPONENT-test 目标
- ARROW-4028 - [Rust] 合并 parquet-rs 代码库
- ARROW-4029 - [C++] 定义和记录内部/私有头文件不被安装的命名约定
- ARROW-4030 - [CI] 使用 travis_terminate 在步骤失败时停止构建
- ARROW-4035 - [Ruby] 支持 msys2 mingw 依赖项
- ARROW-4037 - [打包] 删除验证 0.11.0 的解决方法
- ARROW-4038 - [Rust] 为布尔 AND、OR、NOT 添加 array_ops 方法
- ARROW-4039 - 更新从 Python README.md 到 ‘development.rst’ 页面的链接
- ARROW-4042 - [Rust] BinaryArray 和 PrimitiveArray 之间的方法命名不一致
- ARROW-4043 - [打包/Docker] Alpine 上的 Python 测试缺少 pytest 依赖项
- ARROW-4044 - [打包/Python] 将 hypothesis 测试依赖项添加到 pyarrow conda recipe
- ARROW-4045 - [打包/Python] 将 hypothesis 测试依赖项添加到 wheel crossbow 测试
- ARROW-4048 - [GLib] 在 gparquet_arrow_file_reader_read_column 中返回 ChunkedArray 而不是 Array
- ARROW-4051 - [Gandiva] [GLib] 添加对 null 字面量的支持
- ARROW-4054 - [Python] 在 manylinux1 基本镜像中更新 gtest、flatbuffers 和 OpenSSL
- ARROW-4060 - [Rust] 添加 Parquet/Arrow 模式转换器
- ARROW-4069 - [Python] 添加从 binary 到 utf8 的转换测试
- ARROW-4075 - [Rust] 在调用 finish() 后重用数组构建器
- ARROW-4079 - [C++] 添加机器基准测试
- ARROW-4080 - [Rust] 改进 Appveyor 中漫长的构建时间
- ARROW-4082 - [C++] CMake 调整:允许 RelWithDebInfo,改进 FindClangTools
- ARROW-4084 - [C++] 简化 Status 和 stringstream 样板代码
- ARROW-4085 - [GLib] 为 struct 数据类型使用“field”
- ARROW-4087 - [C++] 使 CSV null 值可配置
- ARROW-4093 - [C++] 弃用的方法建议错误的方法
- ARROW-4098 - [Python] 弃用 pyarrow.open_stream,open_file,推荐使用 pa.ipc.open_stream/open_file
- ARROW-4100 - [Gandiva][C++] 修复忽略“.”字符的正则表达式
- ARROW-4102 - [C++] 未实现 FixedSizeBinary 身份转换
- ARROW-4103 - [文档] 向 docs/ 根目录添加 README
- ARROW-4105 - 添加 rust-toolchain 以强制用户使用 nightly 工具链进行构建
- ARROW-4107 - [Python] 在 pyarrow manylinux1 构建中使用 ninja
- ARROW-4112 - [打包][Gandiva] 添加对 deb 包的支持
- ARROW-4116 - [Python] 在 development.rst 中阐明 virtualenv 不能与 miniconda/Anaconda 一起使用
- ARROW-4122 - [C++] 初始化一些未初始化的类成员
- ARROW-4127 - [文档] 添加 Docker 构建说明
- ARROW-4129 - [Python] 修复基准测试文档中的语法问题
- ARROW-4132 - [GLib] 添加更多 GArrowTable 构造函数
- ARROW-4141 - [Ruby] 添加从原始 Ruby 对象创建 schema 的支持
- ARROW-4148 - [CI/Python] 在 nightly Alpine 构建上禁用 ORC
- ARROW-4150 - [C++] 不要从内部分配返回包含 nullptr 的缓冲区
- ARROW-4151 - [Rust] 重构项目目录
- ARROW-4152 - [GLib] 删除一个显示 Torch 集成的示例
- ARROW-4153 - [GLib] 为了保持一致性,添加 builder_append_value()
- ARROW-4154 - [GLib] 添加 GArrowDecimal128DataType
- ARROW-4155 - [Rust] 为 PrimitiveArray 实现 array_ops::sum()
- ARROW-4156 - [C++] cmake 生成的项目的 xcodebuild 失败
- ARROW-4158 - [Dev] 允许维护者在合并 pull request 时使用 GitHub API token
- ARROW-4160 - [Rust] 添加 README 和可执行文件到 parquet
- ARROW-4161 - [GLib] 添加 GPlasmaClientOptions
- ARROW-4162 - [Ruby] 添加从描述创建数据类型的支持
- ARROW-4166 - [Ruby] 添加保存到缓冲区和从缓冲区加载的支持
- ARROW-4167 - [Gandiva] 切换到 arrow/util/variant
- ARROW-4168 - [GLib] 使用属性来保留在 garrow_field_new() 中传递的 GArrowDataType
- ARROW-4172 - [Rust] 数组构建器中更一致的命名
- ARROW-4174 - [Ruby] 添加从原始 Ruby 对象构建复合数组的支持
- ARROW-4175 - [GLib] 添加对 decimal 比较运算符的支持
- ARROW-4177 - [C++] 添加 ThreadPool 和 TaskGroup 微基准测试
- ARROW-4183 - [Ruby] 添加 Arrow::Struct 作为 Arrow::StructArray 的一个元素
- ARROW-4184 - [Ruby] 添加 Arrow::RecordBatch#to_table
- ARROW-4191 - [C++] 对 jemalloc 使用与主要源文件相同的 CC 和 AR
- ARROW-4199 - [GLib] 添加 garrow_seekable_input_stream_peek()
- ARROW-4207 - [Gandiva] [GLib] 添加对 IfNode 的支持
- ARROW-4210 - [Python] 在 pyarrow 的 conda meta.yaml 中直接提及 boost-cpp
- ARROW-4211 - [GLib] 添加 GArrowFixedSizeBinaryDataType
- ARROW-4214 - [Ruby] 添加从原始 Ruby 对象构建 RecordBatch 的支持
- ARROW-4216 - [Python] 添加 CUDA API 文档
- ARROW-4228 - [GLib] 添加 garrow_list_data_type_get_field()
- ARROW-4229 - [打包] 显式设置 Crossbow 目标以启用构建任意 Arrow 仓库
- ARROW-4233 - [打包] 创建一个 Dockerfile 以构建源归档文件
- ARROW-4239 - [发布] 更新 prepare 脚本中的 .deb 包名称在 OSX 上运行失败
- ARROW-4240 - [打包] Plasma GLib 和 Gandiva GLib 的文档在源归档文件中缺失
- ARROW-4241 - [打包] 禁用 Crossbow Conda OSX Clang 构建
- ARROW-4243 - [Python] 使用 Pandas 0.24.0rc1 测试失败
- ARROW-4249 - [Plasma] 从 plasma/common.h 中移除对 logging.h 的引用
- ARROW-4257 - [发布] 更新发布验证脚本以检查 Bintray 上的二进制文件
- ARROW-4266 - [Python][CI] 在 Dask 集成测试中禁用 ORC 测试
- ARROW-4269 - [Python] AttributeError: module ‘pandas.core’ has no attribute ‘arrays’
- ARROW-4270 - [打包][Conda] 更新 Xcode 版本并移除工具链构建
- ARROW-4276 - [发布] 从二进制文件验证脚本中移除不必要的 Bintray 身份验证
- ARROW-45 - [Python] 为 List 类型添加 unnest/flatten 函数
- ARROW-554 - [C++] 实现函数以使多个 Arrow 数组中的不等字典保持一致
- ARROW-854 - [格式] 支持稀疏张量
- ARROW-912 - [Python] 在 development.rst 中考虑多架构系统
Bug 修复
- ARROW-1847 - [文档] 以 FAQ 形式记录 RecordBatch 和 Table 之间的差异
- ARROW-1994 - [Python] 针对 Pandas master 进行测试
- ARROW-2026 - [Python] 将所有时间戳分辨率转换为 INT96 use_deprecated_int96_timestamps=True
- ARROW-2038 - [Python] s3fs Parquet 支持的后续 Bug 修复
- ARROW-2113 - [Python] CLASSPATH 中包含“hadoop”的不完整 CLASSPATH 可能会欺骗 classpath 设置 HDFS 逻辑
- ARROW-2591 - [Python] 将空的 ListType 列写入 Parquet 时出现段错误
- ARROW-2592 - [Python] 由于元数据向后兼容性问题,读取旧的 Parquet 文件时出错
- ARROW-2708 - [C++] arrow::compute 中的内部 GetValues 函数应检查 nullptr
- ARROW-2970 - [Python] Binary/String/FixedSizeBinary 的 NumPyConverter::Visit 可能溢出
- ARROW-3058 - [Python] 当从 Pandas 的转换产生 ChunkedArray 时,Feather 读取失败并出现不直观的错误
- ARROW-3186 - [GLib] Travis CI 中的 mesonbuild 失败
- ARROW-3202 - [C++] 构建在 Alpine Linux 上不成功
- ARROW-3225 - [C++/Python] ListType 的 Pandas 对象转换
和 ListType - ARROW-3324 - [Parquet] 写入多个行组时释放更多内部资源
- ARROW-3343 - [Java] Java 测试以非确定方式失败,Flight 测试存在内存泄漏
- ARROW-3405 - [Python] 文档 CSV 阅读器
- ARROW-3428 - [Python] 将浮点数转换为布尔值时,from_pandas 给出不正确的结果
- ARROW-3436 - [C++] Gandiva 所需的 Boost 版本对于 Ubuntu 14.04 来说太新
- ARROW-3437 - [Gandiva][C++] 配置 libgcc,libstdc++ 与 LDFLAGS 的静态链接
- ARROW-3438 - [打包] 变更日志中转义的 Bulletpoints
- ARROW-3445 - [GLib] Parquet GLib 不链接 Arrow GLib
- ARROW-3449 - [C++] 支持 CMake 3.2 以进行“开箱即用”的构建
- ARROW-3466 - [Python] 导入 tensorflow 和 pyarrow 时崩溃
- ARROW-3467 - 针对外部双精度转换进行构建已损坏
- ARROW-3470 - [C++] 行式转换教程已过时
- ARROW-3477 - [C++] Testsuite 在 32 位架构上失败
- ARROW-3480 - [网站] Ubuntu 的安装文档已损坏
- ARROW-3485 - [C++] 示例失败并显示 Protobuf 错误
- ARROW-3494 - [C++] re2 conda-forge 包在工具链中不起作用
- ARROW-3516 - [C++] 在 parallel_memcpy 中使用无符号类型表示指针的差值
- ARROW-3517 - [C++] MinGW 32 位构建导致 g++ segv
- ARROW-3524 - [C++] 修复来自 clang-6 上 ARROW-3409 的编译器警告
- ARROW-3527 - [R] R 包 C++ 代码中未使用的变量
- ARROW-3528 - [R] R 文档中的拼写错误
- ARROW-3535 - [Python] pip install tensorflow 在 manylinux1 构建中安装了太新的 numpy
- ARROW-3541 - [Rust] 更新 BufferBuilder 以允许新的位打包 BooleanArray
- ARROW-3544 - [Gandiva] 在多个编译单元中填充函数注册表,以减轻发布模式下的长时间编译
- ARROW-3549 - [Rust] 对于某些位实用程序函数,将 i64 替换为 usize
- ARROW-3573 - [Rust] with_bitset 未正确设置有效位
- ARROW-3580 - [Gandiva][C++] 使用 g++ 8.2.0 构建时出错
- ARROW-3586 - [Python] 将带有类别信息的空表转换为 Pandas 时出现段错误
- ARROW-3598 - [Plasma] 启用 GPU 后,plasma_store_server 链接失败
- ARROW-3613 - [Go] Resize 未正确更新长度
- ARROW-3614 - [R] 处理从 Arrow 到 R 的 Type::TIMESTAMP
- ARROW-3634 - [GLib] cuda.cpp 编译错误
- ARROW-3658 - [Rust] `List 的偏移缓冲区验证不正确
\` - ARROW-3670 - [C++] 使用 FindBacktrace 查找 execinfo.h 支持
- ARROW-3687 - [Rust] 任何测量数组槽的东西都应该是 `usize`
- ARROW-3698 - [C++] 在 Gandiva 中使用大型表时出现段错误
- ARROW-3700 - [C++] CSV 解析器应允许忽略空行
- ARROW-3703 - [Python] 如果 datetime 列具有时区,则 DataFrame.to_parquet 崩溃
- ARROW-3704 - [Gandiva] 无法使用 g++ 8.2.0 构建
- ARROW-3707 - [C++] zstd 1.3.7 测试失败
- ARROW-3711 - [C++] 不要将 CXX_FLAGS 传递给 C_FLAGS
- ARROW-3712 - [CI] 许可证检查回归(RAT 失败)
- ARROW-3715 - [C++] gflags_ep 无法使用 CMake 3.13 构建
- ARROW-3716 - [R] ChunkedArray 转换的缺失案例
- ARROW-3728 - [Python] 合并 Parquet 文件 - Schema 不匹配中的 Pandas Meta
- ARROW-3734 - [C++] 在 Arch x86-64 上链接静态 zstd 库失败
- ARROW-3740 - [C++] 使用小于当前附加长度的长度调用 ArrayBuilder::Resize 会导致无效状态
- ARROW-3742 - 修复 pyarrow.types & gandiva cython 绑定
- ARROW-3745 - [C++] CMake 多次将静态库传递给链接器
- ARROW-3754 - [打包] Linux 包构建上的 Zstd 配置错误
- ARROW-3756 - [CI/Docker/Java] Java 测试在 docker-compose 设置中失败
- ARROW-3762 - [C++] 当溢出 BinaryArray 容量时,Parquet arrow::Table 读取错误
- ARROW-3765 - [Gandiva] 当尚未分配有效性位图时发生段错误
- ARROW-3766 - [Python] pa.Table.from_pandas 不使用模式排序
- ARROW-3768 - [Python] 将 classpath 设置为 hdfs 而不是 hadoop 可执行文件
- ARROW-3790 - [C++] 当类型大小相同时,有符号整数到无符号整数的转换产生不正确的结果
- ARROW-3792 - [Python] 将空的 RecordBatches 写入 Parquet 时出现段错误
- ARROW-3793 - [C++] TestScalarAppendUnsafe 没有测试不安全的附加
- ARROW-3797 - [Rust] BinaryArray::value_offset 在偏移情况下不正确
- ARROW-3805 - [Gandiva] 在 if-else 表达式中处理 null 有效性位图
- ARROW-3831 - [C++] arrow::util::Codec::Decompress() 不返回解压缩的数据大小
- ARROW-3835 - [C++] arrow::io::CompressedOutputStream::raw() 实现缺失
- ARROW-3837 - [C++] Windows 上的 gflags 链接错误
- ARROW-3866 - [Python] 列元数据未传输到 pyarrow 中的表
- ARROW-3874 - [Gandiva] 无法构建:LLVM 未正确检测到
- ARROW-3879 - [C++] cuda-test 失败
- ARROW-3888 - [C++] 使用 gcc 7.3.0 编译警告
- ARROW-3889 - [Python] 使用无效参数创建 schema 导致分段错误
- ARROW-3890 - [Python] 在 Python 2.7 上使用显式字符串类型创建数组失败
- ARROW-3894 - [Python] 读取没有记录批次的 IPC 文件时出错
- ARROW-3898 - parquet-arrow 示例有编译错误
- ARROW-3920 - Plasma 引用计数在 TensorFlow 自定义运算符中未正确完成。
- ARROW-3931 - 允许无论 LANG 如何都能进行构建
- ARROW-3936 - 在 Windows 上将 _O_NOINHERIT 添加到文件打开标志
- ARROW-3937 - [Rust] Rust nightly build 失败
- ARROW-3940 - [Python/Documentation] 将必需的包添加到开发说明中
- ARROW-3941 - [R] RecordBatchStreamReader$schema
- ARROW-3942 - [R] Feather api 修复
- ARROW-3953 - 兼容 pandas 0.24 将 MultiIndex labels 重命名为 codes
- ARROW-3955 - [GLib] 添加 (transfer full) 以在不再需要时释放
- ARROW-3957 - [Python] 当用户以错误的端口连接到 HDFS 集群时,提供更好的错误消息
- ARROW-3961 - [Python/Documentation] 修复 pyarrow README 中的错误路径
- ARROW-3969 - [Rust] CI 构建中断,因为 rustfmt 在 nightly 工具链上不可用
- ARROW-3976 - [Ruby] CLI 上的 Homebrew 捐赠请求破坏 CI 构建
- ARROW-3977 - [Gandiva] gandiva cpp 测试未在 CI 中运行
- ARROW-3979 - [Gandiva] 修复所有 valgrind 报告的错误
- ARROW-3980 - [C++] 修复 json-simple.cc 中的 CRTP 使用
- ARROW-3989 - [Rust] CSV 读取器应该处理布尔值的大小写敏感性
- ARROW-3996 - [C++] 构建上的描述不足
- ARROW-4008 - [C++] 集成测试可执行文件失败
- ARROW-4011 - [Gandiva] 在构建目录中引用 irhelpers.bc
- ARROW-4019 - [C++] 修复 coverity 问题
- ARROW-4033 - [C++] thirdparty/download_dependencies.sh 使用旧 Linux 版本中不可用的工具或选项
- ARROW-4034 - [Ruby] FileOutputStream 的接口不遵守 append=True
- ARROW-4041 - [CI] Python 2.7 运行使用 Python 3.6
- ARROW-4049 - [C++] 即使链接了 glog,Arrow 也从不使用 glog。
- ARROW-4052 - [C++] 与 glog 和 gflags 的链接器错误
- ARROW-4053 - [Python/Integration] HDFS 测试在使用关闭文件时发生 I/O 操作失败
- ARROW-4055 - [Python] 无法使用 2018.3 及更早版本转换 pytz.utc
- ARROW-4058 - [C++] arrow-io-hdfs-test 在针对 docker-compose 中的 HDFS 集群运行时失败
- ARROW-4065 - [C++] arrowTargets.cmake 损坏
- ARROW-4066 - 创建 Sphinx 文档的说明
- ARROW-4070 - [C++] ARROW_BOOST_VENDORED 在 ninja 构建中无法正常工作
- ARROW-4073 - [Python] AppVeyor 上的 Parquet 测试失败
- ARROW-4074 - [Python] 如果库安装在与 conda 或 wheel 包不同的位置,则 test_get_library_dirs_win32 失败
- ARROW-4078 - [CI] 运行 Travis 作业,其中 docs/ 更改时构建文档
- ARROW-4088 - [Python] 传递带有元数据的 schema 时,Table.from_batches() 失败
- ARROW-4089 - [Plasma] 该教程关于 PlasmaClient.Create 的参数类型是错误的
- ARROW-4101 - [C++] 未实现二进制身份转换
- ARROW-4106 - [Python] 测试运行失败,因为假设更新破坏了其 API
- ARROW-4109 - [Packaging] arrow-cpp conda recipe 中缺少 glog 依赖项
- ARROW-4113 - [R] 版本号补丁破坏了构建
- ARROW-4114 - [C++][DOCUMENTATION]
- ARROW-4115 - [Gandiva] valgrind 抱怨说布尔输出数据缓冲区具有未初始化的数据
- ARROW-4118 - [Python] “asv run” 出错
- ARROW-4125 - [Python] 如果未构建 Plasma 扩展(例如,在 Windows 上),ASV 基准测试无法运行
- ARROW-4126 - [Go] 访问布尔数组时未使用偏移量
- ARROW-4128 - [C++][DOCUMENTATION] 更新样式指南以反映更多例外情况
- ARROW-4130 - [Go] 访问二进制数组时未使用偏移量
- ARROW-4134 - [Packaging] 在 docker 测试中正确设置时区以防止 ORC 适配器中止
- ARROW-4135 - [Python] 无法重新加载包含 datetime.time 列表的 pandas 数据帧
- ARROW-4137 - [Rust] 将 parquet 代码移动到单独的 crate 中
- ARROW-4138 - [Python] setuptools_scm 自定义不适用于 Windows 上 0.9.0 以上的版本
- ARROW-4147 - [JAVA] 减少可变宽度向量的堆使用量
- ARROW-4149 - [CI/C++] Parquet 测试在 CMake 3.2 nightly 构建中缺少 ZSTD 压缩编解码器
- ARROW-4157 - [C++] -Wdocumentation 在 Ubuntu 18.04 上使用 clang 6.0 失败
- ARROW-4171 - [Rust] 修复 parquet crate 发布版本
- ARROW-4173 - dev/merge_arrow_pr.py 的错误消息中 JIRA 库名称错误
- ARROW-4178 - [C++] 修复 TSan 和 UBSan 错误
- ARROW-4179 - [Python] 测试在 CI 中的所有平台上崩溃
- ARROW-4185 - [Rust] Appveyor 构建已损坏
- ARROW-4186 - [C++] 当 length=0 时,BitmapWriters 会覆盖第一个字节
- ARROW-4188 - [Rust] 顶层 rust 目录中应该有一个 README
- ARROW-4197 - [C++] Emscripten 编译器构建 Arrow 失败
- ARROW-4200 - [C++] conda_env_* 文件不能用于在 Windows 上创建全新的 conda 环境
- ARROW-4209 - [Gandiva] 返回 IR 结构会导致 windows 出现问题
- ARROW-4215 - [GLib] 修复文档中的拼写错误
- ARROW-4227 - [GLib] 复合数据类型中的字段返回错误的数据类型
- ARROW-4237 - [Packaging] 修复发布验证脚本中的 CMAKE_INSTALL_LIBDIR
- ARROW-4238 - [Packaging] 修复 crossbow 和 rake 之间的 RC 版本冲突
- ARROW-4246 - [Plasma][Python] PlasmaClient.list 不适用于启用 CUDA 的 Plasma
- ARROW-4256 - [Release] 更新 Windows 验证脚本以进行 0.12 版本发布
- ARROW-4258 - [Python] 从带有 nan 的 numpy float64 数组到整数的安全转换失败
- ARROW-4260 - [Python] test_serialize_deserialize_pandas 在多个构建条目中失败