Apache Arrow 0.12.0 (2019年1月20日)
这是一个涵盖超过3个月开发的大版本发布。
下载
贡献者
本次发布包含来自77位不同贡献者的601次提交。
$ git shortlog -sn apache-arrow-0.11.0..apache-arrow-0.12.0
94 Kouhei Sutou
76 Wes McKinney
61 Antoine Pitrou
60 Krisztián Szűcs
25 Pindikura Ravindra
25 Yosuke Shiro
21 Romain Francois
17 Chao Sun
16 Andy Grove
15 Korn, Uwe
15 Sebastien Binet
13 Paddy Horan
13 Philipp Moritz
10 François Saint-Jacques
9 Praveen
8 Robert Nishihara
7 Uwe L. Korn
6 Brian Hulette
6 Bryan Cutler
6 praveenbingo
6 suquark
5 Javier Luraschi
5 Kousuke Saruta
4 Tanya Schlusser
3 Benjamin Kietzman
3 Dimitri Vorona
3 James Lamb
3 Kenta Murata
3 Neville Dipale
3 Yuhong Guo
3 alexandreyc
2 Animesh Trivedi
2 Deepak Majeti
2 Dmitry Kalinkin
2 Hatem Helal
2 Kengo Seki
2 Micah Kornfield
2 Pearu Peterson
2 Yasuo Honda
2 jlapacik
2 ptaylor
2 shyam
1 Antonio Cavallo
1 Binyang2014
1 Bradley Skaggs
1 Brent Kerby
1 Bruno P. Kinoshita
1 Christopher Hutchinson
1 Dmitry Vukolov
1 Dominik Moritz
1 Dustin Long
1 Jacques Nadeau
1 Jeffrey Wong
1 Joris Van den Bossche
1 Justin Dunham
1 Li Jin
1 Renjie Liu
1 ShubhamChaurasia
1 Siddharth Dave
1 Suvayu Ali
1 Sweeney, Mack
1 Sylvain Joubert
1 Tim Paine
1 Todd Mostak
1 Vivekanand Vellanki
1 Yevgeni Litvin
1 Yuqi Gu
1 Zhenyuan Zhao
1 andrew
1 c-bata
1 cav71
1 kabukawa
1 m.wang
1 minmin.fmm
1 philjdf
1 sarutak
1 siddharth
1 zeroshade
补丁提交者
以下 Apache 提交者将贡献的补丁合并到仓库中。
$ git shortlog -csn apache-arrow-0.11.0..apache-arrow-0.12.0
297 Wes McKinney
79 Kouhei Sutou
76 Krisztián Szűcs
35 Antoine Pitrou
25 Korn, Uwe
25 Yosuke Shiro
16 Philipp Moritz
15 Andy Grove
14 Uwe L. Korn
6 Robert Nishihara
4 Brian Hulette
4 Sidd
3 Bryan Cutler
3 GitHub
更新日志
新功能和改进
- ARROW-1019 - [C++] 实现使用 Gzip 编解码器的输入流和输出流
- ARROW-1423 - [C++] 根据第三方用户提供的上下文句柄创建非属主的 CudaContext
- ARROW-1492 - [C++] 类型转换函数内核套件
- ARROW-1688 - [Java] 在 checkstyle 警告时构建失败
- ARROW-1696 - [C++] 添加编解码器基准测试
- ARROW-1993 - [Python] 添加用于从 pandas.DataFrame 推断 Arrow 模式的函数
- ARROW-2211 - [C++] 为整数使用更简单的哈希函数
- ARROW-2216 - [CI] CI 描述和环境变量具有误导性
- ARROW-2337 - [脚本] Windows 发布验证脚本应使用 boost DSOs 而不是静态链接
- ARROW-2475 - [格式] 令人困惑的数组长度描述
- ARROW-2483 - [Rust] 对布尔向量使用位打包
- ARROW-2504 - [网站] 添加 ApacheCon NA 链接
- ARROW-2535 - [Python] 提供检查 flake8 的 pre-commit 钩子
- ARROW-2560 - [Rust] Rust README 应包含特定于 Rust 的贡献信息
- ARROW-2624 - [Python] 用于 Arrow 转换和 Parquet 测试的随机模式和数据生成器
- ARROW-2637 - [C++/Python] 在 Alpine Linux 上进行开发的构建支持和说明
- ARROW-2653 - [C++] 重构哈希表支持
- ARROW-2670 - [C++/Python] 将 Ubuntu 18.04 / gcc7 添加为夜间构建
- ARROW-2673 - [Python] 为 ARROW-2661 添加文档和文档字符串
- ARROW-2684 - [Python] 各项文档改进
- ARROW-2712 - [C#] 初始 C# .NET 库
- ARROW-2720 - [C++] 清理 cmake CXX_STANDARD 和 PIC 标志设置
- ARROW-2759 - 导出 Plasma 的通知套接字
- ARROW-2803 - [C++] 将哈希函数放入 src/arrow/util
- ARROW-2807 - [Python] 在读取 Parquet 文件时,允许在 get_reader 中切换内存映射
- ARROW-2808 - [Python] 为 ProxyMemoryPool 添加单元测试,允许构造新的默认 MemoryPool
- ARROW-2919 - [C++] 改进列出空 HDFS 文件时的错误消息
- ARROW-2968 - [R] 从 Arrow 表到 R data.frame 的多线程转换
- ARROW-3020 - [Python] 添加允许空 Parquet 行组的选项
- ARROW-3038 - [Go] 添加对 StringArray 的支持
- ARROW-3063 - [Go] 将支持/待办功能列表移至 confluence
- ARROW-3070 - [发布] 在 ASF Bintray 账户上托管 RC 和发布的二进制工件,而不是 dist/mirror 系统
- ARROW-3108 - [C++] 为 Table 实例提供 arrow::PrettyPrint
- ARROW-3126 - [Python] 使 Buffered* IO 类对 Python 可用,并将其集成到 input_stream、output_stream 工厂函数中
- ARROW-3131 - [Go] 为 Go-1.11 添加测试
- ARROW-3161 - [打包] 确保在 conda 和 wheel 构建中运行 pyarrow 单元测试
- ARROW-3169 - [C++] 将 array-test.cc 和 array.cc 分解为多个编译单元
- ARROW-3184 - [C++] 添加模块化构建目标,“all”目标,并在调用 make 或 ninja 时要求显式目标
- ARROW-3194 - [Java] 修复可变宽度向量在 spitAndTransfer 中的 setValueCount
- ARROW-3199 - [Plasma] 在 recvmsg 和 sendmsg 中检查 EAGAIN
- ARROW-3209 - [C++] 将 libarrow_gpu 重命名为 libarrow_cuda
- ARROW-3230 - [Python] ChunkedArray、Table 上缺少比较
- ARROW-3233 - [Python] 针对 pyarrow.cuda GPU 支持的 Sphinx 文档
- ARROW-3248 - [C++] Arrow 测试应具有标签“arrow”
- ARROW-3260 - [CI] 将 linting 设为单独的作业
- ARROW-3272 - [Java] 记录 checkstyle 与 Google 样式指南的偏差
- ARROW-3273 - [Java] checkstyle - 修复 javadoc 样式
- ARROW-3278 - [Python] 按名称检索 StructType 和 StructArray 的字段
- ARROW-3291 - [C++] 用于从 std::string 构造 arrow::io::BufferReader 的便捷 API
- ARROW-3303 - [C++] 允许使用简化的 JSON 表示来编写示例数组
- ARROW-3306 - [R] 不同类型的 arrow::Buffer 的对象和支持函数
- ARROW-3307 - [R] 将分块的 arrow::Column 转换为 R 向量
- ARROW-3310 - [R] 为各种 Arrow IO 接口创建包装类
- ARROW-3312 - [R] 为 R 绑定 C++ 代码和主 C++ 代码库使用相同的 .clang-format 文件
- ARROW-3318 - [C++] 用于将 IPC 流或文件中的所有批次读取为 arrow::Table 的便捷方法
- ARROW-3323 - [Java] checkstyle - 修复命名
- ARROW-3331 - [C++] 将 re2 添加到 ThirdpartyToolchain
- ARROW-3340 - [R] 支持日期和时间类
- ARROW-3347 - [Rust] 实现 PrimitiveArrayBuilder
- ARROW-3353 - [打包] 构建 python 3.7 wheels
- ARROW-3355 - [R] 支持因子(factors)
- ARROW-3358 - [Gandiva][C++] 将 gandiva/status.h 的用法替换为 arrow/status.h
- ARROW-3362 - [R] 防止空缓冲区
- ARROW-3366 - [R] 用于 docker-compose 设置的 Dockerfile
- ARROW-3368 - [集成/CI/Python] 将 dask 集成测试添加到 docker-compose 设置中
- ARROW-3380 - [Python] 支持从 gzipped 文件中读取 CSV 文件等
- ARROW-3381 - [C++] 实现 bz2 文件的 InputStream
- ARROW-3383 - [Java] 在 Travis CI 中运行 Gandiva 测试
- ARROW-3384 - [Gandiva] 同步 gandiva 仓库中剩余的提交
- ARROW-3385 - [Java] [Gandiva] 自动部署 gandiva 快照 jars
- ARROW-3387 - [C++] 将二进制文件转换为字符串/utf8 并进行 UTF8 验证的函数
- ARROW-3398 - [Rust] 更新现有的 Builder 以在内部使用 MutableBuffer
- ARROW-3402 - [Gandiva][C++] 在预编译的 IR 例程中利用通用的位图操作实现
- ARROW-3407 - [C++] 在 CSV 读取器转换选项中添加 UTF8 转换模式
- ARROW-3409 - [C++] 添加流式压缩接口
- ARROW-3421 - [C++] 将 include-what-you-use 设置添加到主 docker-compose.yml
- ARROW-3427 - [C++] 在 conda-forge 中为 double-conversion 包添加 Windows 支持和 Unix 静态库
- ARROW-3429 - [打包] 添加一个脚本,以发布使用 dist.apache.org 表位的源存档的二进制文件
- ARROW-3430 - [打包] 添加临时解决方案以验证 0.11.0
- ARROW-3431 - [GLib] 将 Gemfile 包含到存档中
- ARROW-3432 - [打包] Subversion 提交消息中的变量未展开
- ARROW-3439 - [R] 针对 Feather 格式的 R 语言绑定
- ARROW-3440 - [Gandiva][C++] 删除过时的 cpp/src/gandiva/README.md,将构建文档添加到 cpp/README.md
- ARROW-3441 - [Gandiva][C++] 减少测试可执行文件的数量
- ARROW-3442 - [C++] 为单元测试使用动态链接,确保覆盖率在使用 clang 时正常工作
- ARROW-3450 - [R] 包装 MemoryMappedFile 类
- ARROW-3451 - [Python] 从 numba.cuda 创建的 CUcontext 分配 CUDA 内存
- ARROW-3455 - [Gandiva][C++] 支持 Gandiva 的 pkg-config
- ARROW-3456 - [CI] 重用 docker 镜像并优化 docker-compose 容器
- ARROW-3460 - [打包] 添加一个脚本,以在本地发布分支上变基 master
- ARROW-3461 - [打包] 添加一个脚本,以上传 RC 工件作为正式发布
- ARROW-3462 - [打包] 更新 0.11.0 的 CHANGELOG
- ARROW-3463 - [网站] 更新 0.11.0
- ARROW-3465 - [文档] 修复 gen_apidocs 的 docker 镜像
- ARROW-3469 - [Gandiva] 为 OSX 上的 gandiva 添加 travis 条目
- ARROW-3472 - [Gandiva] 删除 gandiva 帮助库
- ARROW-3473 - [格式] 更新 Layout.md 文档以阐明 64 位数组长度的使用
- ARROW-3474 - [GLib] 使用 get_schema 和 read_column 扩展 gparquet API
- ARROW-3479 - [R] 支持将 record_batch 作为流写入
- ARROW-3482 - [C++] 默认使用 JEMALLOC 构建
- ARROW-3487 - [Gandiva] 简化可能返回错误的 NULL_IF_NULL 函数
- ARROW-3488 - [打包] 分离打包和测试的 crossbow 任务定义文件
- ARROW-3489 - [Gandiva] 支持 in 表达式
- ARROW-3490 - [R] 将 arrow 对象流式传输到输出流
- ARROW-3492 - [C++] 并行构建 jemalloc
- ARROW-3493 - [Java] 记录 BOUNDS_CHECKING_ENABLED
- ARROW-3499 - [R] 暴露 arrow::ipc::Message 类型
- ARROW-3501 - [Gandiva] 在 Ubuntu Trusty 和类似发行版上启用 gcc 4.8.x 构建
- ARROW-3504 - [Plasma] 添加对 Plasma 客户端的支持,以在不进行 pyarrow 序列化的情况下放置/获取原始字节。
- ARROW-3505 - [R] 读取记录批次和表
- ARROW-3506 - [打包] docker-compose 镜像的夜间测试
- ARROW-3515 - 引入 NumericTensor 类
- ARROW-3518 - [C++] 自动检测 HOMEBREW_PREFIX
- ARROW-3519 - [Gandiva] 添加对可返回可变长度输出的函数的支持
- ARROW-3521 - [GLib] 在 meson.build 中使用 find_program 运行 Python
- ARROW-3529 - [Ruby] 导入 Red Parquet
- ARROW-3530 - [Java/Python] 添加从 org.apache…pojo.Schema 到 pyarrow.Schema 的转换
- ARROW-3533 - [Python/文档] 使用 sphinx_rtd_theme 代替 Bootstrap
- ARROW-3536 - [C++] 快速 UTF8 验证函数
- ARROW-3537 - [Rust] 实现 Tensor 类型
- ARROW-3539 - [CI/打包] 更新脚本以针对 vendored jemalloc 进行构建
- ARROW-3540 - [Rust] 将 BooleanArray 合并到 PrimitiveArray
- ARROW-3542 - [C++] 从 CSV 构建数组时使用不安全的附加
- ARROW-3545 - [C++/Python] 使用 StructType 规范化 child/field 术语
- ARROW-3547 - [R] 从 RecordBatch 读取时防止 Null 崩溃
- ARROW-3548 - 加快在对象存储中存储小对象的速度。
- ARROW-3551 - 在 Powered By 页面上将 MapD 更改为 OmniSci
- ARROW-3555 - [Plasma] 使用元数据统一 plasma 客户端 get 函数。
- ARROW-3556 - [CI] 在 Windows 上禁用优化
- ARROW-3557 - [Python] 在 Cython 源中设置 language_level
- ARROW-3558 - [Plasma] 当 plasma 客户端调用 get 获取其创建的未封存对象时,移除致命错误。
- ARROW-3559 - 静态链接 plasma_store_server 可执行文件的库。
-
ARROW-3562 - [R] 禁止创建带有 null shared_ptr 的对象
- ARROW-3563 - [C++] 声明公共链接依赖项,以便 arrow_static、plasma_static 自动拉取传递依赖项
- ARROW-3566 - 阐明字典编码字段的类型应为编码(索引)类型
- ARROW-3567 - [Gandiva] [GLib] 添加 Gandiva 的 GLib 绑定
- ARROW-3568 - [打包] 为 windows wheels 运行 pyarrow 单元测试
- ARROW-3569 - [打包] 构建 conda 包时运行 pyarrow 单元测试
- ARROW-3574 - 修复 plasma 静态库与共享库的剩余问题。
- ARROW-3576 - [Python] 将压缩文件读取器暴露为 NativeFile
- ARROW-3577 - [Go] 添加对 ChunkedArray 的支持
- ARROW-3581 - [Gandiva][C++] ARROW_PROTOBUF_USE_SHARED 未被使用
- ARROW-3582 - [CI] Gandiva C++ 构建总是被触发
- ARROW-3583 - [Python/Java] 从 VectorSchemaRoot 创建 RecordBatch
- ARROW-3584 - [Go] 添加对 Table 的支持
- ARROW-3587 - [Python] Arrow 对象(array, table, tensor等)的高效序列化
- ARROW-3588 - [Java] checkstyle - 修复许可证
- ARROW-3589 - [Gandiva] 使在没有 JNI 的情况下编译 gandiva 成为可能
- ARROW-3591 - [R] 支持收集 decimal 类型
- ARROW-3592 - [Python] 将 BinaryArray 值作为零拷贝内存视图获取
- ARROW-3597 - [Gandiva] gandiva 应与 ADD_ARROW_TEST 集成以进行测试
- ARROW-3600 - [打包] 支持 Ubuntu 18.10
- ARROW-3601 - [Rust] 发布 0.11.0
- ARROW-3602 - [Gandiva] [Python] 为 Gandiva 添加初步的 Cython 绑定
- ARROW-3603 - [Gandiva][C++] 无法使用 vendored Boost 构建
- ARROW-3605 - 从 plasma 头文件中移除 AE 库。
- ARROW-3607 - [Java] 通过 JNI 为 plasma 实现 delete() 方法
- ARROW-3608 - [R] 支持 time32 和 time64 数组类型
- ARROW-3609 - [Gandiva] 将基准测试移出单元测试
- ARROW-3610 - [C++] 添加接口将 stl_allocator 转换为 arrow::MemoryPool
- ARROW-3611 - 在 pyarrow 序列化上下文使用不当时更快地给出错误。
- ARROW-3612 - [Go] 实现 RecordBatch 和 RecordBatchReader
- ARROW-3615 - [R] 支持 NaN
- ARROW-3616 - [Java] checkstyle - 修复剩余的编码检查
- ARROW-3618 - [打包/文档] 添加 `-c conda-forge` 选项以避免 PackagesNotFoundError
- ARROW-3620 - [Python] 在 Sphinx 中记录多线程选项并添加到 api.rst
- ARROW-3621 - [Go] 实现 TableBatchReader
- ARROW-3622 - [Go] 实现 Schema.Equal
- ARROW-3623 - [Go] 实现 Field.Equal
- ARROW-3624 - [Python/C++] 支持零大小的设备缓冲区
- ARROW-3626 - [Go] 添加 CSV TableReader
- ARROW-3629 - [Python] 将 write_to_dataset 添加到 Python Sphinx API 列表中
- ARROW-3630 - [Plasma] [GLib] 添加 Plasma 的 GLib 绑定
- ARROW-3632 - [打包] 在 dev/release/00-prepare.sh 中更新 dev/tasks/tasks.yml 中的 deb 名称
- ARROW-3633 - [打包] 为 0.12.0 更新 dev/tasks/tasks.yml 中的 deb 名称
- ARROW-3636 - [C++/Python] 更新 arrow/python/pyarrow_api.h
- ARROW-3638 - [C++][Python] 将从 Feather 读取为 Table 的功能从 Python 移动到 C++
- ARROW-3639 - [打包] 运行 gandiva 夜间打包任务
- ARROW-3640 - [Go] 添加对 Tensors 的支持
- ARROW-3641 - [C++/Python] 从 Cython api 函数中移除 public 关键字
- ARROW-3642 - [C++] 添加 arrowConfig.cmake 生成
- ARROW-3645 - [Python] 在 Sphinx 中记录压缩支持
- ARROW-3646 - [Python] 添加便捷工厂以创建 IO 流
- ARROW-3647 - [R] 卸载 bit64 包后崩溃
- ARROW-3648 - [Plasma] 添加 API 以同时获取元数据和数据
- ARROW-3649 - [Rust] 重构 MutableBuffer 的 resize
- ARROW-3656 - [C++] 允许数字 CSV 字段中的空白
- ARROW-3657 - [R] 要求 bit64 包
- ARROW-3659 - [C++] Clang Travis 构建(矩阵条目2)可能实际上没有使用 clang
- ARROW-3660 - [C++] 不要在只读文件中不必要地锁定 MemoryMappedFile 进行大小调整
- ARROW-3661 - [Gandiva][GLib] 改进常量名称
- ARROW-3662 - [C++] 为 MemoryMappedFile::GetSize 添加一个 const 重载
- ARROW-3664 - [Rust] 为 PrimitiveArrayBuilder 添加基准测试
- ARROW-3665 - [Rust] 实现 StructArrayBuilder
- ARROW-3666 - [C++] 提高 CSV 解析器性能
- ARROW-3672 - [Go] 实现 Time32 数组
- ARROW-3673 - [Go] 实现 Time64 数组
- ARROW-3674 - [Go] 实现 Date32 数组
- ARROW-3675 - [Go] 实现 Date64 数组
- ARROW-3677 - [Go] 实现 FixedSizedBinary 数组
- ARROW-3681 - [Go] 为 CSV 读取器添加基准测试
- ARROW-3682 - [Go] 从 CSV 读取器中取消导出 encoding/csv.Reader
- ARROW-3683 - [Go] 将函数式选项风格添加到 CSV 读取器
- ARROW-3684 - [Go] 为 CSV 读取器添加块大小选项
- ARROW-3692 - [Gandiva] [Ruby] 添加 Gandiva 的 Ruby 绑定
- ARROW-3693 - [R] 带有空数据的空字符的缓冲区无效
- ARROW-3694 - [Java] 当日志级别被禁用时,避免不必要的字符串创建
- ARROW-3695 - [Gandiva] 使用 add_arrow_lib()
- ARROW-3696 - [C++] 添加 feather::TableWriter::Write(table)
- ARROW-3697 - [Ruby] 添加 schema#[]
- ARROW-3701 - [Gandiva] 添加对十进制运算的支持
- ARROW-3708 - [打包] 夜间 CentOS 构建失败
- ARROW-3713 - [Rust] 实现 BinaryArrayBuilder
- ARROW-3718 - [Gandiva] 移除多余的 gtest include
- ARROW-3719 - [GLib] 支持从 Feather 读写表
- ARROW-3720 - [GLib] 使用 "indices" 而不是 "indexes"
- ARROW-3721 - [Gandiva] [Python] 支持所有 Gandiva 字面量
- ARROW-3722 - [C++] 允许为 CSV 读取器指定列类型
- ARROW-3723 - [Plasma] [Ruby] 添加 Plasma 的 Ruby 绑定
- ARROW-3724 - [GLib] 更新 gitignore
- ARROW-3725 - [GLib] 向 GArrowStructDataType 添加字段读取器
- ARROW-3726 - [Rust] CSV 读取器和写入器
- ARROW-3727 - [Python] 在 Sphinx 中记录 pyarrow.foreign_buffer, cuda.foreign_buffer 的使用
- ARROW-3731 - [R] 用于读写 Parquet 文件的 R API
- ARROW-3733 - [GLib] 向 GArrowTable 和 GArrowColumn 添加 to_string()
- ARROW-3736 - [CI/Docker] 在 docker-compose run cpp 中 Ninja 测试挂起
- ARROW-3738 - [C++] 添加 CSV 转换选项以解析类 ISO8601 时间戳字符串
- ARROW-3741 - [R] 添加对 arrow::compute::Cast 的支持,以将 Arrow 数组从一种类型转换为另一种
- ARROW-3743 - [Ruby] 添加保存/加载 Feather 的支持
- ARROW-3744 - [Ruby] 在 Arrow::Table#to_s 中使用 garrow_table_to_string()
- ARROW-3746 - [Gandiva] [Python] 使列出所有在 Gandiva 中注册的函数成为可能
- ARROW-3747 - [C++] 翻转 arrow::Decimal128 中数据成员的顺序
- ARROW-3748 - [GLib] 添加 GArrowCSVReader
- ARROW-3749 - [GLib] 文档和测试用例名称中的拼写错误
- ARROW-3751 - [Python] 为 gandiva 添加更多 cython 绑定
- ARROW-3752 - [C++] 移除未使用的 status::ArrowError
- ARROW-3753 - [Gandiva] 移除调试打印
- ARROW-3755 - [GLib] 支持 CompressedInputStream, CompressedOutputStream
- ARROW-3760 - [R] 支持 Arrow CSV 读取器
- ARROW-3773 - [C++] 移除 parquet/arrow/arrow-reader-writer-test.cc 中重复的 AssertArraysEqual 代码
- ARROW-3778 - [C++] 不要在 test-util.h 中放置实现
- ARROW-3781 - [C++] 在 arrow::io::BufferedOutputStream 中配置缓冲区大小
- ARROW-3782 - [C++] 为 C++ 实现 BufferedReader
- ARROW-3784 - [R] 带类型的数组因“x is not a vector”而失败
- ARROW-3785 - [C++] 在 CI 工具链中使用 double-conversion conda 包
-
ARROW-3787 - 实现 From
用于 BinaryArray - ARROW-3788 - [Ruby] 添加对用 C++ 编写的 CSV 解析器的支持
- ARROW-3795 - [R] 支持从 INT64 数组中检索 NAs
- ARROW-3796 - [Rust] 为 PrimitiveArrayBuilder 添加示例
- ARROW-3798 - [GLib] 添加对列类型 CSV 读取选项的支持
- ARROW-3800 - [C++] 提供一个 string_view 的向后移植
- ARROW-3803 - [C++/Python] 分离 C++ 和 Python 单元测试 Travis CI 作业,将所有 C++ 测试(包括 Gandiva)一起运行
- ARROW-3807 - [R] 缺少 Field API
- ARROW-3819 - [打包] 在编译器迁移后更新 conda 变体文件以符合 feedstock
- ARROW-3821 - [格式/文档]:修复 Flight.proto 注释中的拼写错误和语法问题
- ARROW-3823 - [R] + buffer.complex
- ARROW-3825 - [Python] Python README.md 未显示如何运行单元测试套件
- ARROW-3830 - [GLib] 添加 GArrowCodec
- ARROW-3834 - [文档] 合并 Python 和 C++ 并移至顶层
- ARROW-3836 - [C++] 为 ADD_ARROW_BENCHMARK 添加 PREFIX 选项
- ARROW-3839 - [Rust] 添加在 CSV 读取器中推断模式的功能
- ARROW-3841 - [C++] 警告:按值捕获多态类型
- ARROW-3842 - [R] RecordBatchStreamWriter api
- ARROW-3844 - [C++] 移除 ARROW_USE_SSE 和 ARROW_SSE3
- ARROW-3845 - [Gandiva] [GLib] 添加 GGandivaNode
- ARROW-3847 - [GLib] 移除不必要的“\”。
- ARROW-3849 - 利用 Armv8 crc32 扩展指令加速 Arm64 的哈希计算。
- ARROW-3851 - [C++] "make check-format" 速度慢
- ARROW-3852 - [C++] used uninitialized 警告
- ARROW-3853 - [C++] 实现字符串到时间戳的转换
- ARROW-3854 - [GLib] 弃用 garrow_gio_{input,output}_stream_get_raw()
- ARROW-3855 - [Rust] Schema/Field/Datatype 应实现 serde traits
- ARROW-3856 - [Ruby] 支持压缩 CSV 保存/加载
- ARROW-3858 - [GLib] 使用 {class_name}_get_instance_private
- ARROW-3859 - [Java] 修复 ComplexWriter 向后不兼容的更改
- ARROW-3860 - [Gandiva] [C++] 添加在构建 libgandiva_jni.so 时使用 -static-libstdc++ 的选项
- ARROW-3862 - [C++] 改进依赖项下载脚本
- ARROW-3863 - [GLib] 将 travis_retry 与 brew bundle 命令一起使用
- ARROW-3864 - [GLib] 添加对 allow-float-truncate 转换选项的支持
- ARROW-3865 - [打包] 将 double-conversion 依赖项添加到 conda forge recipes 和 windows wheel 构建中
- ARROW-3867 - [文档] 将二进制发布工件上传到 Bintray
- ARROW-3868 - [Rust] 在 CI 中针对 nightly Rust 进行构建
- ARROW-3870 - [C++] 向 InputStream API 添加 Peek
- ARROW-3871 - [R] 将 C++ GetValuesSafely 的用法替换为 ArrayData 上的新方法
- ARROW-3878 - [Rust] 改进原始类型
-
ARROW-3880 - [Rust] PrimitiveArray
应支持简单的数学运算 - ARROW-3883 - [Rust] 更新 Rust README 以反映新功能
- ARROW-3884 - [Python] 将 LLVM6 添加到 manylinux1 基础镜像
- ARROW-3885 - [Rust] 将版本更新为 0.12.0 并更新 wiki 上的发布说明
- ARROW-3886 - [C++] ARROW-3831 的附加测试用例
- ARROW-3891 - [Java] 使用简单的位图操作移除 Long.bitCount
- ARROW-3893 - [C++] 提高自适应 int 构建器的性能
- ARROW-3895 - [Rust] CSV 读取器应返回 Result<Option<>> 而不是 Option<Result<>>
- ARROW-3900 - [GLib] 添加 garrow_mutable_buffer_set_data()
- ARROW-3905 - [Ruby] 添加 StructDataType#[]
- ARROW-3906 - [C++] 将 builder.cc 分解为多个编译单元
- ARROW-3908 - [Rust] 更新 rust dockerfile 以使用 nightly 工具链
- ARROW-3910 - [Python] 在实现重复数据删除逻辑后,将 *.to_pandas 中的 date_as_object 默认设置为 True
- ARROW-3911 - [Python] 在 Table.to_pandas 内部对 datetime.date 对象进行重复数据删除
- ARROW-3912 - [Plasma][GLib] 添加对创建和引用对象的支持
- ARROW-3913 - [Gandiva] [GLib] 添加 GGandivaLiteralNode
- ARROW-3914 - [C++/Python/打包] Alpine linux 的 Docker-compose 设置
- ARROW-3916 - [Python] 在 `ParquetWriter` 构造函数中支持调用者提供的文件系统
- ARROW-3922 - [C++] 提高位图操作的性能
- ARROW-3924 - [打包][Plasma] 添加对 Plasma deb/rpm 包的支持
- ARROW-3925 - [Python] 在 conda 环境的 Linux/macOS 依赖项中包含 autoconf
- ARROW-3928 - [Python] 添加选项以在 Table.to_pandas 转换路径中对 PyBytes / PyString / PyUnicode 对象进行重复数据删除
- ARROW-3929 - [Go] 改进 CSV 读取器的内存使用以提高运行时性能
- ARROW-3930 - [C++] 随机测试数据生成速度慢
- ARROW-3932 - [Python/文档] 在 Sphinx 文档中包含 Benchmarks.md
- ARROW-3934 - [Gandiva] 如果 ARROW_GANDIVA_BUILD_TESTS=off,则不编译预编译的测试
- ARROW-3938 - [打包] 停止引用 java/pom.xml 来获取版本信息
- ARROW-3939 - [Rust] 移除 ListArrayBuilder 的宏定义
- ARROW-3945 - [网站] 关于 Gandiva 代码捐赠的博客文章
- ARROW-3946 - [GLib] 添加对联合的支持
- ARROW-3948 - [CI][GLib] 为 Homebrew 设置超时
- ARROW-3950 - [Plasma] 导入时不强制加载 TensorFlow 操作
- ARROW-3952 - [Rust] 在 Cargo.toml 中指定 edition="2018"
- ARROW-3958 - [Plasma] 减少 IPC 数量
- ARROW-3959 - [Rust] 时间和时间戳支持
- ARROW-3960 - [Rust] 为 Rust 2018 移除 extern crate
- ARROW-3963 - [打包/Docker] 构建 sphinx 文档的夜间测试
- ARROW-3964 - [Go] csv.Reader 的更易读的示例
- ARROW-3967 - [Gandiva] [C++] 使 gandiva/node.h 公开
- ARROW-3970 - [Gandiva][C++] 移除不必要的 boost 依赖
- ARROW-3971 - [Python] 移除在 0.11 及之前版本中已弃用的 API
- ARROW-3974 - [C++] 合并 array/builder.h 中的 field_builders_ 和 children_ 成员
- ARROW-3982 - [C++] 在简单 JSON 格式中允许“二进制”输入
- ARROW-3983 - [Gandiva][Crossbow] 打包时使用静态 boost
- ARROW-3984 - [C++] 如果用户遇到 zstd ExternalProject 路径,则报错退出
- ARROW-3986 - [C++] 编写散文文档
- ARROW-3988 - [C++] 在构建系统中默认不构建单元测试
- ARROW-3993 - [JS] CI 作业失败
- ARROW-3994 - [C++] 移除 ARROW_GANDIVA_BUILD_TESTS 选项
- ARROW-3995 - [CI] 在 Travis 矩阵中使用易于理解的名称
- ARROW-3997 - [C++] [文档] 阐明字典编码整数的符号性(以及宽度?)
- ARROW-4002 - [C++][Gandiva] 移除 CMake 版本检查
- ARROW-4004 - [GLib] 用 CUDA 替换 GPU
- ARROW-4005 - [Plasma] [GLib] 添加 gplasma_client_disconnect()
- ARROW-4006 - 添加 CODE_OF_CONDUCT.md
- ARROW-4009 - [CI] 在不同的构建中运行 Valgrind 和 C++ 代码覆盖率
- ARROW-4015 - [Plasma] 移除 plasma 管理器的旧接口
- ARROW-4017 - [C++] 检查并更新 vendored 库
- ARROW-4026 - [C++] 为单元测试使用单独的模块化 $COMPONENT-test 目标
- ARROW-4028 - [Rust] 合并 parquet-rs 代码库
- ARROW-4029 - [C++] 定义并记录内部/私有头文件的命名约定,这些文件不应被安装
- ARROW-4030 - [CI] 当步骤失败时使用 travis_terminate 停止构建
- ARROW-4035 - [Ruby] 支持 msys2 mingw 依赖
- ARROW-4037 - [打包] 移除验证 0.11.0 的临时解决方案
- ARROW-4038 - [Rust] 为布尔 AND, OR, NOT 添加 array_ops 方法
- ARROW-4039 - 从 Python README.md 更新指向 'development.rst' 页面的链接
- ARROW-4042 - [Rust] BinaryArray 和 PrimitiveArray 之间方法命名不一致
- ARROW-4043 - [打包/Docker] Alpine 上的 Python 测试缺少 pytest 依赖
- ARROW-4044 - [打包/Python] 将 hypothesis 测试依赖添加到 pyarrow conda recipe
- ARROW-4045 - [打包/Python] 将 hypothesis 测试依赖添加到 wheel crossbow 测试
- ARROW-4048 - [GLib] 在 gparquet_arrow_file_reader_read_column 中返回 ChunkedArray 而不是 Array
- ARROW-4051 - [Gandiva] [GLib] 添加对 null 字面量的支持
- ARROW-4054 - [Python] 在 manylinux1 基础镜像中更新 gtest, flatbuffers 和 OpenSSL
- ARROW-4060 - [Rust] 添加 Parquet/Arrow 模式转换器
- ARROW-4069 - [Python] 添加从二进制转换为 utf8 的测试
- ARROW-4075 - [Rust] 在调用 finish() 后重用数组构建器
- ARROW-4079 - [C++] 添加机器基准测试
- ARROW-4080 - [Rust] 改进 Appveyor 中漫长的构建时间
- ARROW-4082 - [C++] CMake 调整:允许 RelWithDebInfo,改进 FindClangTools
- ARROW-4084 - [C++] 简化 Status 和 stringstream 的样板代码
- ARROW-4085 - [GLib] 对结构数据类型使用 "field"
- ARROW-4087 - [C++] 使 CSV 的 null 值可配置
- ARROW-4093 - [C++] 已弃用的方法建议了错误的方法
- ARROW-4098 - [Python] 弃用 pyarrow.open_stream,open_file,推荐使用 pa.ipc.open_stream/open_file
- ARROW-4100 - [Gandiva][C++] 修复正则表达式以忽略 "." 字符
- ARROW-4102 - [C++] FixedSizeBinary 恒等转换未实现
- ARROW-4103 - [文档] 向 docs/ 根目录添加 README
- ARROW-4105 - 添加 rust-toolchain 以强制用户使用 nightly 工具链进行构建
- ARROW-4107 - [Python] 在 pyarrow manylinux1 构建中使用 ninja
- ARROW-4112 - [打包][Gandiva] 添加对 deb 包的支持
- ARROW-4116 - [Python] 在 development.rst 中阐明 virtualenv 不能与 miniconda/Anaconda 一起使用
- ARROW-4122 - [C++] 初始化一些未初始化的类成员
- ARROW-4127 - [文档] 添加 Docker 构建说明
- ARROW-4129 - [Python] 修复基准测试文档中的语法问题
- ARROW-4132 - [GLib] 添加更多 GArrowTable 构造函数
- ARROW-4141 - [Ruby] 添加从原始 Ruby 对象创建模式的支持
- ARROW-4148 - [CI/Python] 在夜间 Alpine 构建中禁用 ORC
- ARROW-4150 - [C++] 不要从内部内部分配返回包含 nullptr 的缓冲区
- ARROW-4151 - [Rust] 重组项目目录
- ARROW-4152 - [GLib] 移除一个展示 Torch 集成的示例
- ARROW-4153 - [GLib] 为了一致性添加 builder_append_value()
- ARROW-4154 - [GLib] 添加 GArrowDecimal128DataType
-
ARROW-4155 - [Rust] 为 PrimitiveArray 实现 array_ops::sum()
- ARROW-4156 - [C++] cmake 生成的项目 xcodebuild 失败
- ARROW-4158 - [开发] 允许维护者在合并拉取请求时使用 GitHub API 令牌
- ARROW-4160 - [Rust] 向 parquet 添加 README 和可执行文件
- ARROW-4161 - [GLib] 添加 GPlasmaClientOptions
- ARROW-4162 - [Ruby] 添加从描述创建数据类型的支持
- ARROW-4166 - [Ruby] 添加保存到缓冲区和从缓冲区加载的支持
- ARROW-4167 - [Gandiva] 切换到 arrow/util/variant
- ARROW-4168 - [GLib] 使用属性来保存在 garrow_field_new() 中传递的 GArrowDataType
- ARROW-4172 - [Rust] 数组构建器中更一致的命名
- ARROW-4174 - [Ruby] 添加从原始 Ruby 对象构建复合数组的支持
- ARROW-4175 - [GLib] 添加对十进制比较运算符的支持
- ARROW-4177 - [C++] 添加 ThreadPool 和 TaskGroup 微基准测试
- ARROW-4183 - [Ruby] 添加 Arrow::Struct 作为 Arrow::StructArray 的一个元素
- ARROW-4184 - [Ruby] 添加 Arrow::RecordBatch#to_table
- ARROW-4191 - [C++] 对 jemalloc 使用与主源相同的 CC 和 AR
- ARROW-4199 - [GLib] 添加 garrow_seekable_input_stream_peek()
- ARROW-4207 - [Gandiva] [GLib] 添加对 IfNode 的支持
- ARROW-4210 - [Python] 在 pyarrow 的 conda meta.yaml 中直接提及 boost-cpp
- ARROW-4211 - [GLib] 添加 GArrowFixedSizeBinaryDataType
- ARROW-4214 - [Ruby] 添加从原始 Ruby 对象构建 RecordBatch 的支持
- ARROW-4216 - [Python] 添加 CUDA API 文档
- ARROW-4228 - [GLib] 添加 garrow_list_data_type_get_field()
- ARROW-4229 - [打包] 明确设置 crossbow 目标以支持构建任意 arrow 仓库
- ARROW-4233 - [打包] 创建一个 Dockerfile 来构建源存档
- ARROW-4239 - [发布] 在准备脚本中更新 .deb 包名称在 OSX 上运行失败
- ARROW-4240 - [打包] 源存档中缺少 Plasma GLib 和 Gandiva GLib 的文档
- ARROW-4241 - [打包] 禁用 crossbow conda OSX clang 构建
- ARROW-4243 - [Python] pandas 0.24.0rc1 测试失败
- ARROW-4249 - [Plasma] 从 plasma/common.h 中移除对 logging.h 的引用
- ARROW-4257 - [发布] 更新发布验证脚本以检查 Bintray 上的二进制文件
- ARROW-4266 - [Python][CI] 在 dask 集成测试中禁用 ORC 测试
- ARROW-4269 - [Python] AttributeError: 模块 'pandas.core' 没有属性 'arrays'
- ARROW-4270 - [打包][Conda] 更新 xcode 版本并移除工具链构建
- ARROW-4276 - [发布] 从二进制文件验证脚本中移除不必要的 Bintray 身份验证
- ARROW-45 - [Python] 为 List 类型添加 unnest/flatten 函数
- ARROW-554 - [C++] 实现函数以统一多个 Arrow 数组中不等的字典
- ARROW-854 - [格式] 支持稀疏张量
- ARROW-912 - [Python] 在 development.rst 中考虑多架构系统
Bug 修复
- ARROW-1847 - [文档] 以 FAQ 方式记录 RecordBatch 和 Table 之间的区别
- ARROW-1994 - [Python] 针对 Pandas master 进行测试
- ARROW-2026 - [Python] 将所有时间戳分辨率转换为 INT96 use_deprecated_int96_timestamps=True
- ARROW-2038 - [Python] s3fs Parquet 支持的后续错误修复
- ARROW-2113 - [Python] 包含“hadoop”的不完整 CLASSPATH 会误导设置 HDFS 的逻辑
- ARROW-2591 - [Python] 将空的 ListType 列写入 Parquet 时出现分段错误
- ARROW-2592 - [Python] 由于元数据向后兼容性问题,读取旧 Parquet 文件时出错
- ARROW-2708 - [C++] arrow::compute 中的内部 GetValues 函数应检查 nullptr
- ARROW-2970 - [Python] NumPyConverter::Visit for Binary/String/FixedSizeBinary 可能溢出
- ARROW-3058 - [Python] 当从 pandas 转换产生 ChunkedArray 时,Feather 读取失败并出现不直观的错误
- ARROW-3186 - [GLib] Travis CI 中的 mesonbuild 失败
- ARROW-3202 - [C++] 构建在 Alpine Linux 上不成功
-
ARROW-3225 - [C++/Python] ListType 的 Pandas 对象转换
和 ListType - ARROW-3324 - [Parquet] 写入多个行组时释放更多内部资源
- ARROW-3343 - [Java] Java 测试因 Flight 测试的内存泄漏而非确定性地失败
- ARROW-3405 - [Python] 记录 CSV 读取器
- ARROW-3428 - [Python] 从 pandas 将浮点数转换为布尔值时 from_pandas 给出不正确的结果
- ARROW-3436 - [C++] Gandiva 所需的 Boost 版本对于 Ubuntu 14.04 来说太新了
- ARROW-3437 - [Gandiva][C++] 使用 LDFLAGS 配置 libgcc、libstdc++ 的静态链接
- ARROW-3438 - [打包] 变更日志中转义的项目符号
- ARROW-3445 - [GLib] Parquet GLib 未链接 Arrow GLib
- ARROW-3449 - [C++] 支持 CMake 3.2 用于“开箱即用”的构建
- ARROW-3466 - [Python] 导入 tensorflow 和 pyarrow 时崩溃
- ARROW-3467 - 针对外部 double conversion 的构建已损坏
- ARROW-3470 - [C++] 逐行转换教程已过时
- ARROW-3477 - [C++] 测试套件在 32 位架构上失败
- ARROW-3480 - [网站] Ubuntu 的安装文档已损坏
- ARROW-3485 - [C++] 示例因 Protobuf 错误而失败
- ARROW-3494 - [C++] re2 conda-forge 包在工具链中不工作
- ARROW-3516 - [C++] 在 parallel_memcpy 中为指针差异使用无符号类型
- ARROW-3517 - [C++] MinGW 32 位构建导致 g++ 段错误
- ARROW-3524 - [C++] 修复 ARROW-3409 在 clang-6 上的编译器警告
- ARROW-3527 - [R] R 包 C++ 代码中未使用的变量
- ARROW-3528 - [R] R 文档中的拼写错误
- ARROW-3535 - [Python] pip install tensorflow 在 manylinux1 构建中安装了过新的 numpy
- ARROW-3541 - [Rust] 更新 BufferBuilder 以允许新的位打包 BooleanArray
- ARROW-3544 - [Gandiva] 在多个编译单元中填充函数注册表,以减少发布模式下的长编译时间
- ARROW-3549 - [Rust] 对于一些位实用函数,将 i64 替换为 usize
- ARROW-3573 - [Rust] with_bitset 未正确设置有效位
- ARROW-3580 - [Gandiva][C++] 使用 g++ 8.2.0 构建时出错
- ARROW-3586 - [Python] 将空表转换为带分类的 pandas 时出现分段错误
- ARROW-3598 - [Plasma] plasma_store_server 在启用 GPU 的情况下链接失败
- ARROW-3613 - [Go] Resize 未正确更新长度
- ARROW-3614 - [R] 处理从 Arrow 到 R 的 Type::TIMESTAMP 类型
- ARROW-3634 - [GLib] cuda.cpp 编译错误
-
ARROW-3658 - [Rust] `List` 的偏移量缓冲区验证不正确
` - ARROW-3670 - [C++] 使用 FindBacktrace 查找 execinfo.h 支持
- ARROW-3687 - [Rust] 任何测量数组槽位的变量都应为 `usize` 类型
- ARROW-3698 - [C++] 在 Gandiva 中使用大表时出现分段错误
- ARROW-3700 - [C++] CSV 解析器应允许忽略空行
- ARROW-3703 - [Python] 如果 datetime 列包含时区,DataFrame.to_parquet 会崩溃
- ARROW-3704 - [Gandiva] 无法使用 g++ 8.2.0 构建
- ARROW-3707 - [C++] 使用 zstd 1.3.7 时测试失败
- ARROW-3711 - [C++] 不要将 CXX_FLAGS 传递给 C_FLAGS
- ARROW-3712 - [CI] 许可证检查回归(RAT 失败)
- ARROW-3715 - [C++] gflags_ep 在使用 CMake 3.13 构建时失败
- ARROW-3716 - [R] ChunkedArray 转换缺少处理分支
- ARROW-3728 - [Python] 合并 Parquet 文件 - Schema 中的 Pandas 元数据不匹配
- ARROW-3734 - [C++] 在 Arch x86-64 上链接静态 zstd 库失败
- ARROW-3740 - [C++] 使用小于当前已追加长度的长度调用 ArrayBuilder::Resize 会导致无效状态
- ARROW-3742 - 修复 pyarrow.types 和 gandiva 的 cython 绑定
- ARROW-3745 - [C++] CMake 多次将静态库传递给链接器
- ARROW-3754 - [打包] 在 Linux 软件包构建中出现 Zstd 配置错误
- ARROW-3756 - [CI/Docker/Java] 在 docker-compose 环境中 Java 测试失败
- ARROW-3762 - [C++] 当 BinaryArray 容量溢出时,Parquet arrow::Table 读取出错
- ARROW-3765 - [Gandiva] 当有效性位图未分配时出现段错误
- ARROW-3766 - [Python] pa.Table.from_pandas 不使用 schema 顺序
- ARROW-3768 - [Python] 将 classpath 设置为 hdfs 而不是 hadoop 可执行文件
- ARROW-3790 - [C++] 当类型大小相同时,有符号到无符号整数的转换产生不正确的结果
- ARROW-3792 - [Python] 将空的 RecordBatches 写入 Parquet 时出现分段错误
- ARROW-3793 - [C++] TestScalarAppendUnsafe 未测试不安全的追加操作
- ARROW-3797 - [Rust] 在有偏移量的情况下 BinaryArray::value_offset 不正确
- ARROW-3805 - [Gandiva] 在 if-else 表达式中处理空的有效性位图
- ARROW-3831 - [C++] arrow::util::Codec::Decompress() 不返回解压后的数据大小
- ARROW-3835 - [C++] 缺少 arrow::io::CompressedOutputStream::raw() 的实现
- ARROW-3837 - [C++] 在 Windows 上出现 gflags 链接错误
- ARROW-3866 - [Python] 列元数据未传输到 pyarrow 中的表
- ARROW-3874 - [Gandiva] 无法构建:LLVM 未正确检测
- ARROW-3879 - [C++] cuda-test 失败
- ARROW-3888 - [C++] 使用 gcc 7.3.0 编译时出现警告
- ARROW-3889 - [Python] 使用无效参数创建 schema 会导致分段错误
- ARROW-3890 - [Python] 在 Python 2.7 上使用显式字符串类型创建数组失败
- ARROW-3894 - [Python] 读取没有记录批次的 IPC 文件时出错
- ARROW-3898 - parquet-arrow 示例存在编译错误
- ARROW-3920 - TensorFlow 自定义操作中 Plasma 引用计数未正确处理
- ARROW-3931 - 使构建不受 LANG 环境变量影响
- ARROW-3936 - 在 Windows 上为文件打开标志添加 _O_NOINHERIT
- ARROW-3937 - [Rust] Rust nightly 构建失败
- ARROW-3940 - [Python/文档] 在开发说明中添加所需的包
- ARROW-3941 - [R] RecordBatchStreamReader$schema
- ARROW-3942 - [R] Feather API 修复
- ARROW-3953 - 兼容 pandas 0.24 中 MultiIndex 的 labels 重命名为 codes
- ARROW-3955 - [GLib] 添加 (transfer full) 以便在不再需要时释放
- ARROW-3957 - [Python] 当用户使用错误端口连接到 HDFS 集群时提供更好的错误消息
- ARROW-3961 - [Python/文档] 修复 pyarrow README 中的错误路径
- ARROW-3969 - [Rust] 由于 nightly 工具链中没有 rustfmt,CI 构建中断
- ARROW-3976 - [Ruby] Homebrew 在命令行上的捐赠请求导致 CI 构建中断
- ARROW-3977 - [Gandiva] gandiva cpp 测试未在 CI 中运行
- ARROW-3979 - [Gandiva] 修复所有 valgrind 报告的错误
- ARROW-3980 - [C++] 修复 json-simple.cc 中 CRTP 的使用
- ARROW-3989 - [Rust] CSV 读取器应处理布尔值的大小写敏感性
- ARROW-3996 - [C++] 构建说明不充分
- ARROW-4008 - [C++] 集成测试可执行文件失败
- ARROW-4011 - [Gandiva] 在构建目录中引用 irhelpers.bc
- ARROW-4019 - [C++] 修复 coverity 问题
- ARROW-4033 - [C++] thirdparty/download_dependencies.sh 使用了旧版 Linux 中不可用的工具或选项
- ARROW-4034 - [Ruby] FileOutputStream 的接口不遵守 append=True
- ARROW-4041 - [CI] Python 2.7 运行使用了 Python 3.6
- ARROW-4049 - [C++] 即使链接了 glog,Arrow 也从不使用它
- ARROW-4052 - [C++] glog 和 gflags 存在链接器错误
- ARROW-4053 - [Python/集成] HDFS 测试因对已关闭文件进行 I/O 操作而失败
- ARROW-4055 - [Python] 无法转换 2018.3 及更早版本的 pytz.utc
- ARROW-4058 - [C++] 当针对 docker-compose 的 HDFS 集群运行时,arrow-io-hdfs-test 失败
- ARROW-4065 - [C++] arrowTargets.cmake 已损坏
- ARROW-4066 - 创建 Sphinx 文档的说明
- ARROW-4070 - [C++] ARROW_BOOST_VENDORED 在 ninja 构建中无法正常工作
- ARROW-4073 - [Python] AppVeyor 上的 Parquet 测试失败
- ARROW-4074 - [Python] 如果库安装在与 conda 或 wheel 包不同的位置,test_get_library_dirs_win32 会失败
- ARROW-4078 - [CI] 当 docs/ 发生变化时,运行构建文档的 Travis 作业
- ARROW-4088 - [Python] 当传递带有元数据的 schema 时,Table.from_batches() 失败
- ARROW-4089 - [Plasma] 关于 PlasmaClient.Create 参数类型的教程是错误的
- ARROW-4101 - [C++] 未实现二进制恒等转换(Binary identity cast)
- ARROW-4106 - [Python] 由于 hypothesis 更新破坏了其 API,测试无法运行
- ARROW-4109 - [打包] arrow-cpp conda 配方中缺少 glog 依赖
- ARROW-4113 - [R] 版本号补丁破坏了构建
- ARROW-4114 - [C++][文档]
- ARROW-4115 - [Gandiva] valgrind 抱怨布尔输出数据缓冲区有未初始化的数据
- ARROW-4118 - [Python] "asv run" 出现错误
- ARROW-4125 - [Python] 如果未构建 Plasma 扩展(例如在 Windows 上),ASV 基准测试无法运行
- ARROW-4126 - [Go] 访问布尔数组时未使用偏移量
- ARROW-4128 - [C++][文档] 更新样式指南以反映更多例外情况
- ARROW-4130 - [Go] 访问二进制数组时未使用偏移量
- ARROW-4134 - [打包] 在 docker 测试中正确设置时区以防止 ORC 适配器中止
- ARROW-4135 - [Python] 无法重新加载包含 datetime.time 列表的 pandas dataframe
- ARROW-4137 - [Rust] 将 parquet 代码移动到一个单独的 crate 中
- ARROW-4138 - [Python] 在 Windows 上,setuptools_scm 自定义对 0.9.0 以上的版本无效
- ARROW-4147 - [JAVA] 减少可变宽度向量的堆使用量
- ARROW-4149 - [CI/C++] Parquet 测试在 CMake 3.2 nightly 构建中缺少 ZSTD 压缩编解码器
- ARROW-4157 - [C++] 在 Ubuntu 18.04 上使用 clang 6.0 出现 -Wdocumentation 失败
- ARROW-4171 - [Rust] 修复 parquet crate 的发布版本
- ARROW-4173 - dev/merge_arrow_pr.py 错误消息中的 JIRA 库名错误
- ARROW-4178 - [C++] 修复 TSan 和 UBSan 错误
- ARROW-4179 - [Python] CI 中所有平台上的测试都崩溃了
- ARROW-4185 - [Rust] Appveyor 构建已损坏
- ARROW-4186 - [C++] 当 length=0 时,BitmapWriters 会破坏第一个字节
- ARROW-4188 - [Rust] 顶层 rust 目录中应该有一个 README 文件
- ARROW-4197 - [C++] Emscripten 编译器构建 Arrow 失败
- ARROW-4200 - [C++] 在 Windows 上,conda_env_* 文件不能用于创建新的 conda 环境
- ARROW-4209 - [Gandiva] 返回 IR 结构体在 Windows 上导致问题
- ARROW-4215 - [GLib] 修复文档中的拼写错误
- ARROW-4227 - [GLib] 复合数据类型中的字段返回错误的数据类型
- ARROW-4237 - [打包] 修复发布验证脚本中的 CMAKE_INSTALL_LIBDIR
- ARROW-4238 - [打包] 修复 crossbow 和 rake 之间的 RC 版本冲突
- ARROW-4246 - [Plasma][Python] PlasmaClient.list 在启用 CUDA 的 Plasma 中不起作用
- ARROW-4256 - [发布] 更新 0.12 版本的 Windows 验证脚本
- ARROW-4258 - [Python] 从包含 nan 的 numpy float64 数组到整数的安全转换失败
- ARROW-4260 - [Python] test_serialize_deserialize_pandas 在多个构建条目中失败