Apache Arrow 0.4.1 (2017年6月9日)
这主要是一个错误修复版本,但也包括一些打包和文档方面的改进。
请在版本发布博客文章中阅读更多内容。
下载
更新日志
新功能和改进
- ARROW-1020 - [格式] 在 Schema.fbs 中添加额外说明,以澄清本地与非本地(naive vs. localized)时间戳值
- ARROW-1034 - [Python] 在 Windows / MSVC 上启用二进制 wheel 包的创建
- ARROW-1049 - [Java] 向量模板清理
- ARROW-1060 - [Python] 为 ARROW-1053 添加单元测试
- ARROW-1063 - [网站] 针对 0.4.0 版本发布的博客文章和网站更新
- ARROW-1068 - [Python] 创建一个外部代码库,并配置 appveyor.yml 以构建 Python wheel 安装程序
- ARROW-1069 - 添加发布 Maven artifacts 的说明
- ARROW-1078 - [Python] 适配 PARQUET-967 的变更
- ARROW-1080 - C++: 添加关于行式表示法转换的教程
- ARROW-1082 - [GLib] 在 macOS 上添加持续集成 (CI)
- ARROW-1084 - BufferAllocator 的实现应处理 Netty 的 OutOfDirectMemoryError
- ARROW-897 - [GLib] 在 Travis CI 构建矩阵中将 arrow-glib 作为单独的构建任务
- ARROW-986 - [格式] 更新 IPC.md 以适配字典批处理
- ARROW-990 - [JS] 添加 tslint 支持以对 TypeScript 进行代码检查
Bug 修复
- ARROW-1039 - Python: 当 nthreads>1 时 pyarrow.Filesystem.read_parquet 会导致错误
- ARROW-1050 - [C++] 导出 arrow::ValidateArray
- ARROW-1051 - [Python] 如果 pyarrow.parquet 因共享库 ABI 冲突而导入失败,test_parquet.py 测试会静默地不运行
- ARROW-1056 - [Python] 由于写入 pandas 索引,Parquet+HDFS 测试失败
- ARROW-1057 - 修复 cmake 警告和 msvc 调试断言
- ARROW-1062 - [GLib] 示例使用了旧的 API
- ARROW-1066 - 对于 pandas >= 0.20.1,移除 feather 的警告
- ARROW-1070 - [C++] 用于日期/时间类型的 Feather 文件应使用物理类型写入
- ARROW-1075 - [GLib] 在 macOS 上构建错误
- ARROW-1085 - [Java] 跟进模板清理工作。缺少 IntervalYear 的方法
- ARROW-1086 - [Python] pypi 上的 pyarrow 0.4.0 缺少 pxd 文件
- ARROW-1088 - [Python] 当系统不支持 Unicode 文件名时,test_unicode_filename 测试失败
- ARROW-1090 - [Python] build_ext 的易用性
- ARROW-1091 - Decimal 的小数位数 (scale) 和精度 (precision) 被弄反了
- ARROW-1092 - 更多关于 Decimal 小数位数和精度弄反问题的跟进修复
- ARROW-1094 - [C++] arrow::io::ReadableFile 中不完整的缓冲区读取应精确地截断返回的缓冲区
- ARROW-424 - [C++] arrow/io/hdfs.h 中的线程安全问题
贡献者
$ git shortlog -sn apache-arrow-0.4.0..apache-arrow-0.4.1
16 Wes McKinney
5 Julien Le Dem
4 Kouhei Sutou
2 Jacob Scott
1 Brian Hulette
1 Jeff Knupp
1 Jeff Reback
1 Max Risuhin
1 Phillip Cloud
1 Tony Kelman
1 Uwe L. Korn
1 adeneche
1 kimanjun
1 rip.nsk