Apache Arrow 0.4.1 (2017年6月9日)
这主要是修复 bug 的版本,但也包含一些打包和文档方面的改进。
请在发布博客文章中阅读更多信息。
下载
更新日志
新特性和改进
- ARROW-1020 - [Format] 在 Schema.fbs 中添加更多语言来阐明 naive 与 localized Timestamp 值
- ARROW-1034 - [Python] 在 Windows / MSVC 上启用二进制 wheel 的创建
- ARROW-1049 - [java] 向量模板清理
- ARROW-1060 - [Python] 为 ARROW-1053 添加单元测试
- ARROW-1063 - [Website] 0.4.0 版本的博客文章和网站更新
- ARROW-1068 - [Python] 创建配置了用于构建 Python wheel 安装程序的 appveyor.yml 的外部存储库
- ARROW-1069 - 添加发布 maven 工件的说明
- ARROW-1078 - [Python] 考虑 PARQUET-967
- ARROW-1080 - C++: 添加有关转换为/从行式表示形式转换的教程
- ARROW-1082 - [GLib] 在 macOS 上添加 CI
- ARROW-1084 - BufferAllocator 的实现应该处理 Netty 的 OutOfDirectMemoryError
- ARROW-897 - [GLib] 在 Travis CI 构建矩阵中将 arrow-glib 构建为单独的构建
- ARROW-986 - [Format] 更新 IPC.md 以考虑 dictionary batches
- ARROW-990 - [JS] 添加 tslint 支持以用于 linting TypeScript
Bug 修复
- ARROW-1039 - Python: 如果 nthreads>1,pyarrow.Filesystem.read_parquet 会导致错误
- ARROW-1050 - [C++] 导出 arrow::ValidateArray
- ARROW-1051 - [Python] 如果由于共享库 ABI 冲突导致 pyarrow.parquet 导入失败,则 test_parquet.py 测试会静默地不运行
- ARROW-1056 - [Python] 由于写入 pandas 索引导致 Parquet+HDFS 测试失败
- ARROW-1057 - 修复 cmake 警告和 msvc 调试断言
- ARROW-1062 - [GLib] 示例使用旧 API
- ARROW-1066 - 删除 pandas >= 0.20.1 的 feather 警告
- ARROW-1070 - [C++] date/time 类型的 Feather 文件应该使用物理类型写入
- ARROW-1075 - [GLib] macOS 上的构建错误
- ARROW-1085 - [java] 跟进模板清理。 IntervalYear 缺少方法
- ARROW-1086 - [Python] pypi 上的 pyarrow 0.4.0 缺少 pxd 文件
- ARROW-1088 - [Python] 当系统不支持 unicode 文件名时,test_unicode_filename 测试失败
- ARROW-1090 - [Python] build_ext 可用性
- ARROW-1091 - Decimal scale 和 precision 被翻转
- ARROW-1092 - 更多 Decimal 和 scale 翻转的后续
- ARROW-1094 - [C++] arrow::io::ReadableFile 中的不完整缓冲区读取应精确截断返回的缓冲区
- ARROW-424 - [C++] arrow/io/hdfs.h 中的线程安全性
贡献者
$ git shortlog -sn apache-arrow-0.4.0..apache-arrow-0.4.1
16 Wes McKinney
5 Julien Le Dem
4 Kouhei Sutou
2 Jacob Scott
1 Brian Hulette
1 Jeff Knupp
1 Jeff Reback
1 Max Risuhin
1 Phillip Cloud
1 Tony Kelman
1 Uwe L. Korn
1 adeneche
1 kimanjun
1 rip.nsk