Apache Arrow 0.4.0 (2017年5月22日)
阅读发布博文了解更多信息
下载
变更日志
贡献者
$ git shortlog -sn apache-arrow-0.3.0..apache-arrow-0.4.0
28 Wes McKinney
18 Kouhei Sutou
9 Uwe L. Korn
3 Brian Hulette
3 Emilio Lahr-Vivaz
3 Philipp Moritz
3 Phillip Cloud
2 Julien Le Dem
1 Bryan Cutler
1 Jeff Reback
1 Max Risuhin
1 Wenchen Fan
1 bgosztonyi
新功能和改进
- ARROW-1000 - [GLib] 将安装文档移至网站
- ARROW-1001 - [GLib] 统一写入器文件
- ARROW-1002 - [C++] 在 FileWriter 实现中,没有必要在魔术标头之后添加填充
- ARROW-1008 - [C++] 定义流迭代的抽象接口
- ARROW-1010 - [网站] 只在 /blog/ 中显示英文帖子
- ARROW-1011 - [格式] 阐明有效性位图中缓冲区填充的要求
- ARROW-1015 - [Java] 实现模式级元数据
- ARROW-1016 - Python:在 wheel 包中包含 C++ 头文件(可选)
- ARROW-1022 - [Python] 为 Feather 读取方法添加 nthreads 选项
- ARROW-1024 - Python:将构建时 numpy 版本更新至 1.10.1
- ARROW-1025 - [网站] 改进网站上的变更日志
- ARROW-1027 - [Python] 允许在 pyarrow Table 和 Schema 对象上的字段/列中使用负索引
- ARROW-1028 - [Python] ARROW-1008 之后的文档更新
- ARROW-1029 - [Python] 修复 Windows 上 --with-parquet 构建问题,向 Appveyor 添加单元测试
- ARROW-1030 - Python:考虑 parquet-cpp 中的库版本控制
- ARROW-1031 - [GLib] 支持 pretty print(格式化输出)
- ARROW-1037 - [GLib] 遵循读取器名称更改
- ARROW-1038 - [GLib] 遵循写入器名称更改
- ARROW-1040 - [GLib] 遵循张量 IO
- ARROW-1044 - [GLib] 支持 Feather
- ARROW-182 - [C++] 删除 Array::Validate 虚函数并创建一个单独的方法
- ARROW-29 - C++:添加 re2 作为可选的第三方工具链依赖项
- ARROW-446 - [Python] 在 Sphinx 中记录 NativeFile 接口和 HDFS 客户端
- ARROW-482 - [Java] 在 IPC 设置中提供对 "custom_metadata" 字段属性的 API 访问
- ARROW-532 - [Python] 扩展 0.3 版本的 pyarrow.parquet 文档
- ARROW-629 - [JS] 添加单元测试套件
- ARROW-714 - [C++] 为第三方 C++ 用户添加 NumPy 风格的 import_pyarrow C API
- ARROW-819 - [Python] 定义公共 Cython API
- ARROW-872 - [JS] 读取流式格式
- ARROW-873 - [JS] 实现固定宽度列表类型
- ARROW-874 - [JS] 读取字典编码向量
- ARROW-899 - [文档] 为 0.3.0 添加变更日志
- ARROW-901 - [Python] 将 FixedSizeBinary 写入 Parquet
- ARROW-923 - [文档] 使用 JIRA 链接为网站生成变更日志
- ARROW-929 - 将 KEYS 文件移至 SVN,从 git 中移除
- ARROW-943 - [GLib] 支持使用源代码归档文件运行单元测试
- ARROW-945 - [GLib] 添加一个 Lua 示例以展示 Torch 集成
- ARROW-946 - [GLib] 对构造函数名称使用“new”而不是“open”
- ARROW-947 - [Python] 缩短 manylinux1 构建的执行时间
- ARROW-953 - 在 CI 构建中使用 conda-forge 中的 cmake / curl
- ARROW-954 - 可以使用仅包含头文件的 boost 编译 Arrow
- ARROW-956 - 移除 pandas 0.20.0 之前的兼容性
- ARROW-957 - [文档] 将 HDFS 和 Windows 文档添加到 doxygen 输出中
- ARROW-961 - [Python] 将 InMemoryOutputStream 重命名为 BufferOutputStream
- ARROW-963 - [GLib] 添加 equal 方法
- ARROW-967 - [GLib] 支持使用缓冲区初始化数组
- ARROW-970 - [Python] 意外调用 pyarrow.Table() 不应导致进程崩溃
- ARROW-977 - [java] 添加时区感知时间戳向量
- ARROW-984 - [GLib] 添加 Go 示例
- ARROW-985 - [GLib] 更新软件包信息
- ARROW-988 - [JS] 向 Travis CI 矩阵添加条目
- ARROW-993 - [GLib] 在 Go 示例中添加缺少的错误检查
- ARROW-996 - [网站] 以日语添加 0.3 版本发布公告
- ARROW-997 - [Java] 在 FixedSizeListVector 中实现 transfer
错误修复
- ARROW-1003 - [C++] 使用 MSVC 为 Windows 构建时,Hdfs 和 java dll 无法加载
- ARROW-1004 - ArrowInvalid: 无效:类型为 float 的 Python 对象不是 None,也不是字符串、布尔值或日期对象
- ARROW-1017 - Python: Table.to_pandas 泄漏内存
- ARROW-1023 - Python:修复 macOS 的 arrow-cpp 捆绑问题
- ARROW-1033 - [Python] pytest 发现 scripts/test_leak.py
- ARROW-1046 - [Python] 使 DataFrame 元数据符合 pandas 规范
- ARROW-1053 - [Python] RecordBatchFileReader 存在内存泄漏
- ARROW-1054 - [Python] 测试套件在 pandas 0.19.2 上失败
- ARROW-813 - [Python] setup.py sdist 还必须捆绑依赖的 cmake 模块
- ARROW-824 - 日期和时间向量应反映无时区语义
- ARROW-856 - 未知编译器导致 CmakeError。
- ARROW-881 - [Python] 使用 custom_metadata 重建 Pandas DataFrame 索引
- ARROW-909 - libjemalloc.so.2:无法打开共享对象文件
- ARROW-939 - 修复零维张量的除零错误
- ARROW-940 - [JS] 生成多组制品
- ARROW-944 - Python:pandas==0.18.1 的兼容性损坏
- ARROW-948 - [GLib] 更新 C++ 头文件列表
- ARROW-952 - macOS 上使用 clang-802.0.42 时出现编译错误
- ARROW-958 - [Python] Conda 构建指南仍然需要 ARROW_HOME、PARQUET_HOME
- ARROW-991 - [Python] PyArray_SimpleNew 不应与 NPY_DATETIME 一起使用
- ARROW-995 - [网站] 0.3 版本发布公告中的参考有误
- ARROW-998 - [文档] 文件格式文档的模式位置不正确