Apache Arrow 0.4.0 (2017年5月22日)
在发布博文中阅读更多内容
下载
更新日志
贡献者
$ git shortlog -sn apache-arrow-0.3.0..apache-arrow-0.4.0
28 Wes McKinney
18 Kouhei Sutou
9 Uwe L. Korn
3 Brian Hulette
3 Emilio Lahr-Vivaz
3 Philipp Moritz
3 Phillip Cloud
2 Julien Le Dem
1 Bryan Cutler
1 Jeff Reback
1 Max Risuhin
1 Wenchen Fan
1 bgosztonyi
新功能和改进
- ARROW-1000 - [GLib] 将安装文档移至网站
- ARROW-1001 - [GLib] 统一写入器文件
- ARROW-1002 - [C++] 在FileWriter实现中,没有必要在魔术头部之后添加填充
- ARROW-1008 - [C++] 为流迭代定义抽象接口
- ARROW-1010 - [网站] /blog/ 中仅显示英文博文
- ARROW-1011 - [格式] 澄清有效性位图中关于缓冲区填充的要求
- ARROW-1015 - [Java] 实现模式级别的元数据
- ARROW-1016 - Python:在 wheel 包中(可选地)包含 C++ 头文件
- ARROW-1022 - [Python] 为 Feather 读取方法添加 nthreads 选项
- ARROW-1024 - Python:将构建时的 numpy 版本更新到 1.10.1
- ARROW-1025 - [网站] 改进网站上的更新日志
- ARROW-1027 - [Python] 允许在 pyarrow Table 和 Schema 对象的字段/列上使用负数索引
- ARROW-1028 - [Python] ARROW-1008 之后的文档更新
- ARROW-1029 - [Python] 修复在 Windows 上使用 --with-parquet 的构建问题,并向 Appveyor 添加单元测试
- ARROW-1030 - Python:考虑 parquet-cpp 中的库版本控制
- ARROW-1031 - [GLib] 支持格式化打印(pretty print)
- ARROW-1037 - [GLib] 遵循读取器名称变更
- ARROW-1038 - [GLib] 遵循写入器名称变更
- ARROW-1040 - [GLib] 遵循张量 IO 变更
- ARROW-1044 - [GLib] 支持 Feather
- ARROW-182 - [C++] 移除 Array::Validate 虚函数,并将其作为一个独立的方法
- ARROW-29 - C++:将 re2 作为可选的第三方工具链依赖项添加
- ARROW-446 - [Python] 在 Sphinx 中为 NativeFile 接口和 HDFS 客户端编写文档
- ARROW-482 - [Java] 在 IPC 设置中提供对 "custom_metadata" 字段属性的 API 访问
- ARROW-532 - [Python] 为 0.3 版本扩展 pyarrow.parquet 文档
- ARROW-629 - [JS] 添加单元测试套件
- ARROW-714 - [C++] 以 NumPy 风格为第三方 C++ 用户添加 import_pyarrow C API
- ARROW-819 - [Python] 定义公共 Cython API
- ARROW-872 - [JS] 读取流式格式
- ARROW-873 - [JS] 实现定宽列表类型
- ARROW-874 - [JS] 读取字典编码的向量
- ARROW-899 - [文档] 为 0.3.0 添加变更日志
- ARROW-901 - [Python] 将 FixedSizeBinary 写入 Parquet
- ARROW-923 - [文档] 为网站生成带有 JIRA 链接的变更日志
- ARROW-929 - 将 KEYS 文件移至 SVN,并从 git 中移除
- ARROW-943 - [GLib] 支持使用源码归档运行单元测试
- ARROW-945 - [GLib] 添加一个 Lua 示例以展示与 Torch 的集成
- ARROW-946 - [GLib] 构造函数名称使用 "new" 而不是 "open"
- ARROW-947 - [Python] 改进 manylinux1 构建的执行时间
- ARROW-953 - 在持续集成构建中使用来自 conda-forge 的 cmake / curl
- ARROW-954 - 使 Arrow 可以使用仅头文件的 boost 进行编译
- ARROW-956 - 移除对 pandas 0.20.0 之前版本的兼容性
- ARROW-957 - [文档] 将 HDFS 和 Windows 文档添加到 doxygen 输出中
- ARROW-961 - [Python] 将 InMemoryOutputStream 重命名为 BufferOutputStream
- ARROW-963 - [GLib] 添加 equal 方法
- ARROW-967 - [GLib] 支持用缓冲区初始化数组
- ARROW-970 - [Python] 意外调用 pyarrow.Table() 不应导致进程段错误
- ARROW-977 - [java] 添加带时区信息的时间戳向量
- ARROW-984 - [GLib] 添加 Go 示例
- ARROW-985 - [GLib] 更新包信息
- ARROW-988 - [JS] 在 Travis CI 矩阵中添加条目
- ARROW-993 - [GLib] 在 Go 示例中添加缺失的错误检查
- ARROW-996 - [网站] 添加 0.3 版本发布的日文公告
- ARROW-997 - [Java] 在 FixedSizeListVector 中实现 transfer
Bug 修复
- ARROW-1003 - [C++] 在 Windows 上使用 MSVC 构建时,Hdfs 和 java 的 dll 文件加载失败
- ARROW-1004 - ArrowInvalid: 无效: float 类型的 Python 对象不是 None,也不是字符串、布尔值或日期对象
- ARROW-1017 - Python: Table.to_pandas 存在内存泄漏
- ARROW-1023 - Python:修复为 macOS 捆绑 arrow-cpp 的问题
- ARROW-1033 - [Python] pytest 发现了 scripts/test_leak.py
- ARROW-1046 - [Python] 使 DataFrame 元数据符合 pandas 规范
- ARROW-1053 - [Python] RecordBatchFileReader 存在内存泄漏
- ARROW-1054 - [Python] 测试套件在 pandas 0.19.2 上失败
- ARROW-813 - [Python] setup.py sdist 也必须捆绑依赖的 cmake 模块
- ARROW-824 - 日期和时间向量应反映无时区的语义
- ARROW-856 - 因未知编译器导致的 CmakeError
- ARROW-881 - [Python] 使用 custom_metadata 重构 Pandas DataFrame 索引
- ARROW-909 - libjemalloc.so.2: 无法打开共享对象文件
- ARROW-939 - 修复零维张量的除零错误
- ARROW-940 - [JS] 生成多套构建产物
- ARROW-944 - Python:对 pandas==0.18.1 的兼容性被破坏
- ARROW-948 - [GLib] 更新 C++ 头文件列表
- ARROW-952 - 在 macOS 上使用 clang-802.0.42 出现编译错误
- ARROW-958 - [Python] Conda 构建指南仍然需要 ARROW_HOME, PARQUET_HOME
- ARROW-991 - [Python] PyArray_SimpleNew 不应与 NPY_DATETIME 一起使用
- ARROW-995 - [网站] 0.3 版本发布公告的引用中有错别字
- ARROW-998 - [文档] 文件格式文档中的模式位置不正确