设置#

安装和设置 Git#

Arrow 项目使用 Git 进行版本控制,该版本控制工具在所有常见操作系统上都可以轻松获得。

您可以按照 GitHub 上的说明安装 Git,GitHub 是 Arrow 存储库的托管地,请按照 快速入门说明 进行操作。

设置 Git 后,请不要忘记配置您的姓名和电子邮件

$ git config --global user.name "Your Name"
$ git config --global user.email [email protected]

以及 通过 GitHub 进行身份验证,因为这将允许您在每次执行 git 命令时无需输入用户名和密码即可与 GitHub 进行交互。

注意

本指南假设您熟悉从命令行工作。某些 IDE 允许您管理 Git 存储库,但在这样做时可能会隐式运行不需要的操作(例如,创建项目文件)。

例如,在 RStudio 中克隆它假定整个存储库是一个 RStudio 项目,并且将在根目录中创建 .Rproj 文件。出于此原因,强烈建议使用命令行或 Git 客户端克隆存储库。

获取源代码#

分叉存储库#

Arrow GitHub 存储库包含 Arrow C++ 库以及其他语言的库,例如 Go、Java、Matlab、Python、R 等。贡献的第一步是在您自己的 GitHub 帐户中创建存储库的分支。

  1. 转到 apache/arrow.

  2. 点击右上角的“分叉”。

    Fork the Apache Arrow repository on GitHub.

    在 GitHub 上分叉 Apache Arrow 存储库的图标。#

  3. 选择将存储库分叉到您的用户名,以便分叉将创建在 https://github.com/<your username>/arrow 上。

克隆存储库#

接下来,您需要克隆存储库

$ git clone https://github.com/<your username>/arrow.git

并将 Apache Arrow 存储库添加为名为 upstream 的远程。

$ cd arrow
$ git remote add upstream https://github.com/apache/arrow

验证您的上游#

您的上游应该指向 Arrow GitHub 存储库。

在 shell 中运行

$ git remote -v

应该会给出与以下类似的结果

origin    https://github.com/<your username>/arrow.git (fetch)
origin    https://github.com/<your username>/arrow.git (push)
upstream  https://github.com/apache/arrow (fetch)
upstream  https://github.com/apache/arrow (push)

如果一切正常,您现在应该在 arrow 目录中拥有代码的副本,以及两个指向您自己的 GitHub 分支 (origin) 和官方 Arrow 存储库 (upstream) 的远程。