开发指南#

日志记录抽象#

Apache Arrow Java 使用 SLF4J API,因此请配置 SLF4J 以查看日志(例如,通过 Logback/Apache Log4j)。

  1. 如果用户没有通过 Logback 或 Apache Log4j 添加任何 jar 依赖项,则 SLF4J 将默认为无操作 (NOP) 日志记录。

  2. 如果用户通过 Logback 或 Apache Log4j 添加了任何依赖项,但未配置/添加/定义 logback.xml/log4j2.xml,则日志将默认为 DEBUG 模式。

  3. 要禁用调试日志,用户必须在他们的 logback.xml/log4j2.xml 中定义自己的规则并定义自己的日志记录器。

单元测试#

单元测试在构建期间由 Maven 运行。

为了加快构建速度,可以通过传递 -DskipTests 来跳过它们。

$ cd arrow/java
$ mvn \
    -Darrow.cpp.build.dir=../java-dist/lib -Parrow-jni \
    -Darrow.c.jni.dist.dir=../java-dist/lib -Parrow-c-data \
    clean install

性能测试#

arrow-performance 模块包含基准测试。

让我们配置我们的环境以运行性能测试

如果您需要在 UI 上查看性能测试,则配置 (可选)

让我们执行基准测试

$ cd benchmarks
$ conbench java-micro --help
$ conbench java-micro
    --iterations=1
    --commit=e90472e35b40f58b17d408438bb8de1641bfe6ef
    --java-home=<absolute path to your java home>
    --src=<absolute path to your arrow project>
    --benchmark-filter=org.apache.arrow.adapter.AvroAdapterBenchmarks.testAvroToArrow
Benchmark                              Mode  Cnt       Score   Error  Units
AvroAdapterBenchmarks.testAvroToArrow  avgt       725545.783          ns/op
Time to POST https://127.0.0.1:5000/api/login/ 0.14911699295043945
Time to POST https://127.0.0.1:5000/api/benchmarks/ 0.06116318702697754

然后转到:http://127.0.0.1:5000/ 查看报告

UI 主页

../../_images/conbench_ui.png

UI 运行

../../_images/conbench_runs.png

UI 基准测试

../../_images/conbench_benchmark.png

集成测试#

集成测试可以通过 Archery 运行。例如,假设您只构建了 Arrow Java 并想要运行 IPC 集成测试,您将执行

$ archery integration --run-ipc --with-java 1

代码风格#

当前 Java 代码遵循 Google Java 风格指南,并带有 Apache 许可证头。

Java 代码风格在构建期间由 Spotless 检查,持续集成构建将验证更改是否符合风格指南。

自动修复代码风格问题#

  • 您可以使用 mvn spotless:check 在不构建项目的情况下检查样式。

  • 您可以使用 mvn spotless:apply 自动格式化源代码。

示例

The following files had format violations:
    src/main/java/org/apache/arrow/algorithm/rank/VectorRank.java
        @@ -15,7 +15,6 @@
        ·*·limitations·under·the·License.
        ·*/

        -
        package·org.apache.arrow.algorithm.rank;

        import·java.util.stream.IntStream;
Run 'mvn spotless:apply' to fix these violations.

Intellij IDEA 和 Eclipse 的代码格式化程序#

按照说明为以下软件设置 google-java-format:

Checkstyle#

Checkstyle 也用于通用 lint。配置位于 checkstyle。您也可以在不构建项目的情况下检查样式。这将检查当前目录下或单个模块中的所有源代码的代码风格。

$ mvn checkstyle:check

Maven pom.xml 样式使用 Spotless 强制执行,使用 Apache Maven pom.xml 指南 您也可以在不构建项目的情况下检查样式。这将检查当前目录下或单个模块中的所有 pom.xml 文件的样式。

$ mvn spotless:check

这将样式应用于当前目录下或单个模块中的所有 pom.xml 文件。

$ mvn spotless:apply

构建缓存#

构建缓存通过 Develocity(以前称为 Maven Enterprise)完成。要强制构建而不使用缓存,请运行

mvn clean install -Ddevelocity.cache.local.enabled=false -Ddevelocity.cache.remote.enabled=false

例如,这对于确保您看到 ErrorProne 的所有警告很有用。

ErrorProne#

ErrorProne 应禁用生成代码。