快速入门¶

在这里，我们将简要介绍 ADBC 与 C++17 中 SQLite 驱动程序的基本功能。

安装¶

此快速入门实际上是一个文字 C++ 文件。您可以克隆存储库，构建示例，并跟着操作。

我们假设您使用conda-forge来管理依赖项。需要 CMake、C++17 编译器和 ADBC 库。它们可以按如下方式安装

mamba install cmake compilers libadbc-driver-manager libadbc-driver-sqlite

构建¶

我们这里将使用CMake。从 ADBC 存储库的源代码检出中

mkdir build
cd build
cmake ../docs/source/cpp/recipe
cmake --build . --target recipe-quickstart
./recipe-quickstart

使用 ADBC¶

让我们从一些包含文件开始

// For EXIT_SUCCESS
#include <cstdlib>
// For strerror
#include <cstring>
#include <iostream>

#include <arrow-adbc/adbc.h>
#include <nanoarrow.h>

然后我们将添加一些（非常基本）的错误检查助手。

// Error-checking helper for ADBC calls.
// Assumes that there is an AdbcError named `error` in scope.
#define CHECK_ADBC(EXPR)                                          \
  if (AdbcStatusCode status = (EXPR); status != ADBC_STATUS_OK) { \
    if (error.message != nullptr) {                               \
      std::cerr << error.message << std::endl;                    \
    }                                                             \
    return EXIT_FAILURE;                                          \
  }

// Error-checking helper for ArrowArrayStream.
#define CHECK_STREAM(STREAM, EXPR)                            \
  if (int status = (EXPR); status != 0) {                     \
    std::cerr << "(" << std::strerror(status) << "): ";       \
    const char* message = (STREAM).get_last_error(&(STREAM)); \
    if (message != nullptr) {                                 \
      std::cerr << message << std::endl;                      \
    } else {                                                  \
      std::cerr << "(no error message)" << std::endl;         \
    }                                                         \
    return EXIT_FAILURE;                                      \
  }

// Error-checking helper for Nanoarrow.
#define CHECK_NANOARROW(EXPR)                                              \
  if (int status = (EXPR); status != 0) {                                  \
    std::cerr << "(" << std::strerror(status) << "): failed" << std::endl; \
    return EXIT_FAILURE;                                                   \
  }

int main() {

加载驱动程序¶

我们将使用驱动程序管理器加载 SQLite 驱动程序。这样我们就不必显式链接到驱动程序。

  AdbcError error = {};

  AdbcDatabase database = {};
  CHECK_ADBC(AdbcDatabaseNew(&database, &error));

驱动程序管理器知道我们想要哪个驱动程序的方式是通过 driver 选项。

  CHECK_ADBC(AdbcDatabaseSetOption(&database, "driver", "adbc_driver_sqlite", &error));
  CHECK_ADBC(AdbcDatabaseInit(&database, &error));

创建连接¶

ADBC 区分“数据库”、“连接”和“语句”。“数据库”在多个连接之间持有共享状态。例如，在 SQLite 驱动程序中，它持有 SQLite 的实际实例。“连接”是对数据库的一个连接。

  AdbcConnection connection = {};
  CHECK_ADBC(AdbcConnectionNew(&connection, &error));
  CHECK_ADBC(AdbcConnectionInit(&connection, &database, &error));

创建语句¶

语句允许我们执行查询。它们用于预准备查询和非预准备查询（“即席”查询）。

  AdbcStatement statement = {};
  CHECK_ADBC(AdbcStatementNew(&connection, &statement, &error));

执行查询¶

我们通过在语句上设置查询，然后调用 AdbcStatementExecuteQuery() 来执行查询。结果通过 Arrow C 数据接口返回。

  struct ArrowArrayStream stream = {};
  int64_t rows_affected = -1;

  CHECK_ADBC(AdbcStatementSetSqlQuery(&statement, "SELECT 42 AS THEANSWER", &error));
  CHECK_ADBC(AdbcStatementExecuteQuery(&statement, &stream, &rows_affected, &error));

虽然 API 提供了行数，但 SQLite 驱动程序实际上无法提前知道结果集中有多少行，因此此值实际上将只是 -1，表示该值未知。

  std::cout << "Got " << rows_affected << " rows" << std::endl;

我们需要一个 Arrow 实现来读取实际结果。我们可以为此使用 Arrow C++ 或 Nanoarrow。为简单起见，我们这里将使用 Nanoarrow。（此示例的 CMake 配置会在构建过程中从源代码下载并构建 Nanoarrow。）

首先我们将获取数据的 schema

  ArrowSchema schema = {};
  CHECK_STREAM(stream, stream.get_schema(&stream, &schema));

然后我们可以使用 Nanoarrow 打印它

  char buf[1024] = {};
  ArrowSchemaToString(&schema, buf, sizeof(buf), /*recursive=*/1);
  std::cout << "Result schema: " << buf << std::endl;

现在我们可以读取数据了。数据以 Arrow 记录批次流的形式出现。

  while (true) {
    ArrowArray batch = {};
    CHECK_STREAM(stream, stream.get_next(&stream, &batch));

    if (batch.release == nullptr) {
      // Stream has ended
      break;
    }

我们也可以使用 Nanoarrow 打印数据。

    ArrowArrayView view = {};
    CHECK_NANOARROW(ArrowArrayViewInitFromSchema(&view, &schema, nullptr));
    CHECK_NANOARROW(ArrowArrayViewSetArray(&view, &batch, nullptr));
    std::cout << "Got a batch with " << batch.length << " rows" << std::endl;
    for (int64_t i = 0; i < batch.length; i++) {
      std::cout << "THEANSWER[" << i
                << "] = " << view.children[0]->buffer_views[1].data.as_int64[i]
                << std::endl;
    }
    ArrowArrayViewReset(&view);
  }
  // Output:
  // Got a batch with 1 rows
  // THEANSWER[0] = 42

  stream.release(&stream);

清理¶

最后，我们必须释放所有资源。

  CHECK_ADBC(AdbcStatementRelease(&statement, &error));
  CHECK_ADBC(AdbcConnectionRelease(&connection, &error));
  CHECK_ADBC(AdbcDatabaseRelease(&database, &error));
  return EXIT_SUCCESS;
}

标准输出¶

Got -1 rows
Result schema: struct<THEANSWER: int64>
Got a batch with 1 rows
THEANSWER[0] = 42