Flight SQL 食谱

其中一些食谱针对由 SQLite 支持的 Flight SQL 演示服务编写。您可以按照以下步骤自行运行它

$ go install github.com/apache/arrow/go/v${ARROW_MAJOR_VERSION}/arrow/flight/flightsql/example/cmd/sqlite_flightsql_server@latest
$ sqlite_flightsql_server -host 0.0.0.0 -port 8080

其他食谱使用 Dremio 的 OSS 版本。

$ docker run -p 9047:9047 -p 31010:31010 -p 45678:45678 dremio/dremio-oss

如果您已检出 ADBC 存储库并安装了 Docker Compose,则可以使用我们的配置来运行这两个服务。

$ docker compose up --detach --wait dremio dremio-init flightsql-sqlite-test

连接到未安全化的 Flight SQL 服务

食谱来源: flightsql_sqlite_connect.py

要连接到未安全化的 Flight SQL 服务,只需提供 URI。

22import os
23
24import adbc_driver_flightsql.dbapi
25
26uri = os.environ["ADBC_SQLITE_FLIGHTSQL_URI"]
27conn = adbc_driver_flightsql.dbapi.connect(uri)

然后我们可以执行一个简单的查询。

31with conn.cursor() as cur:
32    cur.execute("SELECT 1")
33
34    assert cur.fetchone() == (1,)
35
36conn.close()

使用用户名和密码连接到 Flight SQL 服务

食谱来源: flightsql_dremio_connect.py

Dremio 需要用户名和密码。要连接到具有身份验证的 Flight SQL 服务,请在连接时提供选项。

23import os
24
25import adbc_driver_flightsql.dbapi
26import adbc_driver_manager
27
28uri = os.environ["ADBC_DREMIO_FLIGHTSQL_URI"]
29username = os.environ["ADBC_DREMIO_FLIGHTSQL_USER"]
30password = os.environ["ADBC_DREMIO_FLIGHTSQL_PASS"]
31conn = adbc_driver_flightsql.dbapi.connect(
32    uri,
33    db_kwargs={
34        adbc_driver_manager.DatabaseOptions.USERNAME.value: username,
35        adbc_driver_manager.DatabaseOptions.PASSWORD.value: password,
36    },
37)

然后我们可以执行一个简单的查询。

41with conn.cursor() as cur:
42    cur.execute("SELECT 1")
43
44    assert cur.fetchone() == (1,)
45
46conn.close()

设置超时和其他选项

食谱来源: flightsql_sqlite_options.py

Flight SQL 驱动程序支持各种选项。

22import os
23
24import adbc_driver_flightsql.dbapi
25from adbc_driver_flightsql import ConnectionOptions, DatabaseOptions
26
27uri = os.environ["ADBC_SQLITE_FLIGHTSQL_URI"]

我们可以启用 Cookie 支持,某些服务器实现需要此支持。

29conn = adbc_driver_flightsql.dbapi.connect(
30    uri,
31    db_kwargs={DatabaseOptions.WITH_COOKIE_MIDDLEWARE.value: "true"},
32)

其他选项在连接或语句上设置。

例如,我们可以向所有传出请求添加自定义标头。

37custom_header = f"{ConnectionOptions.RPC_CALL_HEADER_PREFIX.value}x-custom-header"
38conn.adbc_connection.set_options(**{custom_header: "value"})

我们还可以设置超时。这些以浮点秒为单位。

41conn.adbc_connection.set_options(
42    **{
43        ConnectionOptions.TIMEOUT_FETCH.value: 30.0,
44        ConnectionOptions.TIMEOUT_QUERY.value: 30.0,
45        ConnectionOptions.TIMEOUT_UPDATE.value: 30.0,
46    }
47)

这些选项将应用于我们创建的所有游标。

51with conn.cursor() as cur:
52    cur.execute("SELECT 1")
53
54    assert cur.fetchone() == (1,)
55
56conn.close()

设置最大 gRPC 消息大小

食谱来源: flightsql_sqlite_max_msg_size.py

默认情况下,Flight SQL 驱动程序限制传入/传出消息的大小。如果超过这些限制,您可能会看到类似这样的错误

INTERNAL: [FlightSQL] grpc: received message larger than max

可以调整这些限制以避免这种情况。

27import os
28
29import adbc_driver_flightsql.dbapi
30from adbc_driver_flightsql import DatabaseOptions
31
32uri = os.environ["ADBC_SQLITE_FLIGHTSQL_URI"]

此查询每个批次生成大约 16 MiB 的数据,这将触发默认限制。

37query = """
38WITH RECURSIVE generate_series(value) AS (
39  SELECT 1
40  UNION ALL
41  SELECT value + 1 FROM generate_series
42   WHERE value + 1 <= 2048
43)
44SELECT printf('%.*c', 16384, 'x') FROM generate_series
45"""

当我们执行查询时,我们会收到错误。

49conn = adbc_driver_flightsql.dbapi.connect(uri)
50with conn.cursor() as cur:
51    cur.execute(query)
52
53    try:
54        cur.fetchallarrow()
55    except adbc_driver_flightsql.dbapi.InternalError:
56        # This exception is expected.
57        pass
58    else:
59        assert False, "Did not raise expected exception"
60
61conn.close()

我们可以改为在连接时更改限制。

65conn = adbc_driver_flightsql.dbapi.connect(
66    uri,
67    db_kwargs={DatabaseOptions.WITH_MAX_MSG_SIZE.value: "2147483647"},
68)
69with conn.cursor() as cur:
70    cur.execute(query)
71
72    assert len(cur.fetchallarrow()) == 2048
73
74conn.close()