Arrow Flight RPC#

Arrow Flight 是一个用于在网络上高效传输 Flight 数据的 RPC 框架。

另请参阅

Flight 协议文档

Flight 协议的文档,包括如何从概念上使用 Flight。

Flight API 文档

列出所有客户端和服务器类的 Python API 文档。

Python 食谱

在 Python 中使用 Arrow Flight 的食谱。

编写 Flight 服务#

服务器是 FlightServerBase 的子类。要实现各个 RPC,请覆盖此类上的 RPC 方法。

import pyarrow.flight as flight

class MyFlightServer(flight.FlightServerBase):
    def list_flights(self, context, criteria):
        info = flight.FlightInfo(...)
        yield info

每个 RPC 方法始终接收一个 ServerCallContext 用于通用参数。若要指示失败,请引发异常;可以通过引发 FlightError 的子类之一来指示特定于 Flight 的错误。

要启动服务器,请创建一个 Location 来指定侦听位置,并创建服务器实例。(字符串将转换为位置。)这将启动服务器,但不会阻塞程序的其余部分。调用 FlightServerBase.serve() 以阻塞,直到服务器停止。

# Listen to all interfaces on a free port
server = MyFlightServer("grpc://0.0.0.0:0")

print("Server listening on port", server.port)
server.serve()

使用 Flight 客户端#

要连接到 Flight 服务,请使用位置调用 pyarrow.flight.connect()

取消和超时#

进行调用时,客户端可以选择提供 FlightCallOptions。这允许客户端在调用上设置超时或提供自定义 HTTP 标头,以及其他功能。此外,客户端 RPC 调用返回的一些对象公开了一个 cancel 方法,该方法允许提前终止调用。

在服务器端,超时是透明的。对于取消,服务器需要手动轮询 ServerCallContext.is_cancelled() 以检查客户端是否已取消调用,如果是,则中断服务器当前正在执行的任何处理。

启用 TLS#

在设置服务器时,可以通过向 FlightServerBase 提供证书和密钥对来启用 TLS。

在客户端,使用 Location.for_grpc_tls() 来构造要侦听的 Location

启用身份验证#

警告

在不启用 TLS 的情况下,身份验证是不安全的。

可以通过实现 ServerAuthHandler 来启用基于握手身份验证。身份验证包括两个部分:在初始客户端连接时,服务器和客户端身份验证实现可以执行任何必要的协商;然后,在随后的每个 RPC 上,客户端提供一个令牌。服务器身份验证处理程序验证令牌并提供客户端的身份。此身份可以从 ServerCallContext 中获取。

自定义中间件#

服务器和客户端支持自定义中间件(或拦截器),这些中间件在每个请求上都被调用,并且可以以有限的方式修改请求。这些可以通过子类化 ServerMiddlewareClientMiddleware 来实现,然后在创建客户端或服务器时提供它们。

中间件相当有限,但它们可以向请求/响应添加标头。在服务器上,它们可以检查传入的标头并使请求失败;因此,它们可以用于实现自定义身份验证方法。

Flight 最佳实践#