pyarrow.schema#

pyarrow.schema(fields, metadata=None)#

根据字段集合构建 pyarrow.Schema。

参数:
fields可迭代对象,包含 Fields元组,或是由 字符串DataTypes 的映射

也可以传入实现 Arrow PyCapsule 协议以用于 Schema 的对象(即具有 __arrow_c_schema__ 方法的对象)。

metadatadict, 默认值 None

键和值必须能够转换为字节(bytes)。

返回:
schemapyarrow.Schema

示例

从元组的可迭代对象创建 Schema

>>> import pyarrow as pa
>>> pa.schema([
...     ('some_int', pa.int32()),
...     ('some_string', pa.string()),
...     pa.field('some_required_string', pa.string(), nullable=False)
... ])
some_int: int32
some_string: string
some_required_string: string not null

从 Fields 的可迭代对象创建 Schema

>>> pa.schema([
...     pa.field('some_int', pa.int32()),
...     pa.field('some_string', pa.string())
... ])
some_int: int32
some_string: string

DataTypes 也可以以字符串形式传入。以下内容与上述示例等价

>>> pa.schema([
...     pa.field('some_int', "int32"),
...     pa.field('some_string', "string")
... ])
some_int: int32
some_string: string

或者更简洁地

>>> pa.schema([
...     ('some_int', "int32"),
...     ('some_string', "string")
... ])
some_int: int32
some_string: string