Module encoder

模块 encoder 

源代码
展开描述

RecordBatch 编码为 Avro 二进制格式。用于 Arrow 类型的 Avro 编码器。

结构体§

BinaryEncoder 🔒
统一的二进制编码器,可处理不同偏移量大小 (i32/i64) 的泛型。
BinaryViewEncoder 🔒
BinaryView (字节视图) 编码器。
BooleanEncoder 🔒
DecimalEncoder 🔒
用于 Arrow 十进制数组的通用 Avro 十进制编码器。
DurationEncoder 🔒
用于所有三种间隔单位的单一通用编码器。一次调用将 Avro fixed(12) 写入为三个小端 u32 值。
DurationParts 🔒
EnumEncoder 🔒
用于 Arrow DictionaryArray<Int32, Utf8> 的 Avro enum 编码器。
F32Encoder 🔒
F64Encoder 🔒
FieldBinding 🔒
FieldEncoder 🔒
Arrow 到 Avro 的 FieldEncoder
FixedEncoder 🔒
用于 Arrow FixedSizeBinaryArray 的 Avro fixed 编码器。规范:一个 fixed 编码为精确的 size 字节,没有长度前缀。
FixedSizeListEncoder 🔒
FixedSizeList 编码器。
IntEncoder 🔒
用于原始数组的通用 Avro int 编码器,具有 i32 本机值。
ListEncoder 🔒
ListViewEncoder 🔒
使用 (offset, size) 缓冲区的 ListView 编码器。
LongEncoder 🔒
用于原始数组的通用 Avro long 编码器,具有 i64 本机值。
MapEncoder 🔒
RecordEncoder 🔒
用于将 RecordBatch 编码为 Avro 的预计算计划。
RecordEncoderBuilder 🔒
RecordEncoder 写入计划的构建器
RunEncodedEncoder 🔒
用于基于 Arrow RunArray<R> 站点的通用编码器(游程编码)。遵循其他通用编码器(即 ListEncoder<O>)使用的模式,避免在游程结束宽度上进行运行时分支。
StructEncoder 🔒
Time32SecondsToMillisEncoder 🔒
Time32(Second) 到 Avro time-millis (int),通过安全地乘以 1000 进行缩放
TimestampSecondsToMillisEncoder 🔒
Timestamp(Second) 到 Avro timestamp-millis (long),通过安全地乘以 1000 进行缩放
UnionEncoder 🔒
Utf8GenericEncoder 🔒
Utf8ViewEncoder 🔒
StringView 编码器。
UuidEncoder 🔒
Avro UUID 逻辑类型编码器:Arrow FixedSizeBinary(16) 到 Avro string (UUID)。规范:uuid 是 string 上的逻辑类型 (RFC‑4122)。我们输出带连字符的形式。

枚举§

Encoder 🔒
FieldPlan 🔒
字段的每个站点的编码器计划。这反映了 Avro 结构,因此嵌套的可选分支顺序可以完全按照模式声明的方式进行。
KeyKind 🔒
Map 编码器使用的内部键数组类型。
NullState 🔒

Trait§

DecimalBeBytes 🔒
最小的 trait,用于获取十进制未缩放整数值在 idx 处的 big-endian 固定大小字节数组。
IntervalToDurationParts 🔒
将 Arrow 间隔本机值映射到 Avro 持续时间 (months, days, millis) 的 trait。

函数§

encode_blocked_range 🔒
使用 Avro 数组块帧编码项目的阻塞范围。
find_map_value_field_index 🔒
find_struct_child_index 🔒
minimal_twos_complement 🔒
Avro 十进制 (bytes) 的最小补码大端表示辅助函数。
prepare_value_site_encoder 🔒
union_value_branch_byte 🔒
write_bool 🔒
write_int 🔒
write_len_prefixed 🔒
write_long 🔒
使用 ZigZag + 可变长度,缓冲编码单个 Avro-long
write_optional_index 🔒
写入可选字段的联合分支索引。
write_sign_extended 🔒
将 big-endian 整数字节进行符号扩展(或验证/截断)以精确到 n 字节。

类型别名§

Decimal32Encoder 🔒
Decimal64Encoder 🔒
Decimal128Encoder 🔒
Decimal256Encoder 🔒
ListEncoder32 🔒
ListEncoder64 🔒
ListViewEncoder32 🔒
ListViewEncoder64 🔒
RunEncodedEncoder16 🔒
RunEncodedEncoder32 🔒
RunEncodedEncoder64 🔒
Utf8Encoder 🔒
Utf8LargeEncoder 🔒