跳至内容

Hive 分区将字段名称和值嵌入路径段中,例如 "/year=2019/month=2/data.parquet"。

用法

hive_partition(..., null_fallback = NULL, segment_encoding = "uri")

参数

...

传递给 schema()数据类型 的命名列表

null_fallback

用于替换分区列中缺失值 (NANULL) 的字符。默认值为 "__HIVE_DEFAULT_PARTITION__",这是 Hive 使用的值。

segment_encoding

在拆分路径后对分区段进行解码。默认值为 "uri" (URI 解码段)。也可以是 "none" (保持原样)。

一个 HivePartitioning,或者如果在没有参数的情况下调用 hive_partition(),则为 HivePartitioningFactory

细节

由于字段在路径段中命名,因此传递给 hive_partition() 的字段顺序无关紧要。

示例

hive_partition(year = int16(), month = int8())
#> HivePartitioning