跳转至内容

Hive 分区将字段名称和值嵌入到路径段中,例如“/year=2019/month=2/data.parquet”。

用法

hive_partition(..., null_fallback = NULL, segment_encoding = "uri")

参数

...

传递给 schema() 的命名 数据类型 列表

null_fallback

用于代替分区列中缺失值(NANULL)的字符。默认为 "__HIVE_DEFAULT_PARTITION__",这是 Hive 使用的值。

segment_encoding

在拆分路径后解码分区段。默认为 "uri"(URI 解码段)。也可以是 "none"(保持原样)。

返回值

一个 HivePartitioning,或者如果调用不带参数的 hive_partition(),则返回一个 HivePartitioningFactory

详情

由于字段在路径段中已命名,因此传递给 hive_partition() 的字段顺序无关紧要。

示例

hive_partition(year = int16(), month = int8())
#> HivePartitioning