跳到内容

Hive 分区将字段名和值嵌入到路径段中,例如 "/year=2019/month=2/data.parquet"。

用法

hive_partition(..., null_fallback = NULL, segment_encoding = "uri")

参数

...

数据类型的命名列表,传递给 schema()

null_fallback

用于代替分区列中缺失值(NANULL)的字符。 默认为 "__HIVE_DEFAULT_PARTITION__",这是 Hive 使用的。

segment_encoding

分割路径后解码分区段。 默认为 "uri"(URI 解码段)。 也可以是 "none"(保持原样)。

一个 HivePartitioning,或者如果在没有参数的情况下调用 hive_partition(),则为 HivePartitioningFactory

详细信息

因为字段在路径段中被命名,所以传递给 hive_partition() 的字段顺序无关紧要。

示例

hive_partition(year = int16(), month = int8())
#> HivePartitioning