pyarrow.compute.split_pattern_regex#
- pyarrow.compute.split_pattern_regex(strings, /, pattern, *, max_splits=None, reverse=False, options=None, memory_pool=None)#
根据正则表达式模式拆分字符串。
根据 SplitPatternOptions 中定义的正则表达式 pattern 拆分每个字符串。每个字符串输入的输出均为一个字符串列表。
拆分的最大次数和拆分方向(正向、反向)可通过 SplitPatternOptions 进行选择性定义。
- 参数:
- strings类数组或类标量
计算函数的参数。
- pattern
str 用于分割的字符串模式。
- max_splits
int或None,默认为None 每个输入值的最大分割次数(若为 None 则不限制)。
- reversebool,默认为
False 是否从每个输入值的末尾开始分割。仅在 max_splits 不为 None 时生效。
- options
pyarrow.compute.SplitPatternOptions, 可选 传递选项的替代方式。
- memory_pool
pyarrow.MemoryPool, 可选 如果不传递,将从默认内存池分配内存。