pyarrow.compute.split_pattern_regex#

pyarrow.compute.split_pattern_regex(strings, /, pattern, *, max_splits=None, reverse=False, options=None, memory_pool=None)#

根据正则表达式模式拆分字符串。

根据 SplitPatternOptions 中定义的正则表达式 pattern 拆分每个字符串。每个字符串输入的输出均为一个字符串列表。

拆分的最大次数和拆分方向(正向、反向)可通过 SplitPatternOptions 进行选择性定义。

参数:
strings类数组或类标量

计算函数的参数。

patternstr

用于分割的字符串模式。

max_splitsintNone,默认为 None

每个输入值的最大分割次数(若为 None 则不限制)。

reversebool,默认为 False

是否从每个输入值的末尾开始分割。仅在 max_splits 不为 None 时生效。

optionspyarrow.compute.SplitPatternOptions, 可选

传递选项的替代方式。

memory_poolpyarrow.MemoryPool, 可选

如果不传递,将从默认内存池分配内存。