pyarrow.compute.utf8_split_whitespace#

pyarrow.compute.utf8_split_whitespace(strings, /, *, max_splits=None, reverse=False, options=None, memory_pool=None)#

根据任何 Unicode 空白字符分割字符串。

根据任何非零长度的 Unicode 空白字符序列分割每个字符串。每个输入字符串的输出均为字符串列表。

可通过 SplitOptions 可选地定义最大分割次数和分割方向(正向、反向)。

参数:
strings类数组或类标量

计算函数的参数。

max_splitsintNone,默认为 None

每个输入值的最大分割次数(若为 None 则不限制)。

reversebool,默认为 False

是否从每个输入值的末尾开始分割。仅在 max_splits 不为 None 时生效。

optionspyarrow.compute.SplitOptions, 可选

传递选项的替代方式。

memory_poolpyarrow.MemoryPool, 可选

如果不传递,将从默认内存池分配内存。