pyarrow.compute.utf8_split_whitespace#
- pyarrow.compute.utf8_split_whitespace(strings, /, *, max_splits=None, reverse=False, options=None, memory_pool=None)#
根据任何 Unicode 空白字符分割字符串。
根据任何非零长度的 Unicode 空白字符序列分割每个字符串。每个输入字符串的输出均为字符串列表。
可通过 SplitOptions 可选地定义最大分割次数和分割方向(正向、反向)。
- 参数:
- strings类数组或类标量
计算函数的参数。
- max_splits
int或None,默认为None 每个输入值的最大分割次数(若为 None 则不限制)。
- reversebool,默认为
False 是否从每个输入值的末尾开始分割。仅在 max_splits 不为 None 时生效。
- options
pyarrow.compute.SplitOptions, 可选 传递选项的替代方式。
- memory_pool
pyarrow.MemoryPool, 可选 如果不传递,将从默认内存池分配内存。