pyarrow.compute.utf8_normalize#

pyarrow.compute.utf8_normalize(strings, /, form, *, options=None, memory_pool=None)#

对输入执行 UTF-8 规范化。

对于 strings 中的每个字符串,返回其规范形式。

必须在选项中指定规范化形式。空输入返回空值。

参数:
strings类数组或类标量

计算函数的参数。

formstr

Unicode 规范化形式。接受的值为 “NFC”、“NFKC”、“NFD”、“NFKD”。

optionspyarrow.compute.Utf8NormalizeOptions,可选

传递选项的替代方式。

memory_poolpyarrow.MemoryPool, 可选

如果不传递,将从默认内存池分配内存。