pyarrow.compute.utf8_normalize#
- pyarrow.compute.utf8_normalize(strings, /, form, *, options=None, memory_pool=None)#
对输入执行 UTF-8 规范化。
对于 strings 中的每个字符串,返回其规范形式。
必须在选项中指定规范化形式。空输入返回空值。
- 参数:
- strings类数组或类标量
计算函数的参数。
- form
str Unicode 规范化形式。接受的值为 “NFC”、“NFKC”、“NFD”、“NFKD”。
- options
pyarrow.compute.Utf8NormalizeOptions,可选 传递选项的替代方式。
- memory_pool
pyarrow.MemoryPool, 可选 如果不传递,将从默认内存池分配内存。