pyarrow.compute.winsorize#

pyarrow.compute.winsorize(array, /, lower_limit, upper_limit, *, options=None, memory_pool=None)#

对数组进行缩尾处理(Winsorize)。

此函数对输入数组应用缩尾变换,以减少潜在异常值的影响。在计算下分位数和上分位数时,输入中的 NaN 和空值会被忽略。分位数限制可以在 WinsorizeOptions 中进行更改。

参数:
array类数组对象 (Array-like)

计算函数的参数。

lower_limitfloat, 介于 0 和 1 之间

所有低于该分位数的数值都将被替换为该分位数的值。

upper_limitfloat, 介于 0 和 1 之间

所有高于该分位数的数值都将被替换为该分位数的值。

optionspyarrow.compute.WinsorizeOptions, 可选

传递选项的替代方式。

memory_poolpyarrow.MemoryPool, 可选

如果不传递,将从默认内存池分配内存。