pyarrow.acero.AggregateNodeOptions#

class pyarrow.acero.AggregateNodeOptions(aggregates, keys=None)#

基类: _AggregateNodeOptions

创建一个节点,该节点聚合输入批次,可选择按键进行分组。

这是“聚合”节点工厂的选项类。

Acero 支持两种类型的聚合:“标量”聚合和“哈希”聚合。标量聚合将数组或标量输入简化为单个标量输出(例如,计算列的平均值)。哈希聚合作用类似于 SQL 中的 GROUP BY,首先根据一个或多个键列分区数据,然后减少每个分区中的数据。聚合节点支持这两种类型的计算,并且可以一次计算任意数量的聚合。

参数:
aggregateslist of tuples

将应用于目标字段的聚合。指定为元组列表,其中每个元组是一个聚合规范,包含:聚合目标列、函数名称、聚合函数选项对象和输出字段名称。目标列规范可以是单个字段引用、空列表或分别用于一元、零元和 n 元聚合函数的字段列表。每个字段引用可以是字符串列名或表达式。

keyslist of field references, 可选

聚合将据此分组的键。每个键都可以使用字符串名称或表达式引用字段。

__init__(self, aggregates, keys=None)#

方法

__init__(self, aggregates[, keys])