pyarrow.acero.HashJoinNodeOptions#

class pyarrow.acero.HashJoinNodeOptions(join_type, left_keys, right_keys, left_output=None, right_output=None, output_suffix_for_left='', output_suffix_for_right='', filter_expression=None)#

基类: _HashJoinNodeOptions

创建一个使用哈希连接策略实现连接操作的节点。

这是“hashjoin”节点工厂的选项类。

参数:
join_typestr

连接类型。可选值包括:“左半连接(left semi)”、“右半连接(right semi)”、“左反连接(left anti)”、“右反连接(right anti)”、“内连接(inner)”、“左外连接(left outer)”、“右外连接(right outer)”、“全外连接(full outer)”。

left_keysstr, Expressionlist

左输入的关键字段。每个键可以是字符串列名、字段表达式,或此类字段引用的列表。

right_keysstr, Expressionlist

右输入的关键字段。详见 left_keys

left_outputlist, 可选

从左输入传递的输出字段列表。如果未指定左右输出字段,则左右输入中的所有有效字段都将输出。每个字段可以是字符串列名或字段表达式。

right_outputlist, 可选

从右输入传递的输出字段列表。如果未指定左右输出字段,则左右输入中的所有有效字段都将输出。每个字段可以是字符串列名或字段表达式。

output_suffix_for_leftstr

添加到左输入输出字段名称的后缀(如果需要,用于区分左右输入中同名字段,如果没有命名冲突,可以留空)。

output_suffix_for_rightstr

添加到右输入输出字段名称的后缀,详见 output_suffix_for_left

filter_expressionpyarrow.compute.Expression

应用于匹配行的残余过滤器。

__init__(self, join_type, left_keys, right_keys, left_output=None, right_output=None, output_suffix_for_left='', output_suffix_for_right='', filter_expression=None)#

方法

__init__(self, join_type, left_keys, right_keys)