pyarrow.acero.HashJoinNodeOptions#
- class pyarrow.acero.HashJoinNodeOptions(join_type, left_keys, right_keys, left_output=None, right_output=None, output_suffix_for_left='', output_suffix_for_right='', filter_expression=None)#
基类:
_HashJoinNodeOptions创建一个使用哈希连接策略实现连接操作的节点。
这是“hashjoin”节点工厂的选项类。
- 参数:
- join_type
str 连接类型。可选值包括:“左半连接(left semi)”、“右半连接(right semi)”、“左反连接(left anti)”、“右反连接(right anti)”、“内连接(inner)”、“左外连接(left outer)”、“右外连接(right outer)”、“全外连接(full outer)”。
- left_keys
str,Expression或list 左输入的关键字段。每个键可以是字符串列名、字段表达式,或此类字段引用的列表。
- right_keys
str,Expression或list 右输入的关键字段。详见 left_keys。
- left_output
list, 可选 从左输入传递的输出字段列表。如果未指定左右输出字段,则左右输入中的所有有效字段都将输出。每个字段可以是字符串列名或字段表达式。
- right_output
list, 可选 从右输入传递的输出字段列表。如果未指定左右输出字段,则左右输入中的所有有效字段都将输出。每个字段可以是字符串列名或字段表达式。
- output_suffix_for_left
str 添加到左输入输出字段名称的后缀(如果需要,用于区分左右输入中同名字段,如果没有命名冲突,可以留空)。
- output_suffix_for_right
str 添加到右输入输出字段名称的后缀,详见 output_suffix_for_left。
- filter_expression
pyarrow.compute.Expression 应用于匹配行的残余过滤器。
- join_type
- __init__(self, join_type, left_keys, right_keys, left_output=None, right_output=None, output_suffix_for_left='', output_suffix_for_right='', filter_expression=None)#
方法
__init__(self, join_type, left_keys, right_keys)