包索引
-
open_dataset() - 打开多文件数据集
-
open_delim_dataset()open_csv_dataset()open_tsv_dataset() - 打开 CSV 或其他分隔符分隔格式的多文件数据集
-
csv_read_options() - CSV 读取选项
-
csv_parse_options() - CSV 解析选项
-
csv_convert_options() - CSV 转换选项
-
write_dataset() - 写入数据集
-
write_delim_dataset()write_csv_dataset()write_tsv_dataset() - 将数据集写入分区平面文件。
-
csv_write_options() - CSV 写入选项
-
read_delim_arrow()read_csv_arrow()read_csv2_arrow()read_tsv_arrow() - 使用 Arrow 读取 CSV 或其他带分隔符的文件
-
read_parquet() - 读取 Parquet 文件
-
read_feather()read_ipc_file() - 读取 Feather 文件(Arrow IPC 文件)
-
read_ipc_stream() - 读取 Arrow IPC 流格式
-
read_json_arrow() - 读取 JSON 文件
-
write_csv_arrow() - 将 CSV 文件写入磁盘
-
write_parquet() - 将 Parquet 文件写入磁盘
-
write_feather()write_ipc_file() - 写入 Feather 文件(Arrow IPC 文件)
-
write_ipc_stream() - 写入 Arrow IPC 流格式
-
write_to_raw() - 将 Arrow 数据写入原始向量
-
scalar() - 创建 Arrow Scalar
-
arrow_array() - 创建 Arrow 数组
-
chunked_array() - 创建分块数组
-
record_batch() - 创建 RecordBatch
-
arrow_table() - 创建 Arrow 表
-
buffer() - 创建缓冲区
-
vctrs_extension_array()vctrs_extension_type() - 通用类型向量的扩展类型
-
as_arrow_array() - 将对象转换为 Arrow 数组
-
as_chunked_array() - 将对象转换为 Arrow ChunkedArray
-
as_record_batch() - 将对象转换为 Arrow RecordBatch
-
as_arrow_table() - 将对象转换为 Arrow 表
-
concat_arrays()c(<Array>) - 连接零个或多个数组
-
concat_tables() - 连接一个或多个表
-
int8()int16()int32()int64()uint8()uint16()uint32()uint64()float16()halffloat()float32()float()float64()boolean()bool()utf8()large_utf8()binary()large_binary()fixed_size_binary()string()date32()date64()time32()time64()duration()null()timestamp()decimal()decimal32()decimal64()decimal128()decimal256()struct()list_of()large_list_of()fixed_size_list_of()map_of() - 创建 Arrow 数据类型
-
dictionary() - 创建字典类型
-
new_extension_type()new_extension_array()register_extension_type()reregister_extension_type()unregister_extension_type() - 扩展类型
-
vctrs_extension_array()vctrs_extension_type() - 通用类型向量的扩展类型
-
as_data_type() - 将对象转换为 Arrow DataType
-
infer_type()type() - 从 R 对象推断 Arrow 数组类型
-
field() - 创建 Field
-
schema() - 创建模式或从对象中提取模式。
-
unify_schemas() - 组合和协调模式
-
as_schema() - 将对象转换为 Arrow Schema
-
infer_schema() - 从对象中提取模式
-
read_schema() - 从流中读取 Schema
-
aceroarrow-functionsarrow-verbsarrow-dplyr - Arrow dplyr 查询中可用的函数
-
call_function() - 调用 Arrow 计算函数
-
match_arrow()is_in() - Arrow 对象的值匹配
-
value_counts() - Arrow 对象的
table
-
list_compute_functions() - 列出可用的 Arrow C++ 计算函数
-
register_scalar_function() - 注册用户定义函数
-
show_exec_plan() - 显示 Arrow 执行计划的详细信息
-
to_arrow() - 从 DuckDB 连接创建 Arrow 对象
-
to_duckdb() - 从 Arrow 对象创建(虚拟)DuckDB 表
-
load_flight_server() - 加载 Python Flight 服务器
-
flight_connect() - 连接到 Flight 服务器
-
flight_disconnect() - 显式关闭 Flight 客户端
-
flight_get() - 从 Flight 服务器获取数据
-
flight_put() - 将数据发送到 Flight 服务器
-
list_flights()flight_path_exists() - 查看 Flight 服务器上的可用资源
-
arrow_info()arrow_available()arrow_with_acero()arrow_with_dataset()arrow_with_substrait()arrow_with_parquet()arrow_with_s3()arrow_with_gcs()arrow_with_json() - 报告有关包功能的信息
-
cpu_count()set_cpu_count() - 管理 libarrow 中的全局 CPU 线程池
-
io_thread_count()set_io_thread_count() - 管理 libarrow 中的全局 I/O 线程池
-
install_arrow() - 安装或升级 Arrow 库
-
install_pyarrow() - 安装 pyarrow 以与 reticulate 一起使用
-
create_package_with_all_dependencies() - 创建包含所有第三方依赖项的源包
-
InputStreamRandomAccessFileMemoryMappedFileReadableFileBufferReader - InputStream 类
-
read_message() - 从流中读取消息
-
mmap_open() - 打开内存映射文件
-
mmap_create() - 创建指定大小的新读/写内存映射文件
-
OutputStreamFileOutputStreamBufferOutputStream - OutputStream 类
-
Message - Message 类
-
MessageReader - MessageReader 类
-
编解码器 - Compression Codec 类
-
codec_is_available() - 检查压缩编解码器是否可用
-
ParquetFileReader - ParquetFileReader 类
-
ParquetReaderProperties - ParquetReaderProperties 类
-
ParquetArrowReaderProperties - ParquetArrowReaderProperties 类
-
ParquetFileWriter - ParquetFileWriter 类
-
ParquetWriterProperties - ParquetWriterProperties 类
-
FeatherReader - FeatherReader 类
-
CsvTableReaderJsonTableReader - Arrow CSV 和 JSON 表读取器类
-
CsvReadOptionsCsvWriteOptionsCsvParseOptionsTimestampParserCsvConvertOptionsJsonReadOptionsJsonParseOptions - 文件读取器选项
-
RecordBatchReaderRecordBatchStreamReaderRecordBatchFileReader - RecordBatchReader 类
-
RecordBatchWriterRecordBatchStreamWriterRecordBatchFileWriter - RecordBatchWriter 类
-
as_record_batch_reader() - 将对象转换为 Arrow RecordBatchReader
-
Buffer - Buffer 类
-
Scalar - Arrow scalars
-
ChunkedArray - ChunkedArray 类
-
RecordBatch - RecordBatch 类
-
Schema - Schema 类
-
Field - Field 类
-
表 - Table 类
-
DataType - DataType 类
-
ArrayData - ArrayData 类
-
DictionaryType - DictionaryType 类
-
FixedWidthType - FixedWidthType 类
-
ExtensionType - ExtensionType 类
-
ExtensionArray - ExtensionArray 类
-
DatasetFileSystemDatasetUnionDatasetInMemoryDatasetDatasetFactoryFileSystemDatasetFactory - 多文件数据集
-
dataset_factory() - 创建 DatasetFactory
-
PartitioningDirectoryPartitioningHivePartitioningDirectoryPartitioningFactoryHivePartitioningFactory - 为数据集定义分区
-
Expression - Arrow 表达式
-
ScannerScannerBuilder - 扫描数据集内容
-
FileFormatParquetFileFormatIpcFileFormat - 数据集文件格式
-
CsvFileFormat - CSV 数据集文件格式
-
JsonFileFormat - JSON 数据集文件格式
-
FileWriteOptions - 特定于格式的写入选项
-
FragmentScanOptionsCsvFragmentScanOptionsParquetFragmentScanOptionsJsonFragmentScanOptions - 特定于格式的扫描选项
-
hive_partition() - 构建 Hive 分区
-
map_batches() - 将函数应用于 RecordBatches 流
-
FileSystemLocalFileSystemS3FileSystemGcsFileSystemSubTreeFileSystem - FileSystem 类
-
FileInfo - 文件系统条目信息
-
FileSelector - 文件选择器