此类别包含控制 ParquetFileWriter 如何读取 Parquet 文件的设置。
详情
参数 compression、compression_level、use_dictionary 和 write_statistics 支持多种模式
默认的
NULL使参数未指定,C++ 库为每个列使用适当的默认值(上面列出的默认值)单个、未命名值(例如
compression的单个字符串)适用于所有列一个未命名的向量,大小与列数相同,按位置顺序为每个列指定一个值
一个命名的向量,用于指定命名列的值,未提供时使用设置的默认值
与高级别 write_parquet 不同,ParquetWriterProperties 参数使用 C++ 默认值。目前这意味着 compression 参数的默认值是“uncompressed”而不是“snappy”。
工厂
ParquetWriterProperties$create() 工厂方法实例化对象并接受以下参数
table: 要写入的表(必需)version: Parquet 版本,“1.0”或“2.0”。默认“1.0”compression: 压缩类型,算法"uncompressed"compression_level: 压缩级别;含义取决于压缩算法use_dictionary: 指定是否使用字典编码。默认TRUEwrite_statistics: 指定是否写入统计信息。默认TRUEdata_page_size: 设置列块中数据页的近似编码大小(以字节为单位)的目标阈值。默认 1 MiB。
另请参阅
Schema 有关模式和元数据处理的信息。