本文针对使用Core ORC API的VectorizedRowBatch 读取ORC文件详解,并给出详细的示例源代码
数据作为包含1024行数据的VectorizedRowBatch
实例传递给ORC。重点在于速度和直接访问数据字段。cols
是ColumnVector
的数组,size
是行数。
ColumnVector
是不同类型列的父类型,并且具有一些跨所有列类型共享的字段。示例如下:
noNulls
标志;isRepeating
标志。noNulls == false
的列,如果该值(isNull
)为空,则isNull数组为真public abstract class ColumnVector {/** Reference count.
上一篇:JS基本使用
下一篇:Scala变量和常量