在Column Oriented模型中,如何根据两个列的比较结果(例如,int1Col < int2Col)来创建一个选择向量(selection vector)?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
在Column Oriented模型中,可以通过遍历数据批次中的两个列(int1Col和int2Col),比较它们的值,并将满足条件的索引添加到选择向量中。伪码示例如下:
selectLTIntInt.Next():
batch = source.Next()
for i < batch.n:
if int1Col[i] < int2Col[i]:
selectionVector.append(i)
return batch with selectionVector //
假设batch现在包含了selectionVector
注意:这里的伪码假设batch对象可以附加selectionVector,实际实现可能有所不同。