• 有效利用CPU周期
    • 大量压缩列数据放在CPU的L1缓存
    • 紧密的循环中循环,没有函数调用