0
为什么“每个HDFS文件1分HDFS块”是在地板正式文件优化的阅读设置为什么“每HDFS文件1分HDFS块”是在地板公文更好
编辑:?
如上图所示,parquet文件由行组组成。 如果“1GB行组,1GB HDFS块大小”,则1行组将适合1个HDFS块。那么列不会在HDFS块之外。所以,我们不再需要传输数据。但是,什么是“每个HDFS文件的1个HDFS块”呢?
为什么“每个HDFS文件1分HDFS块”是在地板正式文件优化的阅读设置为什么“每HDFS文件1分HDFS块”是在地板公文更好
编辑:?
如上图所示,parquet文件由行组组成。 如果“1GB行组,1GB HDFS块大小”,则1行组将适合1个HDFS块。那么列不会在HDFS块之外。所以,我们不再需要传输数据。但是,什么是“每个HDFS文件的1个HDFS块”呢?
“1GB行组,1GB HDFS块大小”足以避免传输数据,不是吗? – cola
你是对的,但要实现列式存储中的数据,你将需要1GB文件 – hlagos
为什么需要1GB文件? – cola