這個機制不一樣.在oracle中,如果你count某一列,應該是僅僅加載這一列,如果有索引啥的,直接在索引上統計了,當然很快.(如果你countvarchar非常大之類的欄位,速度應該會非常慢)但是hive的cunt是基於hadoop的mr任務的,還是讀取每一行的所有的數據,如果你每行中有類似於clob之類的列的話,io的開銷可想而知.另外mr任務的啟動也是需要時間的.另外就是和你的hadoop的數據節點多少有關。
@missli
頂0
加入收藏
相關問答推薦
加入收藏