hive是建立在hadoop上的數據倉庫基礎構架.它提供了一系列的工具,可以用來進行數據提取轉化加載(etl),這是一種可以存儲、查詢和分析存儲在hadoop中的大規模數據的機制.hive定義了簡單的類sql查詢語言,稱為hql,它允許熟悉sql的用戶查詢數據.同時,這個語言也允許熟悉mapreduce開發者的開發自定義的mapper和reducer來處理內建的mapper和reducer無法完成的複雜的分析工作.hive採用類sql的查詢方式,將sql查詢轉換為mapreduce的job在hadoop集群上執行。
@kuigang
頂0
加入收藏
相關問答推薦