PLOD

[MapReduce] HIVE and pig 본문

computer science/Cloud computing

[MapReduce] HIVE and pig

훌룽이 2022. 12. 15. 08:06

* HIVE and Pig

-  HIVE :  Facebook에 의해 만들어진 data-warehouing 어플리케이션이다. Query language 로는 SQL과 비슷한 HiveQL을 사용한다. HiveQL로 정의한 내용을 Hive가 MapReduce job으로 변환해서 실행

 

-  Pig : YAHOO에 의해 만들어진 large-scale data processing system이다. Script들은 Data-flow 언어인 Pig Latin으로 작성되었다.(No Query language) , 사용자 정의 함수로 확장이 가능하지만 컴파일 과정이 필요함으로 기존의 MapReduce보다 성능이 떨어진다.

 

HIVE와 Pig는 기존의 MapReduce에서 Text, IntWritable, LongWritable 이외의 객체를 사용하거나 Key 값이 아닌 Value 값으로 정렬을 하고 싶을때 어려운 점이 많아 탄생하게 되었다. 

 

-> HIVE와 pig는 Higher-Language-level이기 때문에 기존의 Mapreduce code보다 매우 간결하다. 

Comments