相同点:
运行Hadoop之上,设计动机是为用户提供一种更简单的Hadoop 上数据分析方式。
解决相同问题的两个工具Yahoo 与facebook
不同点:
Hive 要求处理数据必须有schema,而Pig 则无此要求
Hive 有server 需要安装,Pig 无server 不需要安装
编程语言不同,HQL与Pig Latin
HQL:得到什么样的结果,过程化语言
PigLatin:如何处理数据,数据流语言
Pig 通常结合Oozie:
Ooize 是什么:(1) 作业流调度系统
(2)根据配置对作业进行周期调度或者定时调度
(3)同时支持Mapreduce,Hive,Pig 等
(4)包含监控,预警等功能
怎样让Ooize 调度Pig作业:(1)Ooize 将作业封装成了action
(2)可让Pig 作业与Mapreduce ,Sqoop 等连用