Apache Hadoop Pig 源代码分析(1)

  • 时间:
  • 来源:互联网

由于工作中需要使用Pig工具,为了加深对Pig的理解,现在尝试分析它的源代码,以最新发布的0.13.0版为基础。

Pig是什么,源代码怎样获取,我就不多说了,Google或百度一下即可找到。

拿到源代码后,首先统计java文件的个数,总共有1504个!!!

这么多代码还要继续分析吗?当然要继续了,不要怕,其实里面很多辅助文件和小文件。

比如以Test开头的文件,绝大多数是用来进行单元测试的,跟核心代码无关,可以删除掉;有很多文件只是简单的定义了一个接口,没有多少内容。

在这里我推荐使用Everything这个文件查询工具来进行文件的统计和过滤,非常方便。

删除掉Test文件后,还剩1157个,少了300多个,请看下图。


为下一步开始分析代码开了一个好头。

本文链接http://element-ui.cn/news/show-576852.html