基础 – 编码无悔 / Intent & Focused

[原创]Python基础知识小结（1）

2021 年 05 月 07 日2014 年 01 月 09 日作者 learnhard

本文『很傻很天真』，熟悉Python的人都不用看了。另外本文的部分内容已经过时，请视情况忽略。
环境：未特别注明的话为Python 3.2.3，特别注明了的话则为注明的版本。

[原创]Apache Pig的一些基础概念及用法总结（1）

2022 年 05 月 10 日2011 年 09 月 23 日作者 learnhard

查看更多Apache Pig的教程请点击这里。

本文可以让刚接触pig的人对一些基础概念有个初步的了解。
很久很久以前，本文大概是互联网上第一篇公开发表的且涵盖大量实际例子的Apache Pig中文教程（由Google搜索可知），文中的大量实例都是作者Darran Zhang（website: codelast.com）在工作、学习中总结的经验或解决的问题，并且添加了较为详尽的说明及注解，希望能帮助一部分人。

Apache pig是用来处理大规模数据的高级查询语言，配合Hadoop使用，可以在处理海量数据时达到事半功倍的效果，比使用Java，C++等语言编写大规模数据处理程序的难度要小N倍，实现同样的效果的代码量也小N倍。
但是刚接触pig时，可能会觉得里面的某些概念以及程序实现方法与想像中的很不一样，所以，你需要仔细地研究一下基础概念，这样在写pig程序的时候，才不会觉得非常别扭。

[原创]Hadoop开发基础知识记录

2020 年 05 月 06 日2011 年 02 月 15 日作者 learnhard

✔ 当你把一个文件加入distribution cache的时候，要注意：如果你是以addCacheFile()的方式添加的，而你在mapper中取出来的时候，却是以archive的方式取出来——getLocalCacheArchives()，那么，你将得不到cache文件的路径，因为放进去和取出来的方式要一致。