原创 – 第 20 页 – 编码无悔 / Intent & Focused

Linux下快速区分多个移动硬盘的一种方法 & 查看网卡驱动版本 & 不重启加载用户配置

2013 年 03 月 21 日2010 年 12 月 21 日作者 learnhard

（1）如果你mount了N个相同容量的移动硬盘，那么如何快速区分它们？为磁盘设置卷标（label）是一个方法。

查看磁盘卷标的命令（这里假设你的磁盘格式为ext2/ext3）：

[原创] 如何不解压tar.gz文件查看其中的文件大小

2020 年 05 月 03 日2010 年 12 月 20 日作者 learnhard

如果你有一个上百G的tar.gz文件，要查看里面的每个文件的大小的话，解压出来可能太费时间，而且要占用大量磁盘空间。因此，不解压查看文件大小很有必要。

不解压一个tar.gz文件，查看里面的文件明细的命令为：

[原创] 在RHEL上安装Thrift（支持C++）的若干问题

2020 年 05 月 03 日2010 年 12 月 15 日作者 learnhard

本文针对的读者：要用Thrift开发C++应用程序的人。

环境：

RHEL 5.3（内核2.6.18-128.el5），32位

gcc 4.1.2

Boost 1.35.0

shell脚本因文件编码问题不能正确执行的问题

2020 年 05 月 03 日2010 年 12 月 14 日作者 learnhard

遇到一例因shell文件的编码问题导致执行后不能得到正确结果的问题。一般来说脚本中不会带有中文，不过有时候例外，例如你要查找一个文本中的字符串，cat test.txt | grep "汽车" 这样的命令，如果文件编码不对，就可能得不到正确结果。

用TinyXml解析XML文件中的CDATA区段数据

2020 年 05 月 03 日2010 年 12 月 08 日作者 learnhard

一个XML文件可能含有CDATA区段数据，如何解析？

本文基于以下背景：

C++，TinyXml库（版本：2.6.1）

[原创] 运行C++ hadoop程序时如何设置job参数

2020 年 05 月 03 日2010 年 11 月 25 日作者 learnhard

以pipe方式运行C++ hadoop程序时，如果想要动态设置job的参数（例如设置job name），不像用Java那么方便（可能是我没有找到对应的函数），因为在头文件 Pipes.hh 中，虽然有 JobConf 这样一个类，却没有提供相应的set方法，而只有get方法。

[原创] 从零开始一步步教你：用C++开发一个简单的hadoop分布式计算应用程序

2020 年 05 月 03 日2010 年 11 月 20 日作者 learnhard

假设你有上百G的数据，你要统计出这些数据中，含有某些你感兴趣的内容的数据的有多少条，你会怎么做？在硬件条件允许的情况下，用hadoop并行计算是一个不错的选择。

为了使本文得以清晰地说明，我们不妨假设如下的情况：

用shell删除一个文件的前N行

2020 年 05 月 03 日2010 年 10 月 25 日作者 learnhard

假设你想删除一个文本文件的前N行，并且你不想先将后面要保留的内容先保存到其他临时文件中，那么可以在shell中这样写（此处假设要删除的是 /root/file.txt 的前10行）：

[原创]关于最优化/Optimization 的一些概念解释

2020 年 04 月 28 日2010 年 10 月 20 日作者 learnhard

以下是我曾在学习“最优化”理论与实践中遇到的一些概念，我刚开始学的时候，有些东西看了很多遍都还觉得很别扭、晦涩难懂，在比较清楚地理解了之后，我打算把它们写下来，并试图以很通俗、但可能不十分严谨的方式解释、呈现出来，以使一部分正在这些概念中挣扎的人能有所解脱。

但是，请注意：有一些是我个人的理解，因个人水平有限，我不能保证完全正确，请您自己辨别。

（1）什么是“搜索方向”

用shell将时间字符串与时间戳互转

2021 年 03 月 17 日2010 年 10 月 18 日作者 learnhard

在shell中，字符串转换为时间戳可以这样做：

date -d "2010-10-18 00:00:00" +%s

不需要指定时、分、秒的话，直接写日期就可以了：

date -d "2010-10-18" +%s

输出形如：

1287331200

其中，-d参数表示显示指定的字符串所表示的时间，+%s表示输出时间戳。

[原创]rsync同步时，只同步指定的文件类型

2013 年 10 月 16 日2010 年 10 月 14 日作者 learnhard

使用rsync来同步文件时，如果想要只同步指定的文件类型，怎么做？

我的环境：rsync客户端将文件推送到rsync服务器端。搜了一下网络，看了一下rsync help，似乎是要用exclude参数和include参数配合来实现规则，从而达到只同步指定类型文件的效果，但是我试了一下没成功，于是最终采用了一种可以实现的方法：排除其他所有文件类型。虽然比较麻烦，但是能做到就行

[原创] 一些未归类的命令、操作方法或问题总结（1）

2020 年 05 月 03 日2010 年 10 月 10 日作者 learnhard

下面是一些未归类的命令及操作方法，专门记在此文中，以便将来查询。

由于文章较长，请用Ctrl+F查询关键字来定位到你需要的内容。

（1）反向域名解析查询：

在Windows下用这样的方法来查询域名反解是否做成功了：

ping -a 126.24.23.56

返回结果如果类似于这样：

[原创]最小二乘的理论依据

2020 年 05 月 03 日2010 年 10 月 08 日作者 learnhard

在做数据建模或者曲线拟合的时候，我们通常会用到最小二乘法。

[原创] Powell共轭方向集方法(Powell's Conjugate Direction Method)的实现

2020 年 04 月 28 日2010 年 09 月 19 日作者 learnhard

实现Powell算法的基础之一：你需要至少先掌握一种一维极值搜索算法。比较流行的是Golden Ratio Search（黄金比例搜索法），Fibonacci Search（斐波纳契搜索法），等等。

[原创]黄金比例搜索算法（Golden Section Search）的实现

2020 年 05 月 03 日2010 年 09 月 19 日作者 learnhard