Developing for iPhone Part I

Developing Natively 虽然有很好的一些指南帮助我们使用完全开放和自由的工具集(toolchain)来为iPhone作开发——甚至在iPhone上直接编译和安装,例如这个,但是我还是希望用官方iPhone SDK(想想下载那2G大块头的时间 XD)和Xcode,当然我没有兴趣去买那 $99 的开发者授权,同时作为完美主义者,还希望Xcode能够尽可能完美的运行每一个功能——这个也是有办法的,之前找到了246tnt针对iPhone SDK 2.0的一个解决方案,今天又看了javacom在hackint0sh.com上写的一个不一样的思路,经过实验,后者更加简单,在SDK 2.1上也完全适用,而且很好的支持设备部署,下面就是我尝试的方案:

Chinese Full-text Searching

现代化的全文检索引擎都对双字节有很好的支持,但是对于索引来说关键性的分词算法,则由于和语言特征直接相关,一般来说都需要单独开发。Ruby的世界里有两个出名的搜索引擎,一个是老资格的Ferret(这个站点貌似最近访问不到),另一个日渐热门的新贵Sphinx,当然这俩都不直接支持中文分词,而它们可以使用的中文分词算法目前看到的似乎是两个,都基于台湾蔡志浩的mmseg算法(基本上完全开放自由的中文分词算法很少,这个是不是唯一的我不清楚)。一个是CoreSeek的李沫南用C++实现的libmmseg,这个据说不错,但在我的Mac OS X下编译不能(BSD的一些头文件位置和Linux不一样);另一个是pluskid用Ruby编写的rmmseg,以及后面用C++改写的版本rmmseg-cpp,JavaEye的robbin有篇介绍提到它们的对比,可以参考。 因为我这里只能安装rmmseg,rmmseg-cpp版本也有问题rmmseg-cpp的问题经过和pluskid的交互已通过最新的patch解决,所以先研究这个,希望能够给MRP的全文检索功能找到解决方案。

MRP Launched

MRP = The Matrix.org Resurrection Project 也就是将老Matrix论坛数据导出并编写页面进行查询、浏览显示的计划。 这个计划分两个步骤进行:

Joe Armstrong on Erlang

Joe Armstrong,Erlang的作者。最近Software Engineering Radio采访了他,有些很有趣的观点。听不懂的没关系,CSDN的g9有个中文的介绍可以看,摘引如下:

Why Using Mac

著名blogger,MS Basic和Visual Basic的作者之一,Jeff Atwood前不久写了一篇文章叫做 Douchebaggery ,讽刺以 DHH 为首的歧视在 Windows 上搞 Rails 开发的 Mac 狂热者。偏激永远是不对的,所以内容看看笑笑就好,有趣的是在这篇文字的 comments 中我发现了迄今为止最精确的描述了我对Mac,尤其是对 OS X 的感觉的文字:

Pearls In The Net(22 Feb)

Programmers At Work, 22 Years Later In 1986, the book Programmers at Work presented interviews with 19 programmers and software designers from the early days of personal computing including Charles Simonyi, Andy Hertzfeld, Ray Ozzie, Bill Gates, and Pac Man programmer Toru Iwatani. Leonard Richardson tracked down these pioneers and has compiled a nice summary … [Read more…]

MS Office File Format

上周(2月15日)微软公开了它的Office文档二进制格式规范,从下载的PDF格式的spec来看,这些文件真是复杂的一塌糊涂,这不,大嘴Joel Spolsky的blog新作专门告诉你为啥它们要有这么复杂,非常有启发也有趣的文字 ^_^

MapReduce Introduction

MapReduce 最近几年越来越热——其实它被发明出来也就几年而已——现在写一个简要的介绍,主要素材来源于 Eugene Ciurana 发表在 TheServerSide.com 的一篇 Why Should You Care About MapReduce,以及 Wikipedia 上的 MapReduce 条目。可以的话最好去读原文。

Flame Wars Anywhere

最近看到这个关于RDBMS vs. MapReduce的文章我实在是无语了。。。当然,马上有人起而应战(貌似很多应战贴都喜欢说 jump the shark,也算一个pattern了 >_< )。