文泉驿正黑体

Posted: 九月 18th, 2007 | Author: | Filed under: 文章 | Tags: , , , , | 2 Comments »

文泉驿的一款矢量字体正黑体正式推出测试,是一件值得庆贺的事。

一年多前,我抱怨过中文开源字库的缺乏。如今看来,总体变化不大,但是确实有扎扎实实的进步,尤其是文泉驿项目的进展更为喜人。文泉驿点阵宋体发展到0.8版已经较为成熟,在屏幕显示上完全可以达到simsun点阵的水平。刚推出的正黑矢量字体尽管还是0.2版,但从屏幕截图看,字体效果已经可以应付屏幕显示。我在家里的Slackware上安装了文泉驿正黑体,并且设置好用它来代替粗体,配合文泉驿点阵宋体和免费的香港华康宋体一起使用。这样,我的Linux中已经可以剔除那些版权有问题的字体了。

然而,作为一款矢量字,屏幕显示只是一方面,打印输出的效果也同等重要。我在Windows XP SP2中也装上正黑体,用Word 2000创建了一份文档。当字体选用正黑体时,发现其内嵌的西文字体显示不出来,需要单独指定另一款西文字体,我选了Arial。我把字体大小设为四号,打印了出来。接着,我把中文字体设成黑体(simhei),同样打印了一份。两份打印稿一比较,就可以看出文泉驿的差距了。总体上看,同样是四号,但文泉驿字体偏大,这可能是由于计量单位不同引起的。文泉驿字体的大小也不一致,看起来显得比较散,很多字的比划、间架结构都还有优化的必要。下面这张图是我用手机拍的两种字体打印效果的对比,上面是文泉驿,下面是simhei。


对于文泉驿矢量字体的缺点,项目的负责人也很清楚,测试说明里面是这么说的:

由于字体制作流程复杂,工作量巨大,我们提供的测试字体的矢量部分尽管已经可用,但距离完美还很远。希望大家以发展的眼光来对待这个字体当中的不足,积极反馈并参与改进,相信这个字体会象我们的点阵字体一样,逐渐成为大家都能够接受的优秀字体。

这一点,应该是我们这些自由开源软件使用者的共同愿望吧。


Fcitx走向新生

Posted: 七月 12th, 2007 | Author: | Filed under: 文章 | Tags: , , | 1 Comment »

Fcitx 是运行在Linux中的一种中文输入法,开发者是Yuking。前天,Yuking在fcitx网站发帖,决定终止fcitx的开发

Fcitx是我最喜欢用的输入法,现在就在用。有一点可以让我拿出来显摆的是,其中的双拼功能是我极力鼓吹加入的,而且当初我也帮助进行了双拼的测试。与Yuking六年多的辛勤劳动比起来,我做的根本不值一提,之所以腆着脸说一下,是为了表达我对于Fcitx的感情。Linuxsir.org与Fcitx的渊源更为深厚,感兴趣的可以看看北南南北的回顾

Yuking终止Fcitx的开发,作为一个用户,我当然觉得惋惜。好事者在探究Yuking做出这个决定的原因,也有很多人充满正义感地揪出所谓的“祸首”,为Yuking打抱不平。据我了解的情况,被人喷一身口水只是Yuking停步的诱因,真正的原因我们无须那么八卦地去打听。实际上,Yuking萌生退意决不是近期的事情,早在三年前他已经表示了这种想法。尽管Yuking的放手让人不忍,但是作为一个用户,强人所难地让他坚持下去,不免有自私的嫌疑,所以我很赞同“感谢你的付出,尊重你的决定”这种态度。

讲起Fcitx的时候,常常免不了要提到另一个Linux输入法平台——SCIM。很多人容易把Fcitx和SCIM都当作输入法,但它们俩并不是同一类的东西。Fcitx是输入法的具体实现,其底层的结构是XIM,而SCIM的目标是对输入法功能进行抽象并构建一个新的输入法开发框架,输入法的具体实现并不是SCIM关心的问题。尽管如此,从项目开发的角度把这两个项目进行一下比较还是能给我们一些启示。

首先,开发者的背景不同。Yuking是业余程序员,编程出于爱好;SCIM的发起者苏哲是专业程序员,几年来一直在不同公司从事开源软件的开发工作。我不懂代码,但是从两个人不同的背景上,我可以理解一些人对于Fcitx代码质量的批评。在一个群体合作的基础上编码,要更多地考虑程序的规范性、可维护性,但如果是一个人的话,也许编码会更自由、更加信马由缰,带来的问题自然是缺乏严谨性、他人接手维护困难。

再者,项目的目标不同。Fcitx的目标很简单,就是为了解决Linux系统的中文输入问题,所以功能设置上非常贴近用户的需要,在输入法的具体实现上也做得很好。SCIM的目标则远大得多,它是想成为一个平台,以此为基础容纳其他各种输入法,并减少输入法开发的难度。简单地说,Fcitx只是针对中文用户,所以在配置文件中用中文变量名并不见得是个缺点。而SCIM针对的是全球用户,无论是韩文、日文还是其他文字,只要有对英文键盘输入进行转换的需要,就能在SCIM的基础上开发出对应的输入法模块。

第三,开发团队不同。Fcitx到目前为止,可以算是一个人的项目,尽管也有一些热心人贡献了一些代码,但主要还是Yuking一个人在独力支撑。这种状况与我最喜欢的Slackware倒是有点相似。SCIM则一直面向国际开源社区,尽管一开始是苏哲做的开创工作,但现在已经形成了一个国际化的开发团队。我用Slackware最担心Patrick哪一天撂挑子不干,Debian用户则绝对不会有这种担心,Fcitx与SCIM也可作如是观。

主要由于以上后两点的不同,两个项目的传播范围也大相径庭。Fcitx仍然主要由中文用户自己下载安装,而SCIM已经被整合进主要的发行版之中,走向了世界。当然,由于目标用户不同,在覆盖面上进行比较对Fcitx并不公平,但至少可以帮助我们看出一个开源项目被国际社区接受的一些必要条件。

令人欣慰的是,已经有热心人开始接手Fcitx的准备,对于广大喜爱Fcitx的用户来说无疑是个福音。但是,Fcitx从一个人的项目变成社区合作的项目,一定有许多需要克服的障碍,需要深入细致、点滴入微的工夫,并不是靠一时的热情就可以支撑下去的。尽管看起来像是兜头的一盆冷水,但我其实是希望上面的分析能对后来者有所帮助,希望大家共同认真思考一下如何让Fcitx更加顺畅地融入开源社区。祝Fcitx在开源社区更广泛的合作之下如浴火凤凰般重新展翅翱翔。


换上文泉驿字体

Posted: 十二月 26th, 2006 | Author: | Filed under: 文章 | Tags: , , , , | No Comments »

之前,我提到文泉驿项目在制作和发行自由的中文字体方面的努力,但其实我自己一直没有用过文泉驿的点阵字,主要是不想在配置好了的系统上再动什么干戈。前几天,文泉驿点阵宋体0.8版宣布公开测试,一时兴起,下载并按照安装说明的指示装在了我的Slackware系统中。

看惯了微软SimSun(其实是中易公司提供的)中的12点阵宋体,乍一看文泉驿,会有一种不太习惯的感觉,原因是有些字笔划的位置会有一些轻微的差别,某些细节的处理上大家也有所不同,但总的来说0.8版比起以前的版本确实有改观,向着被更多人接受又迈进了一步。说到不满意之处,我觉得文泉驿12点阵的粗体还需要改进,看起来不如SimSun的美观。实际上,在12点阵中实现笔划多的汉字已经勉为其难,再想加粗笔划更加容易搞成一团黑,所以也不应该苛责。在Windows中试了试SimSun粗体,发现Windows在处理粗体时似乎加大了点阵,这样就能有更多的空间腾挪。也许文泉驿可以考虑一下这种取巧的做法。

文泉驿0.8版的发行,在水木社区引发了一场口水战。反对这个项目的一方主要论点一是字体不够美观,二是质疑文泉驿字体是否符合国家标准,三是担心字体做不好会误人子弟。在我看来,前两条都是可以在发展中克服的缺点,而文泉驿一直以来的进步也印证了我的看法。至于第三点,在目前来看,会用这个字体的应该都是过了识字阶段的人士吧,再说就算小孩子认字也应该以《新华字典》为准,担心文泉驿对小孩子识字造成不利影响似乎太过杞人忧天。

下面两张贴图,前一张是文泉驿字体(12点阵的小字)在Linux下firefox 2.0中的显示效果,另一张是微软SimSun在Windows的firefox 2.0中的显示效果。


字体的烦恼

Posted: 三月 23rd, 2006 | Author: | Filed under: 文章 | Tags: , , , , | 2 Comments »

文泉驿是一个开源的中文字库开发计划,目标是构建一个覆盖Unicode 4.0所包含的7万多汉字的开源字库。 前几天,文泉驿发布了代号为“北斗”的点阵宋体v0.7版,从屏幕截图看,又有了很大进步,显示效果与Windows中的宋体点阵已经不相上下了。

用惯了Windows的用户可能会奇怪,那么多好好的字体为什么不用,反而要搞一个开源字库呢?解答这个问题的关键在于,目前我们在Windows系统中使用的中文简体字库都是商业字库,在它们的许可证条款中都限定了捆绑式的使用条件,如果把它们从Windows系统剥离出来,用到Linux或者BSD系列这些开源的操作系统之中,厂商乃至用户都面临着潜在的法律风险。

香港Debian组织维护了一个Wiki网页,列出了几乎所有Linux系统中可用的中文字库。从那个页面我们发现,繁体字用户的选择竟是如此丰富多彩:文鼎、王汉宗尽管是商业的字库公司或开发者,却大大方方地捐出了几十款中文TrueType字体供开源世界使用。即便没有他们施以援手,台湾“教育部”还提供了“标准字形”,香港特別行政区政府也购买了华康字体供个人非商业用途使用。

简体中文用户则没有这么幸运。在现今丛林法则盛行的世界,指望商业字库公司捐出一些字库供开源社区使用,无异与虎谋皮,忙着建立和谐社会的人民政府怕是忙不过来,目前指望不上。幸亏有了文鼎和王汉宗们,他们不仅捐出了繁体字库,也体贴地捐出了几种简体字库。尽管只是GB2312编码的6000多字,但假如不是靠了他们,严格地说,开源社区就几乎没有可用的中文简体TrueType字体了。

既然现有的字体(尤其是简体)不敷使用,于是房骞骞这样的当代仓颉们发起了文泉驿项目,利用开源社区的力量,用蚂蚁啃骨头的精神,一个字一个字地自己画出来。现在做出的宋体点阵字体只能说小有所成,应付计算机屏幕的显示还勉强可以,而满足大字号显示和打印输出的矢量字体制作才是更加的任重道远。

对于很多普通用户来说,字体是否开源只是其次,解决眼前的问题才是关键。于是,从Windows系统“借”各种字体来用成为普遍的解决方案,这也是涉及Linux中文化的文章或帖子屡次提到simsun的原因。相比盗版Windows,“借”字体的做法假如侵了权,侵的也都是“自己人”的权,大不了是人民内部矛盾。这么想,总算是有点心理安慰。


中文还是天然屏障吗?

Posted: 九月 1st, 2005 | Author: | Filed under: 文章 | Tags: , , , , | No Comments »

老白要向百度拍砖,我顺手拣了几块砖头。

有人引用的李彦宏话说: “中文搜索与英文搜索是完全不一样的。英文搜索,遇到的是以一个个以空格相隔开的词,而中文的词与词之间是需要进行“切词”的(即将一个句子中的词合理分 隔开)。如何让机械的搜索引擎准确地按照中国人的思维习惯将词“切”好,而百度在这方面已经走得太远了”,以此标榜百度中文搜索技术的先进,具体地说是分 词技术的先进。而老白则公开征集百度的分词错误。

带着一丝阴暗心理,我分别用“省长”、“市长”和“县长”分别测试了百度和Google,结果是百度在第一页甚至是第一项就出现了分词错误。以搜索“省长”为例,百度的第一项结果就是“湖南省长沙 市第一中学”,“市长”和“县长”的结果也不能幸免,直到“乡长”和“村长”才打住。Google的情况要好一些,起码在第一页没有发现分词错误。又试了 试“人为”和“为人”,这一次百度和Google的结果不相上下,都出现了分词错误。仅从这区区几个词的搜索,我以偏概全地推论,百度走得并不太远。我不 是百度的用户,早就习惯了在firefox的搜索框直接输入关键词访问Google的方式。有限的使用百度的机会,再次套用李彦宏的话说,都带着对百度的 偏见[注],可见我应该不具备批评百度的资格。

其实我并不是想向百度拍砖,我想拍的是那种认为中文还是保护国内IT 行业的天然屏障的看法。这种看法放到10多年前的DOS时代,似乎还有些道理,当时的普遍看法认为中文处理还是要中国人来搞,洋鬼子搞的东西不地道。直到 后来WPS与Word竞争的时候还是打这张牌,结果如何则是有目共睹的。在目前全球一体化的背景下,技术、人才、资金都在流动,百度能自己开发中文分词技 术,Google也可以请到甚至更好的中文处理专家,再提中文的独特性使国内公司具备先天的竞争优势则近似于痴人说梦了。

[注] 百度解密之二:李彦宏365天解决方案
《21世纪》:要搜东西第一个选择会去Google,当Google被屏蔽时,会转到百度,这是一年前的情形。如果用百度查一家银行,有可能出现的第一个链接不是这家银行的正式(官方)网站,而是与其相关的一次商业活动。现在百度跟Google是怎么竞争的,介意国外投资者说“百度是中国的 Google”吗?
李彦宏:我认为这是对百度的偏见