分节阅读 31(2/4)
计算机要用二进制处理各种信息,就必须借助编码技术,对各种基本组成要素进行标识。
在这方面,像英语这样只有26个基本字母、仅用一个128位的ascii表便能完成编码的西方语言有着天然的优势,而中文就要费事多了。
从逻辑构造上看,汉字虽然可以分成不同的部首、偏旁等文字基本构件,但是数量过多,远远不止26个,而且这些基本构件在组成汉字的时候,还有着位置、方位、朝向的变化。
因而,以文字构造为标准来分类归放和处理中文信息,困难重重。
一些‘激’进的技术人员甚至借此鼓吹淘汰汉字。对于发明了造纸术和印刷术的华夏来讲,这个现象未免有些悲哀了。
在攻克这些难关的道路上,涌现了很多著名的华人,如朱邦复、倪光南、王选、王永民,等等,可以说,‘花’费了十年多的心血,才逐步解决了这个难题。
做为重生者,唐焕自然要缩短这个过程,好让华人有更多时间去关注‘操’作系统、网络等其它方面的技术。
首先,唐焕已经规划好了一套包含简体字和繁字体在内的编码方案——唐码,直接涵盖了原本时空当中的gb-2312和big5的内容。
随着方圆电脑的强势普及,唐码必然会成为行业标准,直至官方标准。
其次,在输入法方面,唐焕选择了简单易用的拼音输入法。
宝岛这里的基础教育是由注音符号教起的,繁体字便是注音输入法,而简体字则是汉字拼音输入法。
当然,整个项目的工作量非常大,唐焕凭借一己之力是无法完成的,而且也没那个必要,他只规划出了一个总体框架,实现了开创‘性’以及核心模块的功能,然后便安排简明仁去做繁体字方面的工作,至于简体字方面的工作,唐焕则正在另外找人推进,相信小姨会给自己推荐来合适的人选。
不过,这些困难还只是智力方面的软件开销,硬件成本的因素也要考虑进去。
文字按照一定规则排序编码、并可以通过输入法的方式进行检索后,仍然不算万事大吉,计算机为了显示它们,还必须安排与之匹配的存储空间,包含英语26个基本字母的ascii表,所需不多,但包含成千上万汉字的字库开销就大了。
比如为了让爱普生的7针针式打印机打印出汉字,打印头要按照12x12点阵字库的设定,分奇数行和偶数行往返两次,才能完成一个汉字的打印。
而在这个字库里,一个汉字的点阵信息需要32字节的存储空间。
简明仁‘弄’出来的繁体字字库包含了将近一万个字,大致算下来,需要的存储空间达到了320k,这个开销是微型计算机无法承受的。
要知道,现在主流的8位cpu,如intel的8080,、zilog的z80、motorola的6800、mostechnology的6502,其最大寻址地址空间是64k,苹果公司现在热销的二代机,也只是搭载了48kb的内存。
唐焕见此情况,只好再次披挂上阵,采用数据压缩技术,把汉字字库所占用的空间降低到了可以接受的水准,这才有了可以商用的可能。
好在这个时期,日本的电子工业发展迅猛,各种元器件的售价下降很快,成本和利润能够兼顾,这也是唐焕离开美国、跑到亚洲开办工厂的一大主要原因。
所以说,在原本的历史时空当中,汉字的计算机信息化道路非常曲折。
本章未完,点击下一页继续阅读。