周至他们这代人面临的是国家信息技术从无到有的时期,因此学习方向还没有细分到后世那种精细的程度,也正因为如此,虽然周至讨厌理科,但是在大学里打下的基础还是非常扎实的。
“搞技术研发的操作系统平台多为unix,这个平台是开源的,也就是说没有操作系统层面上的知识产权问题。”周至说道:“而输入法规则,王码五笔已经是一个非常成熟的汉字输入系统,拆解字根的思路,也非常适合对于繁体字生僻字不熟悉的操作员,也可以毫无障碍地准确录入。”
“字体的笔画失量运算函数,我们可以继承gb 2312—1980标准字库进行,只做一些增补就行。”
“剩下的就是扫描函数,点阵字调整函数,调整参数数据库,字体参数采集系统四个部分。”
“等一下!”辜开来听出了一些问题:“这有些不对啊,不是说只要将点阵字扫进数据库,再利用gb 2312—1980标准字库的笔画失量计算函数,配合雪珊已经写好的黑体宋体彷宋体,就已经可以生成我们需要的大字库了吗?”
“师哥你说的只是这套系统的基础功能。”周至笑道:“我现在说的,是扩展功能。”
“我要这个字库能够完成的工作,是扫完《玄秘塔碑》,它就能生成柳体;扫完《九成宫醴泉铭》,它就能学会欧体;扫完赵孟頫《千字文》,它就能学会赵体。”
“不这样的话,将来还是得头痛医头脚痛医脚,浪费大量的社会资源不说,到最后能供国人使用的字体,依然还是有限。”
“这是一个大课题啊。”辜开来琢磨了起来:“而且得是跨学科的大课题,就是谁轻谁重的问题。”
“现在看来……却是计算机系那边比较重。”
周至却并不认为是这样:“如果仅从建字库这方面来说,我们中文系能做的当然都是笨功夫,要成为项目主理方,就需要进行更大的应用拓展。”
“我现在能够想到的,当然就是古籍整理和数字化。”
“对呀!”辜开来一拍大腿:“既然能够让系统扫描碑帖学会字体,那反过来当然也行,咱们可以让它在学会认字之后,将扫描的图像信息转化为文字信息!”
“对,因为书籍字体都是相对固定的,格式也非常完美,很适合用这种方法采集,形成古籍数据库。”
“走!去跟你师公和师父汇报汇报!”辜开来兴奋莫名:“这项目,有搞头啊!”
周至却道:
本章未完,请点击下一页继续阅读!