首页 . 文学 . 出版学 . 印刷 . 印刷技术 . 印刷字体 . 字库

字库

/character font library/
条目作者闻申生

闻申生

最后更新 2023-05-18
浏览 338
最后更新 2023-05-18
浏览 338
0 意见反馈 条目引用

通过编码获取字形数据,经解释后输出字形到输出设备的计算机信息处理系统。由编码标准和字形描述数据两部分组成。

英文名称
character font library
所属学科
出版学

字库是文字信息处理系统的概念,由编码标准和字形描述数据两部分组成,系统通过编码获取字形数据,通过系统里的字形解释器生成图形数据输出到输出设备,如显示器、打印机、智能手机等。

计算机诞生于1946年的美国宾夕法尼亚大学,直到1976年苹果公司推出的计算机产品才是现在人们普遍使用的电脑雏形。电脑主要包括计算机硬件和软件,软件首先是操作系统。操作系统包含基于文字的字库和输入法,以完成人机交互对话。英文的文字体系是26个字母的大小写,外加常用符号,西文的编码标准ASCII(美国信息交换标准代码)在1967年发布,包括95个显示字符和33个控制字符,用一个字节完成了西文字库的编码要求。

电脑进入中国是在20世纪70年代末80年代初,最早引入国内的电脑只能处理英文不能处理中文,因为没有中文字库和支持中文字库的软件系统。中文和西文的主要差异是西文字库数量小,而且可以拼出任何字词,而中文字库字数量巨大,而且很难收集全部汉字。中国大陆最早的汉字编码国家标准是《信息交换用汉字编码字符集》,标准号为GB 2312—80,收集了6763个汉字,“—80”表明是1980年制定的标准,也称为简体汉字标准(以下简称GB 2312—80)。1984年中国台湾的信息机构制定了big5的汉字编码标准,合计收集了13060个汉字,也是中国传统的繁体汉字字库集合,主要在台湾地区和其他华人地区使用。由于GB 2312—80和big5编码不一致,使得类似于邮件系统传递的文本经常出现乱码。为了弥补繁体字的缺失,全国信息安全标准化技术委员会(简称信标委)制定了GB 2312—90,字数还是6763个汉字,其中2114个汉字替换成繁体字,为大陆版的繁体字库。1995年,信标委制定的新的标准GBK(国标扩充),收集了21003个汉字,和GB 2312—80完全兼容。与此同时,国际标准化组织UNICODE(万国码)开始收集全世界文字,制定字库编码标准,特别是汉字部分的收集和编码标准制定。在UNICODE的编码标准基础上,信标委制定了GB 18030—2000,在GBK的基础上增加了扩充A的6530个汉字,汉字字数达到27533个。GB 18030—2005又收集了扩充B的42711个汉字,汉字字数达到70244个。由于70244超过了2字节的编码上限(65536),所以现在的系统一般支持GB 18030—2000的27533汉字的编码标准。汉字大字库的制作要耗费巨大的人力成本,同时大字库也占用系统的存储、运行和通信传输等成本,而扩充B是更偏僻的汉字,实际使用率极低。

字库产品的研制是基于每一个字形的,都是通过严格的制作工艺流程完成的,包括手稿设计、数字化过程、电脑辅助制作、设计风格一致性检测、汉字正确性检测、不断修正完善、产品集成等。产品生产成本是和字库字数正相关的,字数越多,研制成本越高。字库产品是数字化设计产品,受国家著作权法保护。

根据字形信息的构成,可以将字库分为点阵字库和轮廓字库两类。同时轮廓字库可以嵌入点阵字库,形成统一的字库格式。

点阵字库就是用黑白点的图像方式记录字形,是特定大小的二维矩阵图,如16×16,24×24,32×32,48×48,64×64等,信标委基于GB 2312—80制定了上述大小的点阵字库国家标准。点阵字形是按位存放一个像素,每个像素(0,1)二值形成的黑白图像,如16×16的点阵,每个字形占16×2字节空间,32个字节的空间记录一个16×16的点阵字形。点阵字库在20世纪80年代,应用于较低精度的输出设备,也是信息技术发展初期的字库格式。点阵字库存储量大,不易变倍使用。往往在原点阵大小时,其字形质量最佳,比轮廓还原的结果要好一些,所以在TrueType字库格式中也可以嵌入点阵字库,在应用目标大小和点阵字库大小一致时系统会启用点阵字库。

轮廓字库就是沿黑白字形边缘线描述而形成的字形信息的集合,其特点是字库存储量小,方便变倍使用,是字库技术字形描述的通用方法。轮廓字库需要解释还原成图像后输出使用,解释轮廓字形的是系统的字库驱动程序。当字库格式符合标准字库格式,字库载入系统就可以被应用。轮廓线用直线连接,即用一次直线描述字形信息的集合被称为矢量字库。由于矢量轮廓放大时会出现线段连接处的拐点现象,所以现在的字库技术多使用曲线描述轮廓的方法,曲线一般是二次曲线和三次曲线,TrueType是二次Bezier(贝赛尔)样条曲线轮廓,OpenType是三次Bezier曲线轮廓。TrueType字库格式是美国苹果公司首先设计的字库格式,美国微软公司在Windows系统中应用,得以形成字库格式标准。美国Adobe公司是最早的字处理产品服务厂家,其研制的页面描述语言PostScript中的字库描述格式Type1已经成为行业的标准,现在广泛使用的PDF文件就是PostScript语言描述的,Type1是三次Bezier曲线描述的。为了兼容TrueType和PostScript,苹果公司、微软公司、Adobe公司等联合推出新的字库描述标准OpenType。现在普遍使用的字库格式标准一般指TrueType和OpenType。

相关条目

阅读历史

    意见反馈

    提 交

    感谢您的反馈

    我们会尽快处理您的反馈!
    您可以进入个人中心的反馈栏目查看反馈详情。
    谢谢!