由于计算机通用键盘最多只有100来个键位,要用这些键位输入成千上万个汉字,就需要以符号序列来表示一个汉字,由此形成一系列的汉字输入法编码方案,例如四角号码、电报码、汉语拼音编码、五笔字型编码、郑码等。
1978年5月,上海电工仪器研究所工程师支秉彝创造了“见字识码”的汉字编码法,并被上海市内电话局采用,从而率先使计算机的汉字键盘输入进入了实用阶段。同时在中国港台地区及国际上,陆续出现了“王安三角”“仓颉”“行列”“唯物”等一大批繁体汉字输入法。
20世纪80年代中期开始,随着PC机和汉字系统、中文电脑打字机的普及,中国的汉字编码研究进入了空前活跃的阶段,各种汉字编码输入法不断被开发出来,一时间出现了“万码奔腾”的局面。据估计,在中国大陆出现的各种汉字输入法已经达到上千种之多。
这些汉字键盘输入法基本上可以分为基于汉语拼音的,称为音码;基于汉字字形笔画的,称为形码;两者结合的,称为音形码或形音码。
音码就是直接使用汉语拼音或在汉语拼音的基础上进行某种变形以达到减少输入码长、减少重码的目的。典型的音码包括拼音码、双拼码等。音码的优点是培训量小、好学易记,而且符合人们在编写文章时的思维习惯;缺点是重码量大、输入较慢,而且拼音不标准的用户(如方言地区)使用比较困难。
形码是根据汉字的笔画、部件以及字形特点对汉字进行编码,典型的形码有五笔字型、郑码、自然码等。形码的优点是码长短、重码少、输入速度快,适合专业录入人员使用;缺点是培训量大、难学易忘,而且有些形码对汉字字形的拆分不符合汉字的笔画、部件规则。
形音码或音形码试图结合音码和形码的优点,回避它们的缺点,以形码(或音码)为主,配合音码(或形码)输入,以期在输入码长、重码率、易学易用上取得平衡。
音码输入法结合了自然语言技术,向智能化发展,形成了一批易学易用、输入效率较高的智能拼音输入法,如搜狗输入法、百度输入法、讯飞输入法、微软拼音输入法等。形码输入法则日渐式微,只剩下五笔、郑码等在少数专业录入人员中使用。
汉字键盘输入具有输入快速、省力、方便等其他输入方式无法比拟的优点。用键盘输入汉字明显比语音输入和手写识别输入更加快速,同样,键盘输入比手写输入更加省力,一般只需要输入2~4个键就可以输入一个汉字。
因此,尽管汉字键盘输入还存在诸如输入方式和人们使用语言文字的习惯不符、用户需要花额外的时间学习等不足,但是其具有的输入快速、无需添加额外设备、编码方案丰富等优点使得汉字键盘输入仍然是绝大多数用户采用汉字输入方式。
另外,随着计算机技术的发展,软件技术弥补了汉字编码的很多不足。句子输入、词组输入、智能输入等技术使键盘汉字输入系统更加好用,输入更加快速方便。