首页 . 管理学 . 情报学 . 情报技术 . 情报输入技术

汉语情报输入

/Chinese information input technology/
条目作者王景寅 撰何琳 修订
条目作者王景寅 撰

王景寅 撰

何琳 修订

何琳 修订

最后更新 2023-12-02
浏览 230
最后更新 2023-12-02
浏览 230
0 意见反馈 条目引用

以计算机可处理的方式输入汉语文字的有关技术和方法。

英文名称
Chinese information input technology
所涉及学科
情报学
应用领域
情报技术

汉语文字是图形文字,数量庞大、字形复杂、同音字多,与西文语言相比,计算机输入较为复杂。因此在中国及一些使用汉语的国家和地区,汉语情报输入是计算机情报系统的重要组成部分。

20世纪70年代以来,人们广泛重视汉语情报输入的研究,已提出的汉语情报输入方式大致可分为几种类型:①键盘输入。是利用计算机标准键盘,对汉字进行编码,再通过键入这种编码来实现输入汉字。键盘输入技术成熟、易行、常用,是主要的汉字输入方式。广泛使用的中文输入法有拼音输入法、五笔字型输入法、二笔输入法、郑码输入法等,在台湾地区流行的输入法有注音输入法、呒虾米输入法和仓颉输入法等。②汉语语音识别输入。是最简便的汉字输入法。语音识别的基本原理是模式匹配,将语音输入的发音和事先建立的语音元素样本库进行比较,若满足匹配,则可予以识别。影响语音识别质量的主要因素是方言、情绪化发音以及环境噪声等,其最大困难是汉语中同音字多。21世纪10~20年代,汉语语音识别已经进入实际应用阶段。③汉字图形识别输入。人们分别就印刷体、手写印刷体和手写体3种类型的识别对象进行试验研究。其原理是输入的汉字图形或扫描的汉字图像,由计算机将其图形、图像转变成汉字的标准代码,通过和“识别特征库”的比较,找到特征最相似的字,提取该文字的标准代码。相似汉字、不规范的手写输入以及输入版面的复杂性是影响汉字图形识别技术的主要因素。汉字图形识别在识别率及识别速度方面已取得较好的结果。扫描图像、图像预处理以及识别后处理等方面的技术也都得到了深入研究,并取得了长足进展,印刷汉字识别系统的单字识别正确率已经超过95%。手写汉字识别技术已进入实用化阶段,智能手机、掌上电脑等移动信息设备都已经安装了手写汉字输入软件。

图1 五笔字型输入法图1 五笔字型输入法

图2 汉语语音识别输入图2 汉语语音识别输入

无论是键盘输入、图形输入还是语音输入方式,其实质都是把汉语情报从键盘或其他输入设备接收的输入码转换为机内码存储。现已提出数百种不同的汉字输入编码方案,但本质上都是建立汉字字符集与一个小的符号集合之间的对应关系,而这一小的符号集合应是标准键盘能容纳下的。按照建立对应关系所持依据的不同,编码方法一般可划分成3种类型:①按形分解。笔形码(八笔字型、五笔字型等)、三角码、仓颉码及宏观码等,均属此类。②按音分解。汉语拼音、紧缩汉语拼音及双拼等即是。③音形结合。“见字识码”为其代表。

对于汉语情报输入,使用者一般不拘于一种方法,大多数计算机设备均配有多种输入方式,以供使用者自由选择。以上各种汉语情报输入方式,在情报工作中均已被广泛采用。

  • 宋继华,杨尔弘,王强军.中文信息处理教程.北京:高等教育出版社,2011.
  • 蒋贤春,翟喜奎.计算机中文信息处理规范和应用指南.北京:国家图书馆出版社,2012.
  • 萧国政,何炎祥,孙茂松.中文计算技术与语言问题研究.北京:电子工业出版社,2007.

相关条目

阅读历史

    意见反馈

    提 交

    感谢您的反馈

    我们会尽快处理您的反馈!
    您可以进入个人中心的反馈栏目查看反馈详情。
    谢谢!