由于不同书写者书写汉字的差异,脱机手写汉字识别成为最困难的汉字识别问题。
中国学者从20世纪80年代就开始了脱机手写汉字识别的研究。传统的脱机手写汉字识别包含字符图像的预处理、特征提取、字符分类三个阶段。脱机手写汉字识别分为规则书写汉字识别和自由书写汉字识别。
规则书写汉字指基本保持横平竖直笔画的汉字,自由书写汉字包括自由连笔草书的汉字。脱机手写汉字识别在相当长时间内采取结构分析方法,但往往是无效的。取得成效的是采取统计模式识别方法,即从基元的笔画微结构出发,利用统计的全局信息进行统计判决和识别,基本解决了规则手写汉字识别问题,识别率达98%以上,在一定程度上也可以识别自由手写汉字。
随着计算机计算能力的飞速发展,深度卷积神经网络在脱机手写汉字识别中展现出了惊人的性能。在国际文档识别大会(Internal Conference on Document Analysis and Recognition; ICDAR)举行的脱机手写汉字识别竞赛中,基于深度卷积神经网络的方法曾取得了第一名的成绩,甚至有研究者将识别结果提高到接近人工识别的正确率。