据了解,1994年编纂的《中华字海》,收录汉字约87000个,而我们手机、电脑能打出来的字,仅有3万个左右。
为什么会出现这种情况呢?
工信部电子标准院主任黄姗姗向TechWeb等表示,汉字与英语不同,英语是表音文字,汉字是表意(图形)文字。信息系统要认识汉字,需要有字、形和编码三者建立对照表,某个汉字有形无码,或者其编码不被某个系统支持,就是信息时代的生僻字。
可以说,生僻字是表意字所特有的信息处理问题。具体来看,汉字信息处理的难点来自四个方面:
一是汉字信息化编码难度高。汉字与拉丁文字一样,需要一字一形一码,要对数万个汉字逐一进行编码、整理和考证工作,难度很高。
二是字形规范化工作量大。每个汉字都有其独特的字形,确定每个字的规范字形并设计开发字库产品,也费时费力。
三是生僻字标准化专业复杂。尚有大量人名、地名生僻字未收录于标准,没有获得编码,也就难以实现输入、处理和输出。
四是产品对标准的支持不充分。很多信息技术产品和服务系统只支持2万多字,忽视生僻字处理的需求。
要用电脑打出一个汉字,需要有对应且全国统一的汉字编码——对应的字形——输入法支持该汉字的输入——系统或应用支持该汉字的显示,四个步骤中任何一环掉链子,都无法完成数字化。
nià姓村民何时能找回自己的姓?
由于“鸭”姓无法寄托“nià”姓的真正含义,现在当地的小孩出生后基本都跟妈妈姓。有“nià”姓村民在得知自己的姓氏登上热搜后有些欣喜,也许能找到一个合适的解决办法。
为解决这个难题,腾讯搜狗输入法真的想出了办法,尝试用一个键盘和一个小程序来帮助“nià”姓村民找回自己的姓氏。
1.生僻字小程序
对于没有编码的生僻字,要从头开始,首先要做的是找到它们。所以,腾讯和工信部电子工业标准化研究院共同发布了“生僻字征集”小程序,用户通过拍照上传,就可以提交。
据腾讯输入法部总经理鲁剑披露,4月20日“生僻字征集”小程序上线后,首日访问量突破63万,用户提交生僻字1404个。
大家提交的生僻字将经过考证、审查、赋码等一系列环节,专业审核通过的生僻字将被赋码并收录进国标字库,并最终实现在电脑、手机等设备及信息系统中输入与显示。
2.生僻字键盘
针对已有编码的文字,或是用户只识生僻字字形、不知读音的情况,腾讯搜狗输入法开发上线了“生僻字键盘”,通过拆解字形实现三种生僻字输入方式,包括笔画输入、拼音输入,以及“拼音+笔画”的混合输入。
同时,腾讯搜狗输入法还与字库厂商合作,将已编码的文字设计成字体包,供用户下载使用。用户就可以用搜狗输入法打出生僻字,并在