全国
成果
科易网>技术转让>技术列表>一种基于汉字基础部件的汉字象形码计算机输入法

一种基于汉字基础部件的汉字象形码计算机输入法

专利(申请号):ZL201310047935.0

专利类型:发明专利

技术成熟度:正在研发

所 在 地:辽宁本溪

最近更新:2017-12-22 15:29:23

行    业:电子信息-软件

价    格:

查看联系方式 立即评估该技术价值>>
一种基于汉字基础部件的汉字象形码计算机输入法0
    项目简介
    查看技术详细文件>>

      本发明提供一种基于汉字基础部件的汉字象形码计算机输入法,通过对汉字基础部件进行多字母编码,实现汉字整字输入。项目核心创新点:本发明采用逆向思维,不用拆分汉字而是将汉字整字通过汉字基础部件直接用多字母编码,即不是将汉字整字或汉字基础部件标注在计算机键盘的字母键位上的,而是把英文字母直接标注在汉字整字或汉字基础部件平面结构上,从某种意义上说这是把计算机的字母键直接标注在汉字平面结构上。本发明所述基于汉字基础部件的汉字象形码计算机输入法,突破了传统意义上的汉字编码规则,传统的汉字编码规则是把汉字标注在计算机字母键上。项目详细用途:广泛适用于文化领域:中文信息处理,语言文字研究,历史学,古汉语研究,考古研究及考古文字文献方面,金融,邮政,公安,交通,医疗,地名管理,户籍管理,并适用于普通计算机客户,作家,记者,新闻工作者,各大中小学的汉字汉语教学等,并且解决了汉字生僻字输入的难题,为输入汉字生僻字开辟了一条蹊径。预期效益说明:1、进入21世纪以后,随着我国信息产业的迅速发展,户籍、社保、银行、公安、交通等领域都在应用计算机存储信息,经常涉及人名,地名等汉字生僻字的输入问题,从我们国家目前的计算机输入法来说,至现在还没有一种输入法能解决汉字生僻字的输入问题,尤其我国是多民族的国家,方言各异,有很大一部分人很少学习汉语拼音的,不是他们不想学习汉语拼音,而是地方方言的传统难以说普通话、标准话,所以语言限制了他们。随着网络技术的迅速发展,现在电脑已经普及千家万户,人们在工作、学习、生活中时刻都离不开电脑,如股市交易、金融存储、水电费交付等都同样涉及到输入汉字生僻字的问题,所以有着简便快捷的汉字输入法的确是非常重要的,他能尽快解决人们在日常工作、生活中遇到的各种求知与困惑。众所周知,这样的人群不占少数,他们输入汉字非常困难,由于发音不准确的障碍,无形之中阻止了们上网学习的机会,影响到他们的工作效率与其爱好和兴趣。同样也影响着中国信息产业向深层次发展。

      目前国家政策要求身份证,手机、固话、购买车票、快递、邮政等一系列都要求实名制,现在因办理实名制、或落户口,由于自己的名字是生僻字输入不了,无奈就得改姓名,这样一来往返于老家要证实材料等等,给人们的日常生活带来诸多不便,经济、精力上的消耗,无形之中造成很大的资源浪费。   从目前市场状况分析:本发明在汉字编码技术领域中独一无二,独占鳌头。背景技术:自上世纪八十年代初,汉字输入法编码形成新的一大流派,并一直影响至今,这就是字根类编码汉字输入法,该法理论认为:成千上万的汉字都是由笔画组成字根,再由字根构成汉字的,因此只要把这些汉字的字根分析出来,再印到键上,一个字有哪几个字根就打哪几个键来组字就可以了,然而,这种编码自从诞生起也就与难学联系在一起了,形成所谓“好学的不好用,好用的不好学”这一瓶颈问题,为了寻找到即好学又好用的编码方案,各种汉字拆分方法的字根类编码方案纷至沓来,在这里,汉字的拆分工作在不同地区,不同系统中自发的进行,导致汉字拆分呈现五花八门、纷坛交错的结果,如一个“羊”字竟有五种不同的拆分方法,这种状况给汉字教学和汉字信息处理工作带来极大的不便,如果不对字根进行规范,语言文字的规范工作必然要受到冲击,汉字信息的传播和接受无论在速度上,还是在准确度上都会受到严重影响,为此国家部门在上世纪末把社会上流传的各种字根类统筹归并成汉字部件,并颁布《信息处理用GB13000.1字符集汉字部件规范》,于1998年5月1日实施。

      上述汉字基础部件规范的颁布,意味着字根类编码只能依托汉字部件,其它任何随意拆分汉字编码的行为将不能被国家部门认可,难以得到推广和普及,也不能进入中小学校。那么采用汉字部件能否研制出简单易学的编码方案吗?在GB13000.1字符集汉字部件规范中,总共有560个汉字部件,这是根据字源关系确定的,在这里很多独体字就是字源字,而很多字源字又结构比较大,也就是平均笔画比较多,这里称之为大部件,例如“垂、鬼、黑、黄、鹿、鼠、我、象、熏、庸、重”都是汉字大部件,这些大部件在汉字编码中也是不能再拆分的,而不再拆分这些大部件都只用一个字母编码,那么用哪个字母编码,人们怎样记忆,会产生多少重码,这些都成问题,那怎么解决呢?传统形码编码是这样解决的:虽然每个汉字部件都只对应一个字母,也就是一码,但汉字的码长还是可以调整的,例如对于固定为4键的编码方案,如果是部件字或部件数少于4个的字,为增加码长则用笔画码补充,相反对于部件数超过4个的字则舍弃多余部件,例如目前流行最广的五笔字形输入法就是这种模式。采用这种模式编码方案一般都有汉字部件在计算机键盘的分布图,印在纸上甚至镌刻在计算机键盘上。

      但上述这种模式编码方案并没能解决难学的问题,造成复杂原因有三:一是按字源关系记部件及部件对应的字母键,二是部件的舍弃规则,三是笔画的补充规则。在这里除了用汉字部件属性编码之外,又增加了汉字笔画属性编码,也就增加了学习难度。因此五笔字型输入法经三十多年的努力也没能达到普及程度。可以说到目前为止,还没有哪一种形码能够普及,也没能进入中小学校,因此直接采用汉字部件是不能研制出简单易学的编码方案,要突破这一瓶颈还需另辟蹊径。

      汉字部件是整字拆分的结果,(在这里不一一作详细分析了)汉字拆分的结果能够增加码长,如果不拆分汉字,而是采用从整字平面中直接分析出与字母有关联的笔画结构,然后再与字母对应并用字母表示,从而完成了整字的多字母编码,这同样也增加了码长,在这里,如果直接采用整字编码,因为汉字数量大,需要用很多时间来学习,那怎样来缩短学习时间呢?因为汉字的最小组字单位是汉字部件,汉字部件的总数要远远少于整字,因此只要在部件平面中直接分析出与字母有关联的笔画结构,然后再与字母对应并用字母表示,那么整字所含部件编码的组合,就是整字的多字母编码。

      本发明所述一种基于汉字基础部件的汉字象形码计算机输入法,属于创造性的发明专利,适用于社会需要,有广阔的领域、具有广阔的市场开发远景。在万码奔腾的编码大战中,多少有识之士日日夜夜努力奋斗、拼搏了十几年,浪费了多少资源,熬尽了一腔热血,有多少人已经为此付出了自己鲜活的生命。我们希望只要尽快的实施这一方案,才能彻底终止人为的这场大战。

      从历史学研究和古代文化探索方面以及考古研究古汉语的工作中,可以想象奋战在考古研究、从事历史文化研究的工作者,如果没有得心应手的计算机输入法,那工作起来真的是又累又辛苦,花费的时间、浪费的资源更是比比皆是,据我们所了解到的国家象这类的研究所为数不少,他们每天工作起来非常辛苦、劳累、他们还是用传统的而且古老的粘贴方法整理文献,用剪子裁剪下来,到字典里面一个一个字的对照,查找对比古文字,所以本发明所述一种基于汉字基础部件的汉字象形码计算机输入法,普及多个领域,汉字不论简单和繁体的都是见字识码,顺利输入,也是最适用于他们的工作,应用起来最省力,因为不用拆分汉字,汉字整字就可以编码,直接输入到计算机中,因而节省了大量的人力、物力,财力。这就是本发明一种基于汉字基础部件的汉字象形码计算机输入法的重要性。

      本发明所述一种基于汉字基础部件的汉字象形码计算机输入法,是全部由汉字基础部件形成的字符串,为全息输入法,具有递推联想和句处理功能,含20902字,(字库的字和词组的量有多少都能顺利输入),词组5—6万条,无论是单字还是词组计算机会根据汉字基础部件的字符串找到对应的汉字,然后组字或组词并输入,所以这种字符串的重码少,降低了学习难度,符合人们日常输入的习惯,从源头解决了输入汉字生僻字的难题。由于该输入法属于象形码在输入中难免会遇到不会写的汉字,因此该输入法设置了汉语拼音检索系统,在输入中凡遇到写不出的汉字,只要输入R键,就会按汉语拼音检索汉字。在熟练的掌握后就能达到见字识码的程度,尽管目前尚未颁布大字符集汉字基础部件标准,也可用这种方法对汉字整字编码。另外这种编码方法是按照国家标准,能把成人汉字输入法与中小学汉字输入法统一起来,所不同的只是中小学输入法所用的字库、汉字基础部件、词库相对要小些而已。本发明所述一种基于汉字基础部件的汉字象形码计算机输入法从某种意义上说也就是直接对汉字整字的多字母编码,属于见字识码,因此本发明输入法是传统形码部件的计算机输入法所不能取代的。2017年12月21日

    交易保障

    猜您感兴趣的

    Copyright © 2007-2018 科易网 版权所有
    运营商:厦门科易网科技有限公司