本网以宣传国情国力、关注民生民意为宗旨,为基层提供学习交流、信息咨询服务,系全国信息资讯服务类门户网。
编辑:朱小姐 投稿邮箱:gqdtck@163.com
中国国情在线

汉字的偏旁笔画编码--吴敢

浏览:231 发布时间:2012-02-20 10:36

 

汉字的偏旁笔画编码

 


一、 汉字编码具有世界意义

汉字进入了联合国,已经成为全世界人民通用的文字信息之一。因此,汉字输入计算机技术,就是中国走向世界,世界走向中国,中国与世界接轨的工具和纽带之一。可以说,文字信息技术的研究,具有国际意义。

追溯历史,世界上有五大文明古国,而流传至今的,仍为13亿多中国人广泛应用的,唯独只有汉字一种,这说明汉字具有独特的魅力,说明汉字的构字用字具有独到的规律性。汉字具有五千多年的悠久历史,计算机只有六十多年的现代经历,因此,汉字输入计算机技术,就是中国古老文化与现代科学技术的接口。可以说,研究汉字编码就是创造一种文明。

现时的汉字编码形形色色,一个手机就是一种编码,太多,虽是好现象,但太乱。据说联合国早就要求中国提供一种编码,虽然中国也提供了五种编码,但至今仍未采纳一个,仍然是空白。对于外国人,学习汉字的困难太多太大。时代给全人类(包括中国人和外国人)提出了一个光荣而艰巨的任务:尽早地创造出一种简便而统一的汉字标准码。发明专利《汉字的偏旁笔画编码》有望成为这种国际标准码。

发明专利申请《汉字的偏旁笔画编码》201012月经国家发改委、科技部认定列入了建国以来第5个国家级的《国家重点新产品计划》(总共96个新产品),并刊登在国家发改委中国经贸导刊的《国家重点高新技术项目汇编》第93页上..

中国行业企业信息发布中心于20114月对本编码作了《投资价值分析报告》,指出本专利价值分析值为123010万元。

二、编码简介

从本质上看,只有笔画组合的汉字编码才有可能具有最简单性。本编码中的孤笔码、二笔码、是最简单的一、二笔画组合;区别码实质上属两笔画组合;字根则是多笔画(315个笔画)组合。故从本质上看本编码最简单。本编码只用26个偏旁(即字根)及孤笔码、二笔码就能把所有汉字输入电脑(或计算机),且打字的方法步骤(编码规则)只有3条,最简单。

本编码收编了所有简化字和所有繁体字的编码,总共60387个。收编最全面,适用范围最广,还适用于今后新创造的汉字。60387,它填补了中国和全世界的一个空白

本编码依据三本字典:《康熙字典》、《中华字典》(梁启超编)、《现代汉语词典》;还依据中国文字改革委员会、文化部、教育部于196437颁发的《关于简化字的联合通知》;本编码收编的汉字全部采用印刷宋体字,新字形。故本编码最规范

虽然汉字千姿万态,但经研究后发现:汉字的结构呈现共同的固有特征,汉字的千姿万态具有一定的变化规律。从汉字结构上看,汉字可分为二部分:固定不变的偏旁部首部分和千姿万态的笔画组合部分。一方面,偏旁部首是汉字的共同特征,表示汉字的共性。偏旁部首的应用,充分体现了中国人民的聪明智慧!另一方面,汉字的千姿万态体现在五种笔画(点横竖撇折)不同的排列组合上,它表示汉字的变化部分,是汉字的特殊个性。五种笔画的排列组合充分体现了中华民族高超的应变能力!26个字根就是《康熙字典》中213个偏旁部首的典型代表,其构字组码能力最强:包含字根的汉字50866个,占总编码字数的84.2%;组合码(两笔码、孤笔码)就是对汉字千姿万态的高度概括;区别码则是对汉字编码充分必要的补充和延伸。字根、组合码、区别码之间,通过编码规则巧妙地排列组合,就构成了千姿万态的汉字的全部编码。综上所述可知:按汉字的偏旁笔画进行编码,完全符合汉字的构字特征,完全反映了汉字的变化规律。因此,本编码最有规律性

字根表划分为26个区位,每个区位仅一个字根,最少26个字根分别与26个英语字母一一对应、互为替身,它是汉语与英语的接口,更是汉字信息(偏旁)进入计算机的接口意义深远。如果在电脑的英文字母鍵上贴印相应的字根,或在生产制造电脑键盘时,在英文字母键上铸印相应的字根,则打字者可不背记字根表。

汉字的折笔画有11种之多,会产生大量重码。本编码根据一定的特点和变化规律,将折笔画一分为五类;又将通常的三类字型分解为五类。使笔画数、字型数与字根表的区位数完全相符,从而更有利于编码,还减少了大量重码。

本编码根据偏旁部首(字根)或笔画组合(即组合码),按汉字书写顺序拆分汉字,完全符合汉字的构字规律,故本编码的汉字拆分方法最简便,一目了然,可大大提高打字速度。

对于六万之多的汉字编码,其它编码必将产生数不胜数的重码;本编码的重码率每字4时少于5%最少。决定重码率最少的因素有:区别码、字根、字根表、组合码、折笔画一分为五、编码规则、等等。

本编码收编了所有简化字和所有繁体字的编码,总共六万之多。所有简化字和所有繁体字,是指《现代汉语词典》中所有的汉字(约8千多个)和《康熙字典》中所有的汉字(约4万多个)。尤其是,根据国务院三部委联合颁发的《关于简化字的联合通知》,可作简化偏旁部首的一共有146个。据此,在《康熙字典》中尚未编入《现代汉语词典》的繁体字,应同样简化的简化字(约1万多个)也全部收编了。例如:《康熙字典》中鳥字旁的字846个,《现代汉语词典》中鸟字旁的字120个,两者相差726个。这726个应简化而所有字典和所有文献尚未收编的简化字,等等,本编码也全部收编了。它填补了中国和世界的又一个空白,也是历史上第一次对汉字进行系统地和全面地整理,可谓史无前例

本编码属形码,避免了读音困难。故便于中国少数民族和全人类的应用、普及和推广。

本编码不足之处:区别码3个,稍多;但区别码实质上是二笔码,简单、易学、易用。

三、市场前景

本编码已被国家发改委、科技部认定列入了96个《国家重点新产品计划》之一。

中国行业企业信息发布中心的《投资价值分析报告》的专利价值分析值为123010万元。

本编码填补了中国和世界的空白。本编码总共34万字,是无价之宝。

将本编码生产成计算机软件,全世界的计算机电脑手机都不得不采用它,是一本万利。


注:

《汉字的偏旁笔画编码》的《投资价值分析报告》

 

中国行业企业信息发布中心于20114月对吴敢的发明专利申请《汉字的偏旁笔画编码》(以下简称编码)作了签章的《投资价值分析报告》(以下简称报告)。该《报告》共分8章,57页。

该《报告》在摘要中指出:“该编码开创了简单而统一的汉字标准码的先河,且该编码具有简单、全面、规范、规律性强等诸多优点,填补了国内尚无此产品的空白,商机巨大,市场潜力无限。”(参见第3页)

该《报告》在摘要中还指出:“本报告对该专利产品所作的投资分析显示:其专利价值分析值为123010万元,投资者在将本专利购买后投入到项目企业时,投资总额为123810万元,静态投资回收期为2.96年,财务净现值为315647.20万元,财务内部收益率为40%。(本报告中本位币为人民币)”(参见第3页)。

  《报告》指出了《编码》的科技含金量(要点简摘)有7大点(参见第34页)。《编码》填补了国内、外的空白。

  《编码》具有三高:科技含金量高,商业价值高,社会价值高。



《汉字的偏旁笔画编码》被国家发改委、科技部列为《国家重点新产品计划》

 

    国家发展和改革委员会、国家科学技术部于201012月将吴敢的发明专利申请《汉字的偏旁笔画编码》经认定列入了《国家重点新产品计划》(总共96个新产品),并刊登在国家发改委中国经贸导刊《国家重点高新技术项目汇编》(以下简称汇编)上(参见汇编第93页)。汇编卷首语指出:“本书汇集了1986年以来在科学研究方面取得重大突破、为我国高新技术产业作出重大贡献的重点项目及成果”。

   国家重点新产品规划,是继星火计划、国家863计划、火矩计划、973计划之后第5个国家级科技计划(参见汇编卷首语),“是国家科技计划体系中政策引导类计划的重要组成部分”,是“经科学技术部认定列入国家重点新产品计划的新产品项目”(参见汇编第53页)。

   汇编跋指出:“经过筛选,本汇编所刊登的项目均具有一定的市场前景和投资价值”。


参考文献:《国家重点高新技术项目汇编》, 国家发展和改革委员会中国经贸导刊杂志社        201101月出版。


作者介绍:

吴敢,男,1940年生。19638月毕业于华中师范大学物理系本科。19659月加入中国共产党。现在湖北第二师范学院物理系任教,副教授。曾任物理系教工党支部书记,物理系力热教研室主任。曾讲授热学、统计物理、固体物理、近代物理、概率统计、计算机原理、汉字输入技术等课程。中国物理学会会员,全国教育学院热学及热统学会理事。

1982年编写教育学院用《热学》教学大纲(4人合编)。19879月由陕西人民出版社出版发行《分子物理学及热力学》,高等学校教材。1988年被国家教委聘为全国中学教师专业合格证书《热学》考试命题组长。

曾发表论文十几篇(代表作:《麦克斯韦速度分布律的几种证明方法》,发表在《大学物理》1989年第12期)。出版专著两部(代表作:《五笔字型编码速查字典》,科学普及出版社1996年出版发行)。曾获科研奖多次。

发明专利《汉字的偏旁笔画编码》的专利申请号:200710053278.5;专利公开号:CN101393546A;已被国家发改委、国家科技部认定列入了《国家重点新产品计划》。

版权声明:
中国国情在线所提供的文章、图片等内容均为用户发布或互联网整理而来,仅供学习参考,如有侵犯您的版权,请联系:gqdtck@163.com,我们将在3日内删除。