输入法
基本解释
输入法是指为了将各种符号输入计算机或其他设备(如手机)而采用的编码方法。汉字输入的编码方法,基本上都是采用将音、形、义与特定的键相联系,再根据不同汉字进行组合来完成汉字的输入的。
详细解释
简介
英文字母只有26个,它们对应着键盘上的26个字母,所以,对于英文而言是不存在什么输入法的。
汉字的字数有几万个,它们和键盘是没有任何对应关系的,但为了向电脑中输入汉字,我们必须将汉字拆成更小的部件,并将这些部件与键盘上的键产生某种联系,才能使我们通过键盘按照某种规律输入汉字,这就是汉字编码。汉字编码方案已经有数百种,其中在电脑上已经运行的就有几十种,作为一种图形文字,汉字是由字的音、形、义来共同表达的,汉字输入的编码方法,基本上都是采用将音、形、义与特定的键相联系,再根据不同汉字进行组合来完成汉字的输入的。
输入法的需求是来源于键盘的限度。键盘原在打字机时代为英文字母而设计,但键盘只有一百来键,在没有软件的帮助下它是无法输入中文或其他大型形意文字的语言。
产生背景
不同语言、国家、或地区,有多种不同的输入法。
现在世界上,多数的输入法软件是为汉语,韩语,和日语而设计。
*汉语有上万字,必须使用特别方式输入汉字。
*朝鲜语使用大量的谚文。虽然谚文是字母系统,但是它字母组合很特别,也需要一种转换系统。而且,朝鲜语有许多的汉字借词,偶尔需用汉字来分别同音词。
*日语使用两种假名字母文字和汉字。虽然大多软件和键盘都支持假名输入,但是人们普遍都用日语罗马字来拼写输入日文,无论是输入假名还是汉字。
除了这三种语言,其它需求输入法的语言不是很普遍。这也是有种种原因,像历史,经济,政治、环境等等。拿越南语作比方,虽然越南语不是一种汉藏语系语言,历史上,越南文人是用汉字来拼写自己的语言。这拼写方式叫喃字。但是在二十世纪初,殖民越南的法国建立了教育系统,用拉丁文拼写越南语替换了喃字。
虽然输入法由于速度不适合用于来输入字母文字,但是输入法系统还是可以搭配的。在UNIX系统里,SCIM输入法平台可以让用户输入自己键盘不支持的字母,像添加附加符号的字母。
发展历程
中文输入法
1983年王永民先生推出五笔字型输入法
从1981年国家标准局发布《信息交换用汉字编码字符集基本集》GB2312-80以来,27年中汉字输入法经历了从无到有,从难到易,从简单到智能的巨大演变过程,回顾它的发展历程,我们可以一窥整个个人电脑在国内的发展史。
第一阶段:电脑中可以输入汉字了 代表输入法:五笔字型输入法:电脑在中国普及,第一个急需要解决的问题就是,如何将汉字输入到电脑中,为此国家1981年发布了GB2312-80,1983年,王永民先生推出了划时代的五笔字型输入法,五笔输入法不但可以让我们输入汉字,而且也极大的解决了输入速度这一顽症。90年代初五笔输入法的热度,大家可以从日常生活中体会到一些,比如遍地开花的电脑培训学校把五笔输入法当成重点课程,你可以依靠对五笔输入法的熟练程度,轻松找到一份不错的文职工作,甚至可以开间打字社……,由此可见五笔输入法在当时是多么的重要。
第二阶段:人人皆可输入 代表输入法:智能ABC和中文之星新拼音:五笔输入法解决了汉字输入的问题,且输入速度也很快,从而盛行一
时。但很快随着电脑用户的越来越多,强背字根、入门难的先天问题越来越突显出来了,更多的人需要一款使用简单,入门轻松的输入法来代替五笔输入法。这个时候,1991年由长城集团与北京大学合作推出的智能ABC汉字输入法的出现以及中文之星推出的新拼音解决了这一问题。它入门简单只要会拼音就能上手,而且带有简单的联想和记忆功能,这些特点,让它很快得到了初级用户的喜爱,尤其是在Windows系统将智能ABC内置,成为系统默认安装输入法之一后,使用它的用户越来越多。
第三阶段:效率不再只是五笔的代言词 智能拼音横空出世 代表输入法:微软拼音、拼音之星和紫光拼音:五笔入门较难,但输入效率快,智能ABC入门简单,但输入效率不高。如何做到两全其美呢?即入门简单又可以保证输入效率的输入法在众多呼声中出现了,这种输入法入门简单(会拼音即可),且能保持较高的输入速度(全拼联想、庞大词库、简拼等诸多功能极大的提高了输入效率),又采用了一定的智能处理能力,能支持短语甚至语句输入,极大地方便了用户。这时期的代表有微软拼音输入法、紫光拼音、拼音之星、拼音加加、智能狂拼、自然码和黑马神拼等,都是中文输入领域经典之作。
第四阶段:与搜索引擎结合输入法呈现新的生机 代表输入法:搜狗和谷歌拼音输入法:随着几大互联网门户的介入,中文输入法领域在2007年左右出现了重大变化,搜狗、谷歌和腾讯陆续推出了拼音输入法,这些输入法的特点是结合搜索引擎功能,将搜索引擎得到的关键词搜索数据添加到输入法中,满足了互联网时代新词热词输入的准确性。这些门户网站的输入法善于吸收紫光拼音、拼音加加、拼音之星和微软拼音等一些长项,升级版本迅速,加上输入界面漂亮新颖,并允许用户上传皮肤和词语库,用户体验较好,一时间,不少智能ABC用户转投此类输入法。这个时期的后起之秀有搜狗拼音输入法、谷歌拼音、QQ拼音,而紫光拼音、拼音之星、拼音加加等经典输入法在这之后也相继更新升级,得到发扬光大,一时间中文输入法呈现出一派勃勃生机。
互联网时代的在线输入和绿色输入
词库同步:目前一些互联网公司根据互联网新词变化多、发展快的特点,陆续开发了基于网站服务器在线更新词库以及用户词库同步上传到服务器的功能,进一步加快了热词、新词的更新,这方面的代表有谷歌拼音输入法、QQ输入法和搜狗输入法。但这一类输入法这个功能带来了几个问题,一是网络更新造成用户机器输入反应变慢,有用户抱怨一开机系统就经常更新,希望不要那么频繁更新与同步;二是用户担心隐私泄漏,毕竟输入法写的东西有不少是用户的私人东西,上传的话,担心信息外传,即使到了互联网公司的机器里,也难以担心不泄漏;三是用户机器上输入法可能越来越庞大,占用资源更多。(全国人大代表方滨兴:防止信息泄密慎用在线更新输入法[1])
绿色输入:在这种情况下,有开发者推出了免安装的绿色版本输入法,体积小,智能化程度高,占用资源少,不需要安装还免除了改写注册表的烦恼,也防止了实时更新信息泄漏。这样的绿色输入法,通常有基于IME方式需要修改注册表的准绿色输入法,如拼音加加绿色版本,还有基于外挂方式的真正意义上的完全免安装的绿色版本,如基于拼音之星6.5A系列版本开发的拼音之星绿色输入法。
在线输入:另外一些公司推出了针对网页进行输入的online输入法或云输入法,特点也是免安装,但只能连上互联网才能使用,一般来说只能在网页中使用,目前速度比较慢,功能比较单一,只能在输入少量汉字的环境中。这一类输入法还在探索发展之中。
火星文输入法
输入法的前三个发展阶段,都是针对汉字的输入方式和速度方面进行改进优化,不过随着网络的高速发展,汉字的作用正在慢慢转变,越来越多的人输入文字不再只是为了工作,更多的是为了交流、展现自我。网络这个大舞台,让原本少人问津的生僻字、古文字,甚至各种符号有了表现平台。新时代需求下,以上只能输入文字的常规输入法,对这些需求已经无能为力。为此,不只可输入文字,对生僻字、古文字、火星字以及各类符号同样支持的新一代输入法孕育而生了,常见的火星文输入法算是其中做的最为出色的一款,它解析了输入法其实不只能输入文字。
输入法一路走来,大概经历了以上四个发展阶段,我们可以看出,每个阶段的发展原动力都是出于对用户的需求满足为出发点,如今,整个输入法领域可谓百花齐放,大家都在为更快更简单更全面的输入法目标迈进。
输入设备
根据输入设备的不同,输入方式又分为键盘、手写、语音等等。键盘输入是最基础的计算机输入方式。
手写识别借着计算机的认字功能,由使用者的手写字体来辩别中文字或其它符号。语音识别使用话筒和语音识别软件来辩别中文字。由于技术难度和设备的不普遍,这两种输入方式都还未成熟。
编辑器
在英语里,“输入法”(InputMethod)指的是输入方式而不是所实现它的软件。早期,英语像中文没有区分这两概念。由于微软Windows操作系统的影响,输入法软件被称为“输入法编辑”器(InputMethodEditor)。在中国地区,一般还是用“输入法”表达这两个不同的概念。有少数人用“输入软件”或“输入系统”。
分类
键盘输入法
目前的键盘输入法种类繁多,而且新的输入法不断涌现,各种输入法各有各的特点,各有各的优势。随着各种输入法版本的
更新,其功能越来越强。目前的中文输入法有以下几类:
1.对应码(流水码):这种输入方法以各种编码表作为输入依据,因为每个汉字只有一个编码,所以重码率几乎为零,效率高,可以高速盲打,但缺点是需要的记忆量极大,而且没有什么太多的规律可言。
常见的流水码有区位码、电报码、内码等,一个编码对应一个汉字。
这种方法适用于某些专业人员,比如,电报员、通讯员等。但在电脑中输入汉字时,这类输入法已经基本淘汰,只是作为一种辅助输入法,主要用于输入某些特殊符号。
2.音码:这类输入法,是按照拼音规定来进行输入汉字的,不需要特殊记忆,符合人的思维习惯,只要会拼音就可以输入汉字。但拼音输入法也有缺点:一是同音字太多,重码率高,输入效率低;二是对用户的发音要求较高;三是难于处理不识的生字。某些拼音输入法虽然有满足南方音的容错码设计,但目前主流拼音是立足于义务教育的拼音知识、汉字知识和普通话水平之上,所以对使用者普通话和识字及拼音水平的提高有促进作用。拼音定型输入法通过分词连打,分化定型同音字、词等手段,可以彻底解决重码问题。
3.形码:形码是按汉字的字形(笔画、部首)来进行编码的。汉字是由许多相对独立的基本部分组成的,例如,“好”字是由“女”和“子”组成,“助”字是由“且”和“力”组成,这里的“女”“子”“且”“力”在汉字编码中称为字根或字元。形码是一种将字根或笔划规定为基本的输入编码,再由这些编码组合成汉字的输入方法。
4.音形码:音形码吸取了音码和形码的优点,将二者混合使用。
自然码(其实就是一种双拼,而且是实际上的标准双拼方案)是目前比较常用的一种混合码。这种输入法以音码为主,以形码作为可选辅助编码,而且其形码采用“切音”法,解决了不认识的汉字输入问题。自然码6.0增强版,保持了原有的优秀功能,新增加的多环境、多内码、多方案、多词库等功能大大提高了输入速度和输入性能。
拼音之星输入法的谭码(双拼+偏旁,双拼编码可以由用户定义)输入方式,第一个实现了音形码整句输入,新版拼音之星6.6以上版本还实现了不用切换和控制键,即可利用辅助码进行语句和字词输入功能。
这种输入法的特点是速度较快,又不需要专门培训。适合于对打字速度有些要求的非专业打字人员使用,如记者、作家等。相对于音码和形码,音形码使用的人还比较少。
混合输入法(其实是软件实现的,而不能称为一种输入法):为了提高输入效率,某些汉字系统结合了一些智能化的功能,同时采用音、形、义多途径输入。还有很多智能输入法把拼音输入法和某种形码输入法结合起来,使一种输入法中包含多种输入方法。
非键盘输入法
非键盘输入方式无非是手写、听、听写、读听写等方式。但由于组合不同、品牌不同形成林林总总的产品,分为下面几类:手写笔、语音识别、手写加语音识别、手写语音识别加OCR扫描阅读器。
1.手写输入法:手写输入法是一种笔式环境下的手写中文识别输入法,符合中国人用笔写字的习惯,只要在手写板上按平常的习惯写字,电脑就能将其识别显示出来。
手写输入法需要配套的硬件手写板,在配套的手写板上用笔(可以是任何类型的硬笔)来书写录入汉字,不仅方便、快捷,而且错字率也比较低。用鼠标在指定区域内也可以写出字来,只是鼠标操作要求非常熟练。
2.语音输入法:语音输入法,顾名思义,是将声音通过话筒转换成文字的一种输入方法。语音识别以IBM推出的ViaVoice为代表,国内则推出Dutty++语音识别系统、天信语音识别系统、世音通语音识别系统等。
3.OCR简介:OCR,叫做光学字符识别技术,它要求首先把要输入的文稿通过扫描仪转化为图形才能识别,所以,扫描仪是必须的,而且原稿的印刷质量越高,识别的准确率就越高,一般最好是印刷体的文字,比如图书、杂志等,如果原稿的纸张较薄,那么有可能在扫描时纸张背面的图形、文字也透射过来,干扰最后的识别效果。
OCR软件种类比较多,常用的比如清华OCR,在系统对图形进行识别后,系统会把不能肯定的字符标记出来,让用户自行修改。
4.混合输入法:手写加语音识别的输入法有汉王听写、蒙恬听写王系统等,慧笔、紫光笔等也添加了这种功能。
语言分类
中文输入法
中文输入法是指为了将汉字输入计算机或手机等电子设备而采用的编码方法,是中文信息处理的重要技术。中文输入法从
1980年代发展起来的,中间为几个阶段:单字输入、词语输入、整句输入。对于中文输入法的要求是以单字输入为基础达到全面覆盖;以词语输入为主干达到快速易用;整句输入还处于发展之中。目前较流行的中文输入法有:搜狗拼音输入法、谷歌拼音输入法、紫光拼音、拼音加加、黑马神拼、王玛五笔、智能五笔、万能五笔、注音输入法、粤语拼音输入法、仓颉输入法、行列输入法、呒虾米输入法、大易输入法、部首输入法、笔划输入法等。 发展历程:由于汉字有数以万计,电脑键盘不可能为每一个汉字而造一个按键。因此,人们需要替汉字编输入码(检索出汉字的代码),用数个键来输入一个汉字。
中文输入法的发展过程,是“万码奔腾”的过程,在20年间出现了上千种编码方法。
汉语拼音输入法:汉语拼音输入法是利用汉字的读音(汉语拼音)进行输入的一类中文输入法。拼音输入法有几种输入方案包括全拼和双拼。市场上有许多用拼音作基础的输入软件。首先,大部分的现代操作系统都跟随着一副汉语拼音输入法,如内建于WindowsXP的智能ABC和微软拼音。其他商业拼音输入产品有:紫光拼音、拼音加加、拼音之星、智能狂拼、黑马神拼、南极星字词拼音、搜狗拼音输入法、谷歌拼音输入法等等。
五笔字型输入法:五笔字型输入法是王永民在1983年8月发明的一种汉字输入法。汉字编码的方案很多,但基本依据都是汉字的读音和字形两种属性。五笔字型完全依据笔画和字形特征对汉字进行编码,是典型的“形码”。五笔字型输入法在使用简体中文的地区较广泛,是这些地区最常用的形码输入法。 仓颉输入法:仓颉输入法,是由台湾人朱邦复于1976年所创制的中文输入法,最初只有繁体中文版本,原名“形意检字法”,用以解决电脑输入汉字的问题。1978年由前国防部长蒋纬国将军重新定名为“仓颉输入法”。
行列输入法:发明者为台湾人廖明德,他曾任职发展倚天中文系统的倚天资讯,行列输入法免费授权给海峡两岸的中文电脑厂商,附在各系统中,让使用者可以免费使用。
多编码混合输入法:汉字的输入过程中,除了汉字本身具有五笔、拼音等多种输入方法以外,还要考虑操作系统汉字编码环境问题,通常有unicode、国标GB2312、扩展国标码GBK以及台湾香港地区的大五码BIG5,在这样的环境中,汉字的编码是不一样的,为了兼顾这些环境,除了开发出针对不同编码的输入法以外,还有一类输入法可以同时兼顾GB/GBK和BIG5的情况,比如拼音之星输入法、万能五笔等,都同时具有支持大陆和台湾编码的功能,这个功能在诸如GB/GBK等中文环境下玩台湾香港BIG5游戏(或者在台湾中文环境下玩GBK游戏)、以及需要编码转换的环境中就显得得心应手,避免了出现汉字显示乱码以及对方或者应用程序不认识的情况。
这个情况要与简体、繁体区分开来。国标GB/GBK中文环境下,有简体和繁体,但台湾香港的大五码BIG5下面就都是繁体,这两者的繁体字看似写法和显示大致相同,但汉字的编码是不一样的,所以碰到需要真正BIG5代码的繁体用户一定注意选择相匹配的输入法,否则显示和输出就会出现乱码的现象。
日文输入法
日文输入法是指为了将日语输入电脑或手提电话等设备而采用的编码方法。日文输入法主要被设计成基于平假名(读音)的转换系统,而此也衍生出两种输入方法:通过输入罗马字来转换成平假名或直接输入平假名,后者需要先记忆平假名的键盘分布,所以两种方法也不乏使用者。也有部分软件采用GUI选字方式甚至支援手写模式作为辅助。 日文键盘:日本工业规格(JIS)有对日文键盘上的假名的排放位置有作规定。在日本销售的键盘,大部分都是QWERTY键盘。QWERTY在日文键盘对应着以下假名:たていすかん(TaTeISuKaN')
特殊键钮:因为日语输入是基于平假名的,输入完整的日语还需要转换汉字,片假名以及普通的英语字符,标点符号。所以日文键盘上会多了几个特殊按钮。普通键盘没有的按钮,可以通过按下其他组合键来模拟(例如:Ctrl+CapsLock切换为平假名,Alt+CapsLock切换为片假名)。
手提电话:手提电话的键盘较电脑少,所以必须另外研发出一套完全不同的输入方法。
手机输入法
手机输入法,即用手机在编写短信息或是电话簿等项目中用到的输入方式。手机输入法可分为英文输入法和中文输入法等各语言种类的输入法。同时,中文中又有区分为汉语拼音输入法、注意输入法、笔画输入法、字形输入法等等。手机输入法目前主要有:T9智能输入法、字能输入法、iTAP输入法、搜狗手机输入法、讯输入法S60数字键版、能手机输入法积木式汉字输入法、首输入法手机版、拟手写手机中文输入法、lumSIP (梅花输入法) 、字五笔中文输入系统、码手机输入法、nSun 1.2 手机输入法、意10键输入法(ppc版)、笔输入系统、意中文整句输入法、中文之星掌上狂拼输入法等。
三足鼎立之势:从硬件的角度出发,手机的输入技术大致可划分为数字键盘、字母键盘、手写输入等几个方向。相对于字母键盘以及手写输入方式,目前最为成熟、用户最经常使用的当属数字键盘输入法。在数字键盘输入法领域,无论从用户数量还是从影响力上来看,T9智能输入法、字能输入法和iTAP输入法都占据了主流地位。同时,三种输入法在具有高效输入这一共性的同时,也因各有千秋而吸引着不同的用户,形成了各自的市场和发展空间。
T9智能输入法是针对移动小终端的文字输入解决方案,以输入字符高效快捷而著称。T9可应用于42种语言,支持基于繁体和简体中文输入,以及基于声码的拼音和注音文字输入。世界上有近300款手机预装了T9智能输入法,目前T9占据了全球80%的市场份额。字能输入法具有20902个汉字的高容量字库,是T9输入法字库的两倍多,而这也是其相对于T9输入法最大的优势。目前该输入法主要被爱立信的早期机型、阿尔卡特以及一些国产手机所采用。iTAP输入法则是摩托罗拉的专利。摩托罗拉不断地对iTAP输入法的字库进行更新,具有支持更多种语言的优势。但由于iTAP是在T9的基础上发展起来的,因此在输入的算法方面与T9基本相似,而在笔画输入上则支持倒插笔。
相关事件
因输入法而对薄公堂事件
2009年11月16日两大IT巨头搜狐和腾讯,为了一个小小的输入法软件闹上法庭。庭上,双方就虚假宣传、恶意阻止、干预排序等三个焦点问题展开了激烈的争论。由于双方都不接受调解,北京市二中院宣布择日宣判。
该案主要的原告、被告分别为搜狐旗下子公司北京搜狗科技发展有限公司(以下简称“搜狗公司”)、深圳市腾讯计算机系统有限公司(以下简称“腾讯公司”)。搜狗公司称,腾讯公司提供的“QQ拼音输入法”软件服务业务,破坏原告运营的“搜狗拼音输入法”软件服务,实施了不正当竞争行为,因此要求被告赔偿经济损失2000万元以及相关费用。腾讯公司则对此断然否认。
对这一案件,网友们的态度明显分化。有网友表示力挺腾讯公司:“支持腾讯,腾讯是至今我见到的最伟大的公司,是最有可能超越微软公司一统互联网江湖的霸主。”有网友则持反对意见:“腾讯一向就是看人家推出什么软件受欢迎了,它也紧跟着推出,没有什么自己的东西,就靠模仿!”
双方激辩三大焦点
焦点1:是否引入虚假宣传
搜狗公司认为,被告腾讯公司在其网站上宣称 “QQ拼音输入法最快、最准、最干净”、“速度最快,占用系统资源最小,利用最好的算法,最少的损耗,达到最优的性能”、“包含最新最全的流行词汇,不仅仅适合任何场合使用,而且是最适合聊天软件和其他互联网应用中使用的输入法”等,“片面夸大了自己在行业内的地位”,“给原告造成了巨大的经济损失。 ”
而腾讯公司表示,IT和互联网行业发展快、创新多、从业人员年纪轻等特点决定业内多数企业都是采用这样的宣传方式,“原告和原告的母公司搜狐公司的宣传方式中都是使用该方式进行宣传”,例如,关联公司搜狐公司称搜狐网是“中国最大的门户网站”,搜狐网站称“搜狐公司为中国互联网第一品牌,中国搜索引擎的鼻祖,中国互联网文化运动的先驱,中国综合门户网站的创始者,中文世界最大的网络资产,拥有最先进的搜索引擎——搜狗”。
焦点2: 是否恶意阻止对方软件
搜狗公司认为:“被告在用户下载、使用‘QQ拼音输入法’软件的同时,采取诱导、欺骗的方法,利用其破坏性技术手段直接删除网络用户终端的‘搜狗拼音输入法’软件的快捷方式,恶意阻止了网络用户同时使用 ‘搜狗拼音输入法’软件。 ”
而腾讯公司则表示:“QQ输入法设置向导仅仅是为用户设置了一种管理系统输入法的快捷方式,原告指控的这一行为实质上是用户根据设置向导的提示自己选择的结果。 ”
焦点3: 是否人为干预自然排序
搜狗公司认为:“在用户选择同时使用 ‘搜狗拼音输入法’软件、‘QQ拼音输入法’软件的情况下,被告腾讯公司利用其破坏性技术手段将网络用户终端的各种输入法快捷方式的自然排序进行人为干预,使‘搜狗拼音输入法’软件的快捷方式的排序位置始终处于 ‘QQ拼音输入法’之后。 ”
而腾讯公司则称:“输入法安装过程中实际遵循的规则是:后安装者排第一”;“‘QQ拼音输入法’并非故意压制‘搜狗输入法’。 ”另外,腾讯公司还特别指出:“先安装‘QQ拼音输入法’,再安装‘搜狗拼音输入法’,搜狗自动也会排在第一位。
方滨兴:慎用在线更新输入法
全国人大代表、北京邮电大学校长方滨兴曾担任国家计算机网络与信息安全管理中心名誉主任,被誉为中国国家防火墙(GFW)之父。2010年3月6日,方滨兴就网络安全问题接受了记者专访。
方滨兴提的第二个建议就是慎用在线输入法。包括谷歌、搜狗在内的在线更新输入法是可以泄密的。网民输入完以后,一个字、一个词、一句话都会被记录下来,尤其是常打的词、常用的词会更新上传给别人。这是一种变相的泄密渠道,会导致自己信息的不安全。