漢字輸入法專利技術(shù)競爭日益增大亟待重大突破
4月16日上午9時(shí),號(hào)稱“中國輸入法第一案”的搜狗起訴騰訊QQ拼音輸入法案在北京市第二中級(jí)人民法院第二次開庭審理。從數(shù)月之前 起訴開始,此案一直為社會(huì)廣泛關(guān)注,其中的重要原因之一是,該案涉及的是實(shí)現(xiàn)人機(jī)對話的重要工具——漢字輸入法技術(shù)。
王碼五筆、鄭碼五筆、極品五筆、智能ABC輸入法、搜狗拼音輸入法、騰訊QQ拼音輸入法……近30多年來,隨著電子計(jì)算機(jī)技術(shù)的快速發(fā)展和普及,從寥若晨星到繁花似錦,漢字編碼輸入法技術(shù)發(fā)展到今天可謂是百花齊放,百家爭鳴。
在漢字輸入法技術(shù)方面,由于市場利益之爭而引發(fā)糾紛的事件間有發(fā)生。從王碼專利訴訟、鄭碼專利糾紛、自然碼與T9輸入法的爭端,到近來的搜狗與騰訊拼音輸入法之爭,專利糾紛幾乎與漢字輸入法的發(fā)展相隨相伴,也在一定程度上擴(kuò)大了其知名度。
據(jù)不完全統(tǒng)計(jì),截至目前,已申請中國專利的漢字輸入法技術(shù)有上千種之多。在實(shí)用價(jià)值、潛在市場利益等因素驅(qū)動(dòng)下,漢字輸入法專利技術(shù)的競爭日趨激烈。但是,在對技術(shù)方法和技術(shù)路線的選擇上,業(yè)內(nèi)對漢字輸入法未來的發(fā)展走向一直存在爭議。
漢字輸入法進(jìn)入百家爭鳴時(shí)代
從20世紀(jì)70年代末開始,漢字輸入法技術(shù)隨著電子計(jì)算機(jī)的應(yīng)用和推廣而逐漸為人們所重視。
西方的文字由字母組成,而且其使用鍵盤打字機(jī)已有很長的歷史,因此計(jì)算機(jī)輸入沒有障礙。而漢字是方塊字,每個(gè)字都不同,而且中國人也沒有使用鍵盤的傳統(tǒng),因此計(jì)算機(jī)的漢字輸入問題成為計(jì)算機(jī)在中國普及和發(fā)展的一大門檻?!叭绻^不了漢字輸入這一關(guān),在信息時(shí)代不僅無法使用計(jì)算機(jī),而且漢字是否能繼續(xù)存在下去還是個(gè)未知數(shù)?!睗h字輸入法“五筆字型”專利技術(shù)發(fā)明人、北京王碼公司董事長王永民在接受中國知識(shí)產(chǎn)權(quán)報(bào)記者采訪時(shí)表示。
一項(xiàng)技術(shù)的發(fā)展,總是在不斷更新?lián)Q代中實(shí)現(xiàn),回首漢字輸入法技術(shù)的發(fā)展歷程也是如此。1978年,上海電工儀器研究所工程師支秉彝創(chuàng)造了一種“見字識(shí)碼”漢字輸入法,并被上海市電話局采用,從而率先使計(jì)算機(jī)的漢字輸入進(jìn)入了實(shí)用階段?!耙娮肿R(shí)碼”用26個(gè)拉丁字母進(jìn)行編碼,以4個(gè)拉丁字母表示一個(gè)漢字。這種編碼方案建立在字音和字形的雙重關(guān)系上,見字就能識(shí)碼、見字就能打碼,不必死記硬背。由于每個(gè)漢字的字碼是固定的,這就給計(jì)算機(jī)碼的存儲(chǔ)和軟件的應(yīng)用帶來很大方便。這種編碼曾得到一定程度的應(yīng)用,為建立中文計(jì)算機(jī)網(wǎng)絡(luò)和數(shù)據(jù)庫打開了大門,并使建立在電子計(jì)算機(jī)基礎(chǔ)上的照相、排版、印刷的自動(dòng)化得以實(shí)現(xiàn)。
在業(yè)界眾多專家看來,漢字輸入法的發(fā)展經(jīng)歷了3個(gè)階段。第一階段從1978年開始,針對計(jì)算機(jī)信息輸入的數(shù)以千計(jì)的漢字編碼方案相繼問世,這一階段產(chǎn)生的漢字編碼方案增加了詞組、聯(lián)想等功能,輸入方式以詞為主,大大提高了輸入速度。
第二階段是從1995年開始,智能化輸入技術(shù)取得很大進(jìn)展,并出現(xiàn)了一些成果。智能化輸入技術(shù),只需將欲錄入的漢字轉(zhuǎn)換成漢語拼音,然后逐字連貫地輸入由拼音組成的序列,系統(tǒng)則會(huì)一一排除同音字的干擾,在屏幕上顯示出要表達(dá)的漢字,實(shí)現(xiàn)整句輸入。如人名和地名一經(jīng)“提醒”,就能“記憶”起來,并能存儲(chǔ)用戶的每一次糾正。原來由人記憶的大部分內(nèi)容都改為由計(jì)算機(jī)來承擔(dān),使其有學(xué)習(xí)、記憶和判斷的功能。在這期間,從字、詞輸入,到實(shí)現(xiàn)整句輸入,一個(gè)漢字的平均擊鍵次數(shù)為兩次左右。有人做過這樣的比較,同樣內(nèi)容的文本,中文輸入比英文輸入要少擊鍵30%左右,也就是說,同樣的擊鍵速度,中文的錄入速度要比英文快。另外,在語音輸入、手寫體輸入等方面,這些年也取得了一定的成績,識(shí)別率也達(dá)到了相當(dāng)高的水平,但目前它們還只是計(jì)算機(jī)漢字輸入的一些輔助手段。從語音識(shí)別、文字識(shí)別、機(jī)器翻譯、語義理解等方面的研究水平及其目前已投放市場的產(chǎn)品來看,都離人們所期望的目標(biāo)相差甚遠(yuǎn)。
第三階段,即目前不斷優(yōu)化的階段,亟需可將不同漢字輸入法的優(yōu)勢集于一身的輸入方法,尚處于探索中。
盡管漢字輸入方案眾多,但能夠被廣大用戶所接受、得到普遍推廣的只有為數(shù)不多的幾種。一項(xiàng)專門對輸入法使用者的調(diào)查顯示,五筆字型輸入法使用者為51%,雙拼輸入法使用者占32%,全拼輸入法使用者為24%,其他大多數(shù)輸入法的使用者不超過10%。這充分表明,影響廣泛、為業(yè)界普遍公認(rèn)并真正達(dá)到普及的漢字輸入法,是由王永民發(fā)明的“五筆字型”輸入法。1984年9月,五筆字型漢字編碼輸入法在聯(lián)合國做操作演示,達(dá)到每分鐘輸入120個(gè)字的速度,每個(gè)漢字及詞組的輸入最多需4鍵。從此,計(jì)算機(jī)的漢字輸入問題得到了有效解決。此后,漢字輸入技術(shù)的發(fā)展越來越快,但都是利用西文電腦鍵盤為漢字編制代碼,輸入代碼就相應(yīng)完成了漢字的輸入。
隨著計(jì)算機(jī)技術(shù)的發(fā)展,越來越多的發(fā)明人投入到漢字輸入法技術(shù)的研發(fā)中來,一時(shí)間“萬碼奔騰”,為漢字輸入法技術(shù)的研發(fā)增添了活力,也使該技術(shù)得到了快速發(fā)展,極大方便了信息時(shí)代的社會(huì)需求。1983年“五筆字型”輸入法問世,1987年“智能ABC”輸入法誕生,分別奠定了形碼和聲碼的基礎(chǔ)。
近年來,隨著計(jì)算機(jī)技術(shù)的普及、集成電路的大規(guī)模應(yīng)用,微型電腦、手機(jī)等小巧、方便的電子設(shè)備逐漸走進(jìn)大眾,因此,漢字輸入法的需求也有了新的變化,社會(huì)呼喚著適應(yīng)這一新變化的漢字輸入法的出現(xiàn)。許許多多的研發(fā)者對此進(jìn)行了不懈的探索。以王永民為例,他在“五筆字型”輸入法的基礎(chǔ)上,推出了“數(shù)字王碼”,只需0到9十個(gè)數(shù)字,就可實(shí)現(xiàn)漢字輸入,為手機(jī)等微型設(shè)備的漢字快速輸入提供了新的途徑。此外,他歷時(shí)6年、投入1000多萬元資金最新研發(fā)的“大一統(tǒng)五筆字型”不僅包含和覆蓋以前的3種五筆字型,還新增了25項(xiàng)新功能,可輸入2.7533萬個(gè)簡體和繁體漢字,成為目前常見的高級(jí)五筆字型軟件。尤其值得驕傲和自豪的是,“五筆字型”被授予2007年度國家技術(shù)發(fā)明獎(jiǎng),這是在我國近千種漢字編碼技術(shù)中,唯一獲得國家技術(shù)發(fā)明獎(jiǎng)的輸入法技術(shù)。
相關(guān)專利技術(shù)亟待重大突破
從1985年4月1日提交第一件漢字輸入法技術(shù)中國專利申請以來,漢字輸入法技術(shù)專利申請多年來一直呈現(xiàn)快速增長態(tài)勢。
4月30日,記者在國家知識(shí)產(chǎn)權(quán)局官方網(wǎng)站的“專利檢索”系統(tǒng)中,以“漢字輸入法”為檢索詞,檢索到與漢字輸入有關(guān)的專利申請1031件,其中發(fā)明專利1020件、實(shí)用新型專利8件、外觀設(shè)計(jì)專利3件。
這上千件的漢字輸入法專利技術(shù),主要可分為形碼、聲碼和形聲碼,以及少量的手寫板輸入法、語音輸入法。五筆字型就是形碼,它把漢字分解為若干字根,分別由字母代表;聲碼則是根據(jù)漢語拼音制作的編碼,如搜狗和騰訊QQ拼音輸入法都屬于這一類;形聲碼是把形碼和聲碼的特點(diǎn)結(jié)合起來,將字根轉(zhuǎn)換成拼音進(jìn)行編碼。此外,手寫板輸入法雖然使用容易,但因?yàn)檩斎胨俣嚷?,推廣較為緩慢;而語音輸入法對地域遼闊、方言眾多的我國來說,也還有很多尚待解決的問題。因此,目前使用較為普遍的是以“五筆字型”輸入法為代表的形碼和以拼音輸入法為代表的聲碼編碼輸入法。
原最高人民法院副院長李國光認(rèn)為,把漢字編碼方法與該編碼方法所使用的特定鍵盤相結(jié)合,作為計(jì)算機(jī)系統(tǒng)處理漢字的一種計(jì)算機(jī)漢字輸入方法或者計(jì)算機(jī)漢字信息處理方法,使原來不能運(yùn)行中文漢字的公知計(jì)算機(jī)系統(tǒng)能夠以漢字信息為指令,產(chǎn)生出若干新的功能,以至能實(shí)現(xiàn)生產(chǎn)過程的自動(dòng)化控制或者辦公系統(tǒng)的自動(dòng)化管理,那么,這種計(jì)算機(jī)漢字輸入方法或者計(jì)算機(jī)漢字信息處理方法屬于可給予專利保護(hù)的客體。對于這種由漢字編碼方法與該編碼方法所使用的特定鍵盤相結(jié)合而構(gòu)成的計(jì)算機(jī)漢字輸入方法的發(fā)明專利申請,在說明書及權(quán)利要求書中應(yīng)當(dāng)描述該漢字輸入方法的技術(shù)特征,必要時(shí),還應(yīng)當(dāng)描述該輸入方法所使用鍵盤的技術(shù)特征,包括該鍵盤中對各鍵位的定義以及各鍵位在該鍵盤中的位置等。
翻閱這些專利技術(shù)文獻(xiàn),記者發(fā)現(xiàn)其呈現(xiàn)出幾個(gè)顯著的特點(diǎn),即申請人基本來自國內(nèi),且個(gè)人申請占有絕對比例,近10年來的申請量顯著高于以往,而且同期對手機(jī)的漢字輸入法技術(shù)專利申請量占有比例逐漸增多。例如,專利申請?zhí)枮?6101649.3的“一種將漢字輸入計(jì)算機(jī)的方法”說明摘要為:是用0至9十個(gè)阿拉伯?dāng)?shù)字分別代表漢字的十類特征筆形;按照從上到下、從左至右、從外向內(nèi)的采碼順序,對漢字進(jìn)行直接編碼,編制出由1至6個(gè)數(shù)字組成的數(shù)碼,然后用計(jì)算機(jī)鍵盤上0至9的數(shù)字鍵輸入計(jì)算機(jī)。本發(fā)明的編碼方法直觀、簡單、十分易學(xué),且重碼率在2%以下。本漢字輸入法只用數(shù)字鍵輸入漢字,既便于盲打,也利于計(jì)算機(jī)的微型化。
有關(guān)專家認(rèn)為,從已申請專利的漢字輸入法技術(shù)來看,我國漢字輸入法中,具備較強(qiáng)的基礎(chǔ)理論的為數(shù)不多,雖然專利申請的數(shù)量較多,但近似的技術(shù)方案不少,這也是導(dǎo)致糾紛的根源之一。同時(shí),由于很多技術(shù)方案的優(yōu)勢與缺點(diǎn)都較為明顯,所以很多方法成為來去匆匆、曇花一現(xiàn)的“過客”。
時(shí)至今日,漢字輸入法技術(shù)專利申請的創(chuàng)造性要求也在“水漲船高”。1990年申請的一件名稱為“普及型六筆二維漢字編碼及鍵盤”的發(fā)明專利申請經(jīng)實(shí)質(zhì)審查,在1993年3月由國家知識(shí)產(chǎn)權(quán)局專利局作出了駁回決定。駁回理由為,該申請盡管與現(xiàn)有技術(shù)相比,采用筆畫數(shù)不同,字根數(shù)量不同,以及其他某些形式上的區(qū)別,但與現(xiàn)有技術(shù)相比不具有突出的實(shí)質(zhì)性特點(diǎn)。之后,申請人向國家知識(shí)產(chǎn)權(quán)局專利復(fù)審委員會(huì)提出復(fù)審請求。1998年,經(jīng)過修改后的權(quán)利要求書滿足了有關(guān)要求,在國家知識(shí)產(chǎn)權(quán)局專利復(fù)審委員會(huì)支持下,該專利最終被授權(quán)。
有關(guān)專家認(rèn)為,隨著計(jì)算機(jī)漢字輸入方法的發(fā)展,其發(fā)明目的早已不僅僅是為了能夠利用計(jì)算機(jī)實(shí)現(xiàn)漢字的輸入及處理,而是為了能夠優(yōu)化拆字規(guī)則和輸入步驟,合理分配鍵位,從而達(dá)到易學(xué)易記、輸入快捷高效、重字率較低的技術(shù)效果,因此與對待其他類型的發(fā)明專利申請一樣,一項(xiàng)計(jì)算機(jī)漢字輸入方法發(fā)明相對于現(xiàn)有技術(shù)是否取得了上述方面的預(yù)料不到的技術(shù)效果也是創(chuàng)造性判斷中的一項(xiàng)輔助性判斷基準(zhǔn)。
2001年,在由中國工程院主辦的“20世紀(jì)我國重大工程技術(shù)成就”評選中,共評出了25項(xiàng)重大工程技術(shù)成就,包括漢字輸入法技術(shù)在內(nèi)的“漢字信息處理與印刷革命” 僅次于“兩彈一星”,居第二位?!皾h字輸入法填平了中國人使用計(jì)算機(jī)的技術(shù)鴻溝。”中國工程院院士、中國中文信息學(xué)會(huì)理事長倪光南在接受中國知識(shí)產(chǎn)權(quán)報(bào)記者采訪時(shí)表示,在上世紀(jì)60年代到70年代,計(jì)算機(jī)和漢字之間橫著一條鴻溝;到了上世紀(jì)80年代到90年代,這個(gè)問題基本上得到了解決;現(xiàn)在,計(jì)算機(jī)和漢字之間的鴻溝已經(jīng)填平,計(jì)算機(jī)處理漢字就像處理拼音文字一樣方便。如今,計(jì)算機(jī)進(jìn)入了中國的千家萬戶,成為人人都可使用的工具,倪光南認(rèn)為,漢字處理在其中發(fā)揮了重要的作用。
截至今年3月底,我國已有7.8億手機(jī)用戶,但80%以上的手機(jī)嵌入的漢字輸入技術(shù)都是國外的技術(shù)和專利,每年國產(chǎn)手機(jī)為此支付的專利費(fèi)高達(dá)數(shù)億元。據(jù)業(yè)內(nèi)人士介紹,這些技術(shù)主要為美國的T輸入法和加拿大的Z輸入法,國產(chǎn)輸入法市場占有率不足20%。究其原因,主要是一種漢字輸入法技術(shù)要從專利走向市場,需要數(shù)百萬乃至數(shù)千萬的費(fèi)用投入,而國內(nèi)的技術(shù)發(fā)明人一般都沒有這個(gè)實(shí)力;此外,國內(nèi)的專利風(fēng)險(xiǎn)投資機(jī)制尚未完全建立。專家認(rèn)為,從目前的市場情況來看,假如將發(fā)展?jié)h字輸入法按純商業(yè)模式去運(yùn)作,以盈利為唯一目的,將很難有大的成就,在一定程度上,還需要有關(guān)部門給予支持。
漢字輸入法創(chuàng)新在爭議中前行
與任何學(xué)術(shù)研究一樣,漢字輸入法在研發(fā)十分活躍、為使用者帶來極大便利的同時(shí),對于其發(fā)展方向的爭議也不可避免。
王永民認(rèn)為,漢字不能走拼音化道路。他解釋說,“拼音輸入法”,實(shí)際上正裹挾著漢字在“拼音化道路”的迷途上前行。這是一個(gè)值得各界警惕的新動(dòng)向?!捌匆糨斎敕ā彪m源于“漢語拼音方案”,但兩者不是一個(gè)概念?!皾h語拼音方案”的貫徹,為推廣普通話、規(guī)范統(tǒng)一漢字的讀音,發(fā)揮了劃時(shí)代的作用。然而,漢字和漢語拼音的“主-輔”關(guān)系是早有定論的。而且,“拼音輸入”的錯(cuò)誤率是“字形輸入”的9倍。在數(shù)字方式的字形編碼輸入法、查字法研究成功并達(dá)到實(shí)用化程度的今天,我們必須大講特講“拼音輸入法”危及漢字生命的嚴(yán)重性,必須大力強(qiáng)調(diào)和重點(diǎn)推廣那些科學(xué)實(shí)用、符合規(guī)范、依照“字形”和“筆畫”編碼的漢字輸入法,將“拼音輸入法”逐步淡而化之,至少不能使之愈演愈烈。無論在字母鍵上或在數(shù)字鍵上,均應(yīng)大力提倡“形碼輸入”,使其成為主流。他建議,“形碼輸入”應(yīng)當(dāng)成為中小學(xué)生的基礎(chǔ)素質(zhì)和必備技能,應(yīng)當(dāng)盡快將依照字形對漢字編碼的輸入法和檢索查字法,納入中小學(xué)和對境外漢語教育的基礎(chǔ)教學(xué)之中,使人們每輸入一個(gè)字,每查一個(gè)字,就等于鞏固一次書寫。
而國家語言文字工作委員會(huì)原主任許嘉璐認(rèn)為,漢字輸入法研究起點(diǎn)要高,要避免在低層次上投入力量,比如對基于拆分漢字的鍵盤輸入編碼方案的發(fā)明、研制可以止矣,用不了多久就可望解決的智能化漢語拼音輸入方法,說不定將獨(dú)霸天下,一般鍵盤編碼輸入方法將逐漸科學(xué)地、有說服力地被淘汰。
當(dāng)然,其中也不乏一些中和的觀點(diǎn)。國家智能計(jì)算機(jī)中心的一位專家認(rèn)為,中國計(jì)算機(jī)用戶最缺的就是好的漢字輸入方法?,F(xiàn)在看來,筆畫輸入、語音輸入、容錯(cuò)拼音流中任何一項(xiàng)技術(shù)的突破性進(jìn)展,都會(huì)對人機(jī)界面的自然語言化產(chǎn)生深遠(yuǎn)的影響。
語言文字是社會(huì)交流的工具。中國是世界文明發(fā)源地之一。其他文明發(fā)源地的文字,如兩河流域蘇美爾人的楔形文字、尼羅河流域古埃及的圣書字、美洲的瑪雅文字,都已成為歷史的陳跡。唯獨(dú)中國的漢字“長生不老”,青春永在。在6000多年時(shí)間里,漢字的演變過程經(jīng)歷了聲、形、象、數(shù)、理5個(gè)階段的變化,從甲骨文、金文到篆、隸、楷、行書,每一次都是一次劃時(shí)代的革命,推動(dòng)著社會(huì)、經(jīng)濟(jì)和文明的發(fā)展。
目前,互聯(lián)網(wǎng)已成為人們生活、工作、學(xué)習(xí)不可或缺的工具,正對社會(huì)生活的方方面面產(chǎn)生深刻影響。電子商務(wù)、網(wǎng)絡(luò)廣告、網(wǎng)絡(luò)游戲、搜索引擎等互聯(lián)網(wǎng)產(chǎn)業(yè)市場規(guī)模同比增長均超過20%,而這一切都離不開漢字輸入技術(shù)。4月22日,工業(yè)和信息化部發(fā)布的數(shù)據(jù)顯示,截至今年一季度末,中國互聯(lián)網(wǎng)網(wǎng)民網(wǎng)民總數(shù)達(dá)到4.04億人,中國社交網(wǎng)站的用戶群達(dá)到1.91億人,如此眾多的人們,幾乎每時(shí)每刻都在進(jìn)行著人機(jī)對話,能夠?qū)崿F(xiàn)對話的,還是漢字輸入技術(shù)。正因如此,漢字輸入技術(shù)的發(fā)展始終牽掛著眾多的人心,牽動(dòng)著產(chǎn)業(yè)的神經(jīng),伴隨著文明的脈搏在躍動(dòng)。
“漢字輸入法是一項(xiàng)偉大的發(fā)明?!蹦吖饽险J(rèn)為,它推動(dòng)了計(jì)算機(jī)產(chǎn)業(yè)體系的發(fā)展。只要大力增強(qiáng)自主創(chuàng)新能力,中國一定能建立自主的計(jì)算機(jī)產(chǎn)業(yè)體系,中國計(jì)算機(jī)學(xué)科和產(chǎn)業(yè)將會(huì)在世界上占有一席之地。倪光南指出,實(shí)踐將會(huì)證明,中國能夠做價(jià)廉物美的高技術(shù)產(chǎn)品,而且是基于自主的核心技術(shù)和知識(shí)產(chǎn)權(quán)。
本文相關(guān)信息
- [新聞資訊] 韓學(xué)松:工程機(jī)械企業(yè)確立自主品牌乃當(dāng)務(wù)之急
- [新聞資訊] 美國西南研究院期待同玉柴攜手
- [新聞資訊] 韓學(xué)松:工程機(jī)械去年增速7%
- [新聞資訊] 韓元利市長在玉柴調(diào)研時(shí)強(qiáng)調(diào)強(qiáng)柴興玉
- [新聞資訊] 漢產(chǎn)機(jī)床獲科技進(jìn)步獎(jiǎng)
- [新聞資訊] 漢德車橋:辯證看待金融危機(jī)與國際化問題
- [新聞資訊] 漢德公司全面開展降成本工作
- [有關(guān)專業(yè)] 漢諾威工業(yè)展 研祥展示最新技術(shù)與產(chǎn)品
- [新聞資訊] 漢諾威農(nóng)機(jī)展將于11月舉行
- [有關(guān)專業(yè)] 漢鐘精機(jī)螺桿式壓縮機(jī)技術(shù)居全球前列