03.08 <小白上樓梯——自制輸入法>系列的想法與提綱

為什麼要叫小白上樓梯,是被幼兒園的兒歌給洗腦了,小白小白上樓梯,打開電視機,電視不好看,關掉電視機……

不經意間想想,其實編程,也像極了學上樓梯的小朋友,一點一點地,趔趄著往上。等到了樓上,會發現,不過如此嘛,當初的各種畏懼心理也會一掃而空,成為自己內化了的成長與經驗。


<小白上樓梯——自制輸入法>系列的想法與提綱

小白小白上樓梯……

緣起

很多年以前,為了能在暑假打小霸王遊戲機,找老爸說是要學打字,買之,哈哈。

後來,學了五筆,因為喜歡折騰的性格,總是覺得用過的一些五筆輸入法不夠香,直到自己開始蒐集碼錶,開始各種折騰。

五筆,先向王永民先生致敬,真的是很偉大的發明。大概經歷了三代的變化,從85年的86五筆,算是第一代五筆,到98五筆(第二代),06五筆(第三代)。86五筆用的人最多,曾一度成為計算機課堂的重要章節。而五筆的編碼方式,也經過一代代地升級之後變得更加簡單直觀,所以在06五筆前後,為了能更好的支持GB18030的全部字符,對86五筆的編碼方案也做了一個修正,產生了WB-18030的86版五筆的修正方案,為了以前86版五筆的老用戶無差異地使用,加入了容錯碼,比如像=wqj(亻勹日)=wqk(亻勹口),其實,老86的版本里面是沒有wqk這個編碼的,而WB-18030標準版本中,是正確的編碼。然而,快速被拼音輸入法所代替的五筆輸入法,很多開發輸入法的公司,將它給放棄了,就算過個好幾年,象徵性地更新一下,詞庫內容卻一直沒有去更新維護。

直到有一天,發現了Google的在線輸入,裡面有五筆,居然還有容錯碼,居然還有提示,真香。

費了九牛二虎之力,拿到了從a-yyyy的所有請求的返回值,經過簡單地替換加工之後,掛在別的輸入法裡面用了起來,效果不錯。下文為下載碼錶的大概過程,在後面的文章裡,我會將提到的一些細節,小的知識點分解開來,展示出來。

<小白上樓梯——自制輸入法>系列的想法與提綱

加油

用一張本地網頁,完成碼錶的收集

其實很簡單的思路,在網頁中將ajax請求到的數據放入一個數組中,然後將在頁面上將數組顯示出來就好了,旁邊準備好一個文本文檔,拿到一些,保存一些。經過漫長的重複與等待。也算拿到了比較完整的“碼錶”了。

用帶有正則表達式的文本編輯器完成碼錶的整理

一句話解釋就是,替換掉一些無用的信息,只保留自己需要的關鍵條目就好了,比如`aa 式`這樣子的簡單碼錶。一個編輯器,底線要求是能夠輕鬆,隨心地完成一些文本的處理,支持正則表達式。正則表達式,在我認為也是人類很神奇的一個發明,能帶來很多很多的便利。

Excel其實很強大

比如`vlookup`函數、if函數、排序、篩選幾個功能,幫我解決了很多平時遇到的一些小困難。

學習Python,用代碼表達自己的想法

有一個笑話講雪糕與冰箱的故事:

<code>            # 有一天雪糕和冰箱吵架了,雪糕離開了冰箱,
# 在路上,她越來越後悔,她發現自己在慢慢融化,
# 而且流了很多水,於是她只好回去找冰箱,
# 冰箱哼了哼,打開了門,“上來,自己凍”/<code>

做為一個足夠想偷懶的人類,一定會想著各種法子,讓電腦、程序、機器人幫我們完成那些需要重複並且精密的工作。

使用python下載碼錶、找出裡面有用的容錯碼信息、完成排序、最後輸出一個完整的完整的詞庫,是不是聽起來有點爽?

首先,得有臺電腦,再安裝個Python,瞭解python的基本語法,會使用到循環,列表的操作,函數怎樣定義,以及調用函數傳參的各種方式,導入並使用一些神奇的庫,如何發送請求到一個網址,如何讓一個請求被服務器當成是正常通過瀏覽器訪問的,文件的讀寫,還可能會用到線程、進程

或者,電腦沒有情況下,手機上面如何運行Python程序。

享受過程與成果,見證自己的成長

碼錶做好之後,便是享受收穫的時刻了,可以直接掛在別的輸入法裡面使用;或者自己動手生成一個完全屬於自己的個性化的輸入法:使用PS做圖標出來,再做出自己獨特的輸入法皮膚。完完全全地體驗一把真香定律。

動手模仿才是真正的捷徑

嗯,是一句廢話。


分享到:


相關文章: