我們能否建立以漢字為主體的計算機語言、漢語為主體的計算機網絡環境?

海藍天長


一天學會五筆輸入法

製作這個五筆輸入法視頻,是因為網上很多人在問:"拼音輸入法很流行,五筆輸入法淘汰了嗎?"

我想說五筆輸入法不僅不會淘汰,而且會隨著網絡信息化的發展,會變的越來越流行。視頻中講解的”什麼是字根“,用”七色板“的”七個色板“來比喻”五筆輸入法“中的”字根“,直接演示在”智能五筆輸入法狀態“下如何在”本人自編的五筆口訣中找到相應字根“,然後輸入到電腦上。

特別演示了大家都認為很難的”識別碼“是如何打出來的,相信看了視頻的朋友們,會覺得比看"識別碼的解釋文章"要更簡單了。

先來了解一下什麼是字根,我們拿七巧板作個比喻,七色板小朋友都玩過。正方形的七巧板是由7個色板組成,有三角形,有平形四邊形,有正方形等。七色板下面就有四個圖,有兔子,有小狗,有農夫。你看看“兔子”是由三角形和正方形等拼成;“小狗”也是由三角形和正方形等拼成;“農夫”也是由三角形和正方形等拼成。

那麼很簡單,“兔子”、“小狗”和“農夫”,它們都是不同的圖形,但它們有一些共同點就是:它們的形狀,都有相同的“三角形”和“正方形”等組成,那麼我們就把“三角形”和“正方形”等看作“兔子、小狗和農夫”圖形的“零部件”吧。那麼三角形、平形四邊形、正方形等就是“七色板”的七個零部件。

我們也可換個概念說:這些三角形、平形四邊形、正方形等就相當於“七色板”的字根。因為這些三角形、平形四邊形、正方形可以組成不同的圖形。那麼我們“字根”的意思了也就相當於這個“七色板”裡的三角形、平形四邊或者正方形等。

而這個“七色板”只有7塊,我們就當作7個字根吧,但是在五筆輸入法裡面有一百多個字根,這一百多個字根可以拼成不同的漢字,那麼這些“字根”就是“拼成漢字的基本零件”。

“字根”就是這意思,也就是說:“七巧板”只允許有七個部件來拼成不同的圖形,那麼我們“字根表有一百多個字根”,也就是允許你在“一百多個字根”裡挑出“幾個字根”,然後找到“挑出來的這幾個字根”所對應的“字母鍵”組成“五筆編碼”,來打出“想要的漢字”。“字根”就是這意思,就是漢字的組成單位,也就是說“字根”在我們“五筆輸入法”裡是組成漢字的“基本單位”。

更多內容請觀看視頻講解,一天就可以學會五筆輸入法的理論和方法了。


1338675145


狹隘的民族主義。計算機的本質是數學。數學的所有符號體系方便和簡化了數學的表達,使全世界的數學家有了共通的語言,統一的符號語言才使數學有了現在的發展。

等你們琢磨出一套漢字體系的計算機科學,結果必然是閉關鎖國,自絕於世,一落千丈。世界上其他國家的計算機科學早就在不斷的溝通交流中長足進步,騰飛了。

科學技術不需要民族主義,技術要的是發展,要的是實用!

你們怎麼不考慮在物理化學中使用中文,比如水分子,要寫成氫貳氧,硫酸寫成氫貳硫氧肆?

這種愛國,這種民族主義只會使我們再次倒退100年!


omg43


完全可行,雖然會有一定難度,想用漢字作為一種全新的編程語言,編寫操作系統和做相應cpu指令集、架構等,必須對現在的計算機架構,做出顛覆性的變革。

現在計算機架構,自計算機在美國誕生之初,採用的是二進制,計算邏輯、存儲方式、指令編寫等等核心,到現在都沒有什麼改變,只是集成度高、處理速度大幅提升。



基於這些,為了更方便計算機的編程學習,從彙編、Basic、Pascal、C、C++、Java、Python等編程語言不斷的發展,但編程的核心思想並沒有太大的變化,美國的二進制計算機標準一統全球后,世界上就很少人去做些基礎研究了,包括操作系統、高級語言等。大學的計算機課程:操作系統、計算機結構,基本上還在用二十年前的教材。


不破不立!

<strong>

想用漢字作為一種全新的編程語言,必須重新編寫操作系統和做相應cpu指令集、架構等,可以設想如下研究方向:


1、 所有的漢字可以濃縮成300個標準的漢字圖形組合而成,而300個漢字圖圖形可以濃成30個基礎的漢字圖形基礎代碼,再把這些代碼變成一個一個標準的指令集。


2、 拋棄二進制架構,採用三進制計算機(前蘇聯有過樣機),對於計算速度大幅提升、存儲空間擴展、增加邏輯判斷選項等有極大的好處,這種架構更適合中文漢字的思考方式。


3、 現在的計算機判斷只有是與否,不太適合人腦思維,也就是說現在所說的人工智能其實只是大數據的統計、分類、關聯、比對及判斷預測,沒有真正的人腦學習能力,真正的人工智能,應該像人腦一樣思考,對外界物體的認知有三種判斷狀態:是、否、未知,通過自我學習,把未知變成明確的認知判斷。


4、 漢字的優勢,包括機器人腦模擬、機器學習、語音識別、圖像識別及神經網絡等優勢,可以形成有統一、標準、高效、共享的代碼庫及指令集。


5、 解放程序員的手,通過語音來編程,通過接收語音指令,給出最優代碼模塊,實現所要功能,漢字語音指令相對英語語音會更有效率及優勢。


6、 未來是物聯網、人工智能、神經網絡等萬物互聯的世界,這些對網絡安全的要求非常高,漢字密匙優勢也遠遠超出英文,二維碼是明碼,而漢字三維碼則是帶密匙信息碼,承載的信息量也會遠遠超過二維碼。


7、 5G物聯網時代即將來臨,信息流動及交互的速度與效率極大的提升,漢字的優勢會變得極為明顯,對於教育而言,最大的顛覆:改變知識獲取的渠道方式及知識(信息)的表達形式。因為,不再有平臺的概念,不管是社交平臺還是教育平臺等,未來5G物聯網時代,現實當中的每個人,每個物體都會是網絡的節點,人與人的交流、人與物的聯繫、物與物的關聯,不需要通過某一平臺去實現,因為節點就是面,面即平臺。對於教育行業而言,信息與知識的節點是漢字,每個漢字都可以瞬間組合成立體知識平臺,組合出關聯的字、詞、句、詩、文、即時信息及從古到今的關聯古物及歷史事件,使知識的廣度及深度同時呈現。




.

.


【專注說文解字、快速識字、K12全語文、海外漢語,漢字創新思維、漢字國學、解字古詩文】

漢字師認證課程,讓你成為一名合格的漢字老師、一名漢字啟蒙師!

想了解詳情,關注本號,私信留言 “99

想 瞭解《人字學習法》,私信留言:“


漢字谷主


在五筆輸入法發明之前,全世界都認為漢字不適合計算機輸入。甚至提出放棄漢字,以便中國能更快更好的追趕高科技。

漢字對於其它文字就是三維對二維的區別。漢字的複雜性,如果仍舊用二維思維去使用,就無法解釋和正確使用漢字。

總是有人說漢字的不確定性,比如好字的不同讀音,就有不同的的意思。這會讓二維思維的人或現在計算機抓狂。但是大家有沒有發現,中國發展到現在,只要是合格的中學生都能讀懂古文,而且對其中的不同讀音的字,也不會誤解。這也說明了漢字的傳承性,可靠性和簡潔性。

相反,英文這方面完全無法和中文對比,現在的高中生也無法讀懂幾百年前的著作。而且如果不學習,估計幾年後的文章都讀不懂。

說英文佔字節少的,可以試試搜索最長的英語單詞。

漢字是最符合人類特性的,相反計算機對什麼都量化了。哪怕是一個遊戲,都可以看出二維的思維,就是一屬性對比。當然有人會說這是科學。但是現實中以弱勝強的例子比比皆是。這就不科學了嗎?

所以以漢字為主體計算機系統沒有建立,不是漢字不行,是人類還沒有達到這種高度。

現在講AI,我個人認為只要採用二維方式,就不能稱之為智能,只是模仿加大數據,只要計算機不能理解好字不同讀音的不同意思,就不能稱之為智能。

真正的智能估計要漢字化計算機才能實現。


簡單而不簡略


完全可以,就是要有耐心,要有幹細活,幹瑣碎活的心態,

現代計算機是建立在二極管,門電路,硬件基礎上得二進制數學代碼體系。

0,1,之上,是26鍵,是英語字母縮寫的函數名

要改不是很難,

26鍵,用漢語拼音,直接從底層函數做,與門AND,或門OR,非門NO,改成yu,huo,fei,正弦,餘弦,正切,都改用漢拼,或漢拼簡寫,

漢字字符好辦,都是字符串$變量,建個漢字庫就差不多了。16X16的點陣漢字庫在早期很奢侈,佔內存,現在都不是事。

最底層的函數名變成漢語拼音縮寫了算法都不是事。

如果還有更多耐心,還可以把早年市場上出現的,漢字輸入法整合到底層,有種天然碼,是按漢字形聲書寫邏輯做的,其實直接裝上軟件文字庫就夠了,底層函數名理順成漢拼後基本就差不多了,不必再多改,

其實底層彙編語言並不多,沒有多少句,就是埋的歷史深,中上層覆蓋的軟件太多太厚了

人工改是超級工程,

但是一旦做好底層函數名,可以暴力換算機器編譯。

做好底層函數名漢拼簡寫,做好漢字字形點陣數據圖形庫,在弄個編譯器,

就改過來了。

還是二十六鍵字母鍵盤,但完全是漢拼邏輯了。


AUTUYT


後半個問題,對於絕大多數網絡用戶來說,現在國內的網絡環境已幾乎是全中文的,比如各大網站的界面和內容等等。它並不直接依賴中文編程語言。下面主要關注前半個問題。

中文語法的編程語言和配套開發環境早就有,也有了相當大的用戶群,但商業項目中尚未成氣候。主要原因是編程語言工具本身的定位和商業運營策略。十幾年前剛推出時推廣的速度之快,可以看出國內對中文編程語言的巨大需求。而隨著全社會越來越認識到計算機編程與各行業轉型的精密關係,編程越來越成為一種基本技藝。在這個背景下,中文編程語言與開發環境的推廣和商業化迎來了最佳發展機遇。

在技術上,現在開發一套中文編程語言和開發環境的代價比起十幾年前要低一些,因為這麼多年的開源編譯器項目發展,有更多的框架、工具、資料可以利用。

比如,有現成的教程可以幾乎從零開始開發一個簡單的通用腳本語言

而藉助語言生成工具如 xtext,更可以在十幾分鍾內實現基於Java的一個領域專用語言(DSL)

也可以藉助 Antlr 等代碼分析器生成工具,簡化開發,較簡便地實現下面這樣的類LOGO語言

另一種方式是修改現有英文編程語言的編譯器或交互控制檯,實現漢化關鍵字和/或接口,甚至反饋信息。

下面是漢化了TypeScript的入門代碼:

漢化了Python控制檯的反饋錯誤信息:

一套中文的標準庫和接口以及對應文檔的開發和維護仍需要相當工作量,也很考驗開發者的實踐經驗。即使是像上面對英文編程語言進行漢化,也需術語一致恰當。

除了中文編程語言本身的功能能夠滿足基本開發需要之外,一個適合中文代碼輸入和支持提示、補全、幫助的開發環境是決定這個語言能多容易被開發者接受的重要因素。

早在十幾年前的中文編程開發環境就已經實現了中文輸入法和自動補全的集成。在自動補全成為開發環境標配的今天,這個功能更是必需。而更進一步的智能提示,還依賴中文自然語言處理技術和代碼分析技術。從這個角度說,中文編程語言和開發環境的探索和推廣更是迫在眉睫,因為它和自然語言處理技術可以相輔相成,加速發展。

如果目標是商業大規模應用,編程語言項目如果開源,可以得到更大程度的信任,以及更多用戶和合作開發者。

由於中文編程語言項目的特殊性,它還有一個優勢,那就是從項目之初就可以使用中文命名標識符。對於母語命名對代碼可讀性的好處,之前的文章已經有了不少闡述,這裡不贅述。它的特殊性就是,中文編程語言的用戶必然會中文,同樣會參與到語言工具本身開發中的合作者也都會中文,因此中文命名標識符沒有非技術原因的障礙。

上面的腳本語言實現就在Java中使用了中文命名:

上面的LOGO語言實現是在JavaScript中用了中文命名

用中文命名標識符,不僅可以減少項目開發和維護成本,也可以一致編譯器方面的中文術語,從而避免國內編譯器開發者交流技術時大量夾雜英文術語的現狀。

中文編程源遠流長,現在就是最好的機遇。看到了很多個人和公司在進行中文編程語言和IDE的嘗試和探索,相信在三年(現在是2019年)甚至更短的時間內,就可以看到更大的突破。

更多中文命名和編程語言技術,請關注本號“用中文編程”!


用中文編程


漢字為主體的計算機語言的可持續發展性

首選說一下計算機根本上就是字節,就是0和1,無論什麼語言到根本上就是01的二進制體現,也就說計算機語言不區分語言,不管你是英的,還是中的,計算機的根本認知就是0,1。

上面的問題是根本問題,那麼人機對話,就是使用什麼語言開發的問題了,計算機是美國開發的所以編程語言就是英文的,這也是大家認為天經地儀的,但是如果使用其它語言來開發,並不是不可能,而只是時間問題。而漢語言為主體也是極其可能實現的!

1、政策

大力鼓勵漢語編程的發展,如易語言編程就是一個非常好的例子,現在易語言發展的是已經非常成熟了,可以說是中國的C++。並且大家入門容易學習簡單,例程也多,國家曾經是大力的支持撥款,可以說這個是一個非常好的方向!

2、發展

如WPS,WPS編程語言,但這個可以學習WPS的發展方式,WPS從開始的無人使用,各種廣告,各種植入,各種流氓形式來發展自己到現在幾乎是無人不用,這種形式發展雖不可取,但也是一個成型的例子。

3、應用

主要是使用單位,很多人都認為是老外的最牛,這也是一種歷史的遺毒,可以說從清道光帝時期開始,國人就怕洋人,洋人的東西就牛。而國人一旦會一點老外的,肯定就看不起自己的,就拿易語言來說,有人會了26個英文字母后就看不上中國字了。

4、制約

制約一個工具的發展是太多了,比如,易語言隨意寫個程序360連查都不查直接報毒,而老外寫的程序,360就是要合計合計了怕引起國際爭端。這個不只是360,其它殺毒工具也是這樣。

5、發揚

如果想發展,首先是要自己看的起自己才行,否則不可能發展,一切全是空談。

漢語為主體的計算機網絡環境

漢語為主體的計算機網絡環境就目前來看是已經在實現了,中國人可以說是遍佈世界,人口最多,形成主體是已經事實了,這個並沒有什麼太大的難度,倒是第一個問題難度非常大


江中游老師


回覆說狹隘民族主義的,咱不說基礎科學的重要性,只說可行性。阿拉伯數字,西方文字符號,只是因為政治等主觀因素才會統治世界科學,和科學本身沒有任何關係,這些符號只是科學的具現表達,而不是科學本身,所以他隨時可以被替換成另一個體系。當中國可以在全世界“指鹿為馬”的時候,這套體系百分百會被替換,這就是中國。還有,不要被大同夢想洗腦,天下大同只是理想,想想就好,你還得過日子。民族主義從始自終都是主流,你要知道你吃誰家飯,穿誰家衣。從人性的角度講,從來沒有一個人,可以不參任何私慾主動為他人無條件的好,去付出,有意識的抱團才是常態,請不要再天真,看到文章的時候,切身實際的思考一下,現不現實。保持童真善良是性格,出來秀天真就是傻了……


好人蔣蔣蔣


也可以把計算機可識的1與0,改為漢字的,開與關,陽與陰,實與虛,有與無,可以用中國的玄學與科學結合創造呀,比如算命的用來造智能機器人!算命算得準了,可用愛因斯坦的八字來造智能機器人呀這樣愛因斯坦的靈魂就復活了!造出來的機器人神情,性格,往事,都與愛因斯坦相同不就相當於愛因斯坦復活矣哉,電腦識別漢字的,開與關,有電與無電就是1與0,其實玄學家,道士,和尚,程序員,科學家,這類的人職業性相同主思想,用中國的算命術造智能機器人絕對歷害中國的命理師應該與程序員合作把那些死去的科學家名人的靈魂用命理學與編程學最招回來,說是靈魂,其實就是個人屬性,個人性格,算出來後用計算機去模仿就相當於這個人復活了的,中國的看相術可做人臉識辨,天干地支時辰可對應生物鐘植物神經,形響五臟,產生情緒,互生相剋,產生人情世故,把中國人的玄學用電腦程序化,命理搭建人體心裡學,風水類奇門遁甲等等搭建虛擬世界,天象來模仿天氣!用計算機來搭建個宇宙出來,我們造一個谷歌地球這種模形出來就行了,把自然界的屬性定律元素全加入去,經過一千幾百年的發展人類的靈魂就可以進入裡面生活了,虛擬現實,一生二,二生三,三生萬物乎哉,要搞就搞開創性的電腦系統,而不是再模仿現在的系統,可能以後的量子計算機會出新系統!量子計算機成熟現在的計算機就淘汰了,把精力放在量子計算機中去


反辱為榮


編程語言,並沒有把那些字母當成英語,只是把它當成符號而已。你也可以當成拼音呀。

C語言有個define,typedef你可以把所有關鍵字運算符類型都定義成中文,庫函數定義成中文,“享受”下中文編程。那時候你會發現生不如死~

其實你所說的問題,只是目前太多計算機和編程方面的資料是英文資料。計算機並不會去區分你是中文英文還是什麼鳥文,它只知道一堆高低電平,一堆邏輯門。所以,並不存在什麼漢字主體還是英文主體的說法。如果非要強加一個,那就是BIOS/操作系統的區別,就是各種標準定製採用語言的區別。

最後,給你看看中文版C寫出來的程序是什麼樣


分享到:


相關文章: