我們能否建立以漢字為主體的計算機語言、漢語為主體的計算機網絡環境?

海藍天長


大概不是你想的那麼簡單。

漢字的獨特意義,是字形本身與字形所載之義的必然聯繫,其穩定聯繫的價值,是人際間的思想交流。但是人與計算機之間,不是平等的雙向思想交流,本質上是人的單向控制。不需要計算機“理解”。這個機能,不需要漢字的高超語義承載能力、更密切的與現實世界擬合的能力。

就好比,在小範圍內、有限的指令集合,將指令用盡量簡化的符號去指代,才是最高效的。數學體系,用一些本身沒有意義的符號,強行綁定特定的語義,顯然要比漢字高效多了。用“+-*/”,跟“加減乘除”,哪個更高效?用“xyz”,跟“甲乙丙丁”,哪個更高效?

計算機系統本身的指令,不需要計算機“理解”、與現實比對校驗,只要那符號與其本身的有限硬件邏輯能對應就行。但是人機交互過程,卻有極大提升空間。

除了擬合現實現象,語言還有另一個存在意義,那就是擬合人自身的思維過程。這個功能,只有漢字能夠做到,拼音語言是不行的。因為思維相關,亦即華夏常說的“心性”,不是客觀物理的存在,沒辦法以統一視角進行觀測,每個人只知自己心性,沒法像體味自己心性一樣去體味別人家心性。所以對思維過程的擬合,極度依賴具有強大而穩定的指示能力的語言工具。這方面,高度標準化(一字一義)的漢語,通過對比、對偶等形式,極具指示天賦。

因此,若能將漢語擬合的人的思維過程固化到硬件邏輯,讓計算機能夠模擬華夏文化教化而成的思維邏輯,那將會是個完全不同的“計算機”。

計算機語言邏輯其實可分為兩部分。有物理存在,即其硬件電路當中的既定邏輯,這部分邏輯,其實與語言無關,那是純數理邏輯,是加減乘除,是與或非,這與英語還是漢語完全沒關係。

但是人機交互過程中人所用的符號與機器碼對應關係。這部分的形式,其實底層基礎是ASCII碼映射規則,受限於拼音語言的邏輯,計算機底層固件當中的符號體系極為粗疏,而若能將計算機系統底層的ASCII碼映射規則替換為一個支持漢字映射規則的邏輯電路,那麼漢語者人機交互的效率將會大幅提升,編譯層面的效率和擴展性,也將大幅提升。

再者,上面說的固化的物理存在的邏輯電路,卻完全可以別有洞天。

人類的思考過程,可不是隻會比較大小判斷是否等於的,可不是隻能定量的,人類更牛逼的機能是定性,根據其無法量化的“性質”,去設定相應的策略。比如,好、壞,是、非,肯定、否定,軟、硬。華夏就建立了一整套完備的定性符號體系及其相應的運算規則,就是五行八卦天干地支。

如此,內,若能將這套邏輯固化在計算機的物理邏輯中,外,以漢字映射規則進行人機交互,那才是真正的“華夏智能”。

——無陳詞濫調,無不知所云,無酸腐雞湯,無繽紛喧囂,唯有一點赤誠真意,一點犀利深刻;君若有得,乞輕落玉指點贊、高抬貴手轉發;若有相左之真知灼見,請評論中不吝賜教。

長風浩蕩


完全可行,雖然會有一定難度,想用漢字作為一種全新的編程語言,編寫操作系統和做相應cpu指令集、架構等,必須對現在的計算機架構,做出顛覆性的變革。

現在計算機架構,自計算機在美國誕生之初,採用的是二進制,計算邏輯、存儲方式、指令編寫等等核心,到現在都沒有什麼改變,只是集成度高、處理速度大幅提升。



基於這些,為了更方便計算機的編程學習,從彙編、Basic、Pascal、C、C++、Java、Python等編程語言不斷的發展,但編程的核心思想並沒有太大的變化,美國的二進制計算機標準一統全球后,世界上就很少人去做些基礎研究了,包括操作系統、高級語言等。大學的計算機課程:操作系統、計算機結構,基本上還在用二十年前的教材。


不破不立!


想用漢字作為一種全新的編程語言,必須重新編寫操作系統和做相應cpu指令集、架構等,可以設想如下研究方向:


1、 所有的漢字可以濃縮成300個標準的漢字圖形組合而成,而300個漢字圖圖形可以濃成30個基礎的漢字圖形基礎代碼,再把這些代碼變成一個一個標準的指令集。


2、 拋棄二進制架構,採用三進制計算機(前蘇聯有過樣機),對於計算速度大幅提升、存儲空間擴展、增加邏輯判斷選項等有極大的好處,這種架構更適合中文漢字的思考方式。


3、 現在的計算機判斷只有是與否,不太適合人腦思維,也就是說現在所說的人工智能其實只是大數據的統計、分類、關聯、比對及判斷預測,沒有真正的人腦學習能力,真正的人工智能,應該像人腦一樣思考,對外界物體的認知有三種判斷狀態:是、否、未知,通過自我學習,把未知變成明確的認知判斷。


4、 漢字的優勢,包括機器人腦模擬、機器學習、語音識別、圖像識別及神經網絡等優勢,可以形成有統一、標準、高效、共享的代碼庫及指令集。


5、 解放程序員的手,通過語音來編程,通過接收語音指令,給出最優代碼模塊,實現所要功能,漢字語音指令相對英語語音會更有效率及優勢。


6、 未來是物聯網、人工智能、神經網絡等萬物互聯的世界,這些對網絡安全的要求非常高,漢字密匙優勢也遠遠超出英文,二維碼是明碼,而漢字三維碼則是帶密匙信息碼,承載的信息量也會遠遠超過二維碼。


7、 5G物聯網時代即將來臨,信息流動及交互的速度與效率極大的提升,漢字的優勢會變得極為明顯,對於教育而言,最大的顛覆:改變知識獲取的渠道方式及知識(信息)的表達形式。因為,不再有平臺的概念,不管是社交平臺還是教育平臺等,未來5G物聯網時代,現實當中的每個人,每個物體都會是網絡的節點,人與人的交流、人與物的聯繫、物與物的關聯,不需要通過某一平臺去實現,因為節點就是面,面即平臺。對於教育行業而言,信息與知識的節點是漢字,每個漢字都可以瞬間組合成立體知識平臺,組合出關聯的字、詞、句、詩、文、即時信息及從古到今的關聯古物及歷史事件,使知識的廣度及深度同時呈現。




.

.


【專注說文解字、快速識字、K12全語文、海外漢語,漢字創新思維、漢字國學、解字古詩文】

漢字師認證課程,讓你成為一名合格的漢字老師、一名漢字啟蒙師!

想了解詳情,關注本號,私信留言 “99

想 瞭解《人字學習法》,私信留言:“


漢字谷主


在五筆輸入法發明之前,全世界都認為漢字不適合計算機輸入。甚至提出放棄漢字,以便中國能更快更好的追趕高科技。

漢字對於其它文字就是三維對二維的區別。漢字的複雜性,如果仍舊用二維思維去使用,就無法解釋和正確使用漢字。

總是有人說漢字的不確定性,比如好字的不同讀音,就有不同的的意思。這會讓二維思維的人或現在計算機抓狂。但是大家有沒有發現,中國發展到現在,只要是合格的中學生都能讀懂古文,而且對其中的不同讀音的字,也不會誤解。這也說明了漢字的傳承性,可靠性和簡潔性。

相反,英文這方面完全無法和中文對比,現在的高中生也無法讀懂幾百年前的著作。而且如果不學習,估計幾年後的文章都讀不懂。

說英文佔字節少的,可以試試搜索最長的英語單詞。

漢字是最符合人類特性的,相反計算機對什麼都量化了。哪怕是一個遊戲,都可以看出二維的思維,就是一屬性對比。當然有人會說這是科學。但是現實中以弱勝強的例子比比皆是。這就不科學了嗎?

所以以漢字為主體計算機系統沒有建立,不是漢字不行,是人類還沒有達到這種高度。

現在講AI,我個人認為只要採用二維方式,就不能稱之為智能,只是模仿加大數據,只要計算機不能理解好字不同讀音的不同意思,就不能稱之為智能。

真正的智能估計要漢字化計算機才能實現。


簡單而不簡略


完全可以,就是要有耐心,要有幹細活,幹瑣碎活的心態,

現代計算機是建立在二極管,門電路,硬件基礎上得二進制數學代碼體系。

0,1,之上,是26鍵,是英語字母縮寫的函數名

要改不是很難,

26鍵,用漢語拼音,直接從底層函數做,與門AND,或門OR,非門NO,改成yu,huo,fei,正弦,餘弦,正切,都改用漢拼,或漢拼簡寫,

漢字字符好辦,都是字符串$變量,建個漢字庫就差不多了。16X16的點陣漢字庫在早期很奢侈,佔內存,現在都不是事。

最底層的函數名變成漢語拼音縮寫了算法都不是事。

如果還有更多耐心,還可以把早年市場上出現的,漢字輸入法整合到底層,有種天然碼,是按漢字形聲書寫邏輯做的,其實直接裝上軟件文字庫就夠了,底層函數名理順成漢拼後基本就差不多了,不必再多改,

其實底層彙編語言並不多,沒有多少句,就是埋的歷史深,中上層覆蓋的軟件太多太厚了

人工改是超級工程,

但是一旦做好底層函數名,可以暴力換算機器編譯。

做好底層函數名漢拼簡寫,做好漢字字形點陣數據圖形庫,在弄個編譯器,

就改過來了。

還是二十六鍵字母鍵盤,但完全是漢拼邏輯了。


星輝650


漢字為主體的計算機語言的可持續發展性

首選說一下計算機根本上就是字節,就是0和1,無論什麼語言到根本上就是01的二進制體現,也就說計算機語言不區分語言,不管你是英的,還是中的,計算機的根本認知就是0,1。

上面的問題是根本問題,那麼人機對話,就是使用什麼語言開發的問題了,計算機是美國開發的所以編程語言就是英文的,這也是大家認為天經地儀的,但是如果使用其它語言來開發,並不是不可能,而只是時間問題。而漢語言為主體也是極其可能實現的!

1、政策

大力鼓勵漢語編程的發展,如易語言編程就是一個非常好的例子,現在易語言發展的是已經非常成熟了,可以說是中國的C++。並且大家入門容易學習簡單,例程也多,國家曾經是大力的支持撥款,可以說這個是一個非常好的方向!

2、發展

如WPS,WPS編程語言,但這個可以學習WPS的發展方式,WPS從開始的無人使用,各種廣告,各種植入,各種流氓形式來發展自己到現在幾乎是無人不用,這種形式發展雖不可取,但也是一個成型的例子。

3、應用

主要是使用單位,很多人都認為是老外的最牛,這也是一種歷史的遺毒,可以說從清道光帝時期開始,國人就怕洋人,洋人的東西就牛。而國人一旦會一點老外的,肯定就看不起自己的,就拿易語言來說,有人會了26個英文字母后就看不上中國字了。

4、制約

制約一個工具的發展是太多了,比如,易語言隨意寫個程序360連查都不查直接報毒,而老外寫的程序,360就是要合計合計了怕引起國際爭端。這個不只是360,其它殺毒工具也是這樣。

5、發揚

如果想發展,首先是要自己看的起自己才行,否則不可能發展,一切全是空談。

漢語為主體的計算機網絡環境

漢語為主體的計算機網絡環境就目前來看是已經在實現了,中國人可以說是遍佈世界,人口最多,形成主體是已經事實了,這個並沒有什麼太大的難度,倒是第一個問題難度非常大


江中游老師


哈哈,很多年以前我也是這麼想,還開發了一種中文BASIC,實際操作才發現問題多了。

其中主要還是鍵盤問題,同一個代碼,需要輸入漢字,在鍵盤上輸入漢字遠比輸入英文麻煩,即使已經很熟練輸入漢字了,也比很熟練輸入英文麻煩,所以當變量可以使用漢字以後,基本就沒有人提漢字編程了。

現在的編程語言基本都有聯想功能,當你輸入一個字母,相應的關鍵字或函數就會出來,選擇起來很方便,即使英文不太好也沒啥關係。


觀上靈雲


我們完全能夠建立以漢字為主體的計算機語言和以漢語為主體的計算機網絡環境。

條件有兩個:

一是使用融入拼音字母的通音漢字。

二是須經國家語委的研討及領導人的決擇。











先生劉興華


回覆說狹隘民族主義的,咱不說基礎科學的重要性,只說可行性。阿拉伯數字,西方文字符號,只是因為政治等主觀因素才會統治世界科學,和科學本身沒有任何關係,這些符號只是科學的具現表達,而不是科學本身,所以他隨時可以被替換成另一個體系。當中國可以在全世界“指鹿為馬”的時候,這套體系百分百會被替換,這就是中國。還有,不要被大同夢想洗腦,天下大同只是理想,想想就好,你還得過日子。民族主義從始自終都是主流,你要知道你吃誰家飯,穿誰家衣。從人性的角度講,從來沒有一個人,可以不參任何私慾主動為他人無條件的好,去付出,有意識的抱團才是常態,請不要再天真,看到文章的時候,切身實際的思考一下,現不現實。保持童真善良是性格,出來秀天真就是傻了……


花枝染指hzrz


      電腦直接漢字輸入和讀寫聽說一直沒有確定的方案,更不說編程了。早前學Basic語言也頭暈,如果能搞出直接的民族性的計算機語言,大眾無償受惠,也是功德無量,所以有個想法也來表達一下,不喜勿噴。

       我可是認真想了一個小時得出結論:雖然可能囉嗦一點,但讀入,表出想想也是可以的,後又想了一個晚上深化了:

       中國文字:音一形一義,英文:音一意,表意為主,形的方面很少。中文比英文強在形上,一字一形有一義。

       我想輸入可以五花八門,運行用漢字的形,表意用漢字也可以英文等其他。也就是輸入一運行一表述可以分開。

       計算機的讀,以前是二進制,是0,1和易經合拍,或者說來源於易經。現在說三進制,00,01,11?。

       我想說這三進制是指縱向的三,道生一(無極生太極),一生二(太極化二儀),(二儀生四象),二生三(四象為八卦),三生萬物,只有到三這個層次才能生而括萬物,達到運用的層次。前面一,二隻是說明原理,引而深入。

       到三,八卦這裡就是8個字,坤,乾,坎,離,兌,震,艮,巽,既表方向,亦表屬性,還是其他。其實,就是每三個信號組成的組合,這是我認為的三進制。

       有了新的八個信號,再進一步排列組合就是64卦了,當然還可以進階。

那麼對一個字怎麼讀?

       我想現在來談一個字的認識就簡單了,接下來要建立一個模型,一個認知模塊來解決,這個是巧妙的方案,不單單是平面,也可以立體。易經不單是二維平面,更是立體三維,甚至四維等更高維。

比如把一個字認同為一幅圖:中國漢字是方塊字,有米字格,有固定的邊旁部首,把一個字用8個信號來表達,應該不難,如4角碼輸入法,就是十個數涵蓋了全部字,如元昊輸入法也是幾個數字。現在改10字到8個字也不難吧。

      比如1.坤指內,其小無內,2.乾指外,其大無外,其餘,3.點,4橫為艮,5.坎為豎,6撇,7捺,8折,順序我也懶得想了。錄入應該不難吧。

如此都是0和1這一陰一陽,計算機的原理沒打破,算法也都在,但表達的內容是三生萬物,千變萬物。如果相同部首,計算機自動都會形聲字認讀了。

      如果英文26個字母都是圖;埃及文字也是圖;,,,來個轉換編程就解決了。

          天馬行空的想法,不知亂槽槽有用否?我姓何,姬姓。


用戶1453499051575


後半個問題,對於絕大多數網絡用戶來說,現在國內的網絡環境已幾乎是全中文的,比如各大網站的界面和內容等等。它並不直接依賴中文編程語言。下面主要關注前半個問題。

中文語法的編程語言和配套開發環境早就有,也有了相當大的用戶群,但商業項目中尚未成氣候。主要原因是編程語言工具本身的定位和商業運營策略。十幾年前剛推出時推廣的速度之快,可以看出國內對中文編程語言的巨大需求。而隨著全社會越來越認識到計算機編程與各行業轉型的精密關係,編程越來越成為一種基本技藝。在這個背景下,中文編程語言與開發環境的推廣和商業化迎來了最佳發展機遇。

在技術上,現在開發一套中文編程語言和開發環境的代價比起十幾年前要低一些,因為這麼多年的開源編譯器項目發展,有更多的框架、工具、資料可以利用。

比如,有現成的教程可以幾乎從零開始開發一個簡單的通用腳本語言

而藉助語言生成工具如 xtext,更可以在十幾分鍾內實現基於Java的一個領域專用語言(DSL)

也可以藉助 Antlr 等代碼分析器生成工具,簡化開發,較簡便地實現下面這樣的類LOGO語言

另一種方式是修改現有英文編程語言的編譯器或交互控制檯,實現漢化關鍵字和/或接口,甚至反饋信息。

下面是漢化了TypeScript的入門代碼:

漢化了Python控制檯的反饋錯誤信息:

一套中文的標準庫和接口以及對應文檔的開發和維護仍需要相當工作量,也很考驗開發者的實踐經驗。即使是像上面對英文編程語言進行漢化,也需術語一致恰當。

除了中文編程語言本身的功能能夠滿足基本開發需要之外,一個適合中文代碼輸入和支持提示、補全、幫助的開發環境是決定這個語言能多容易被開發者接受的重要因素。

早在十幾年前的中文編程開發環境就已經實現了中文輸入法和自動補全的集成。在自動補全成為開發環境標配的今天,這個功能更是必需。而更進一步的智能提示,還依賴中文自然語言處理技術和代碼分析技術。從這個角度說,中文編程語言和開發環境的探索和推廣更是迫在眉睫,因為它和自然語言處理技術可以相輔相成,加速發展。

如果目標是商業大規模應用,編程語言項目如果開源,可以得到更大程度的信任,以及更多用戶和合作開發者。

由於中文編程語言項目的特殊性,它還有一個優勢,那就是從項目之初就可以使用中文命名標識符。對於母語命名對代碼可讀性的好處,之前的文章已經有了不少闡述,這裡不贅述。它的特殊性就是,中文編程語言的用戶必然會中文,同樣會參與到語言工具本身開發中的合作者也都會中文,因此中文命名標識符沒有非技術原因的障礙。

上面的腳本語言實現就在Java中使用了中文命名:

上面的LOGO語言實現是在JavaScript中用了中文命名

用中文命名標識符,不僅可以減少項目開發和維護成本,也可以一致編譯器方面的中文術語,從而避免國內編譯器開發者交流技術時大量夾雜英文術語的現狀。

中文編程源遠流長,現在就是最好的機遇。看到了很多個人和公司在進行中文編程語言和IDE的嘗試和探索,相信在三年(現在是2019年)甚至更短的時間內,就可以看到更大的突破。

更多中文命名和編程語言技術,請關注本號“用中文編程”!


分享到:


相關文章: