古文字考釋與人工智能

古文字考釋與人工智能

圖一

古文字考釋與人工智能

圖二

“人工智能+”已經跟很多行業發生關係。據人工智能專家介紹,凡是邊界清楚的問題,最適宜用人工智能來解決。因此,像古文字考釋這種道理上只允許存在一種正確結論的學問,利用人工智能技術來輔佐研究,自然再適合不過。事實上,古文字行業大概在30多年前,已有學者在探索利用計算機幫助綴合那些破碎的甲骨片子。最近看到“AI驅動的甲骨綴合”報道,是古文字學家和計算機專家合作,利用人工智能技術綴合了一批甲骨碎片,似乎相當準確。而諸如圖像捕捉與提取、字形識別與轉換、數據聚合與分類等與人工智能有關的工作,也都有學者在努力研究,並都有喜人突破。其目的都是希望靠計算機來解決人工做起來十分煩瑣且不容易準確的工作。

這裡舉幾個自己以往考釋古文字的例子,來說明人工釋讀古文字的很多關鍵點今後是完全有可能利用人工智能技術去幫助解決的。

第一,古文字中有些字,形體非常接近,卻是不同的兩個字。

如甲骨文、金文中的“並”和“替”,差別只在它們所從的兩個“立”,一是左右並排(並),一是高低錯落(替)。楚文字中的“之”和“出”,差別只在最底下一筆,一作平畫(之),一作上彎形(出)。歷史上,在學者正確分辨出來之前,“替”字都被誤釋成“並”;而楚國印章中的“出”,也多被誤釋為“之”,致使一些重要商業史料被湮沒。20世紀30年代,在洛陽金村出土的一批青銅方壺上,都有記錄容量和重量的銘刻。在容量“四鬥”之後,有“[~符號~]([~符號~])客”二字,過去多有誤釋,目前最流行的釋法就是釋為官名“[~符號~](司)客”。我多年前曾在一次演講中指出,“客”前一字,跟“[~符號~]”字是有區別的。其所從的[~符號~],不但比“司”字所從的[~符號~]少一畫,連首筆的斜度,也就是筆勢,二者都是不同的。這個字實際上就是“以”字。釋作“以”,不但字形上解釋起來毫無障礙,文意也極為通暢。“以客”要讀作“已格”,就是已經校量過了的意思。“以”讀“已”,在古書中本是很常見的,而“客”與“格”的通假,早在西周銅器銘文中就已出現過了。近年新出的好幾件記容銅器上,都發現“客”讀作“格”(度量)的例子。而三晉記容銅器銘刻中,也曾出現過“已[~符號~](校)”這樣的話。所以金村方壺銘文中這兩個字的正確釋讀,一定是“以(已)客(格)”,而不能是其他。這種字形上的細微差別,往往是誤導學者釋讀的一個重要原因。

第二,即使字都不難認識,但因某些特殊情況的存在,也會導致人眼的疏忽,進而導致錯誤的釋讀。

過去我曾講過一個反書的例子:徐國青銅器上曾出現過“魚臘”(臘音昔,乾肉),這是古代禮書上常見的連舉名物,但因“魚”字在銘文中是反寫的(與銘文鑄造有關),結果導致各種各樣的誤釋,致使我們喪失一次古代禮制方面的“二重證據”機會。這裡再舉一例:《古璽彙編》2238號是一枚三晉陽文小方印(圖一),舊以為其上只有三個字,定為私印。我在2006年審讀一篇博士學位論文時曾指出,此印實際上是五個字,前兩個字的下部,都含有合文符號“=”(兩個字合在一起佔一個字的地位,稱為合文)。只是因為印面地位狹窄,加上所有文字都並排橫列,所以看起來非常隱晦,以致一般研究的人都會疏忽放過。正確的釋讀應該是“曲邑勻邑守”,是一方很特殊的官印。過了11年,2017年,陝西收藏家公佈了一方新發現的類似三晉官印,印文是“曲邑武陰守”,其上“曲邑”二字也同樣作合文並有合文符號(《戎壹軒藏三晉古璽》),證實了我之前的看法(圖二)。

第三,窮盡資料,並儘可能地縮小考釋範圍,是準確考釋古文字的一個重要途徑。

在三晉璽印所見的姓氏中,有一個怪字作[~符號~],它既作為單字姓氏出現,又出現在複姓中(這裡用俗稱,實際是氏)。過去曾有學者釋為“佗”,字形上雖然也馬馬虎虎可以通過,但實際上解決不了跟已知古代姓氏的對應問題。也就是說,這樣的考釋最終還是無法落實。後來我在檢閱舊材料時發現,這個怪字在複姓中,不但出現在後一個字的位置上,如“大~”;也出現在前一個字的位置上,如“~中”。這樣一來,釋讀的可能範圍便大大縮小了。於是我檢查了所有已知複姓,最終知道此字實際上就是古文字裡很常見的當“叔”字用的“弔”,只是它的寫法在三晉變異了。“大叔”氏、“叔中”氏和“叔”氏,不但見於傳世文獻(即太叔、叔仲),也見於漢代私印。後來我又在魏國兵器上發現同樣寫法的“弔梁”氏,那自然就讓我們馬上想起孔子的老爸名紇字叔梁。晉有叔梁氏,是見於古姓氏書記載的。

以上幾個古文字考釋的例子,如利用人工智能技術,大約涉及:(1)手寫漢字字形的精準圖像識別,含反書、合文、重文等特殊情形;(2)語料庫的建設,含通假標識與斷句等;(3)古代歷史與制度的相關數據庫建設。假使通過計算機讀圖並與各種相關的“庫”建立起有效的勾連與篩選,也就是通過人工智能技術達到較為精準有效的數據處理,那麼古文字考釋的速度與成效自然會大大提高。雖說這些恐怕還都屬於比較低端的人工智能,未來一定還會有更高級的諸如機器自我學習提升以及人機嫁接互動等技術,但這已是我們當下可以憧憬和努力的方向了。

(作者:吳振武,系吉林大學考古學院教授、博士生導師)


分享到:


相關文章: