當前位置: 華文星空 > 心靈

如果漢字失傳了,釋讀它的難度有多大?

2021-10-22心靈

如果失傳,就要假設只有文獻,沒有圖片(有圖就簡單了),沒有字典和說文解字之類,沒有繁體字,沒有任何多語對照。只要文本足夠,使用電腦還是可以釋讀它的。下面我簡單說說具體思路:

一、確定一條思路為主:以字為單位再結合語法進行分析。這個字的概念憑直覺就能看出來吧。這裏所用的語法概念,如字、詞、詞組等,依然沿用現在的概念。另一條思路為輔:對字進行分解研究。

二、首先透過電腦選出高頻字,這個不難吧。下面是選出的高頻字,為了簡單說明,按使用頻率排列如下:1、的 一 是 了 我,2、不 人 在 他 有 這 個 上 們 來 到 時,3、大 地 為 子 中 你 說 生 國 年 著 就 那 和 要 她 出 也 得 裏 後 自 以 會,4、家 可 下 而 過 天 去 能 對 小 多 然 於 心 學 麽 之 都 好 看 起 發 當 沒 成 只 如 事 把 還 用 第 樣 道 想 作 種 開 ,5、美 總 從 無 情 己 面 最 女 但 現 前 些 所 同 日 手 又 行 意 動 方 期 它 頭 經 長 兒 回 位 分 愛 老 因 很 給 名 法 間 斯 知 世 什 兩 次 使 身 者 被 高 已 親 其 進 此 話 常 與 活 正。(共計140字,網上找的,可能不是很準確。)

接著結合語言結構,對上述高頻字進行分析。比如的字,它基本以 xx的 (句尾)或 xx的xx (句中)的方式出現,可以基本推測它就是一個助詞。這裏用到詞的概念,為了行文簡便,和我們現在用到的詞的概念基本一致。 大約是銜接形容詞和名詞用的。至於名詞和形容詞的前後順序,以後研究可以弄清的。至於 一二三 等由於用在文章的條款結構中,很容易破解。 是、了 的研究暫時放後,再看 ,我們會發現它一般出現在句子開頭或前部位置,或者句子結束或尾部語位置,再看 有時和後面的 組成了一個高頻詞。使用位置不變,基本可以推測是個人稱代詞了。接著我們還會發現 你們、他們 這樣的高頻詞與 的用法類似,而且會高頻的成對出現,形成主語和賓語的呼應結構。那麽 我你他/們 基本可以肯定是人稱代詞單數和復數了。回過頭,從大量簡單簡單句子入手,就可以發現夾在人稱代詞之間的詞,基本是動詞了。那個動詞 的獨特性,它出了 字基本不和別的字組成高頻詞。而且出現大量的 xx是xxxx的 結構,也可以肯定 是是了。接著 字破解無懸念。 破解了, 接著破解 還有 子, 根據它的大量出現的 x子 組合 可以破解了,接著破解一大批名詞形式。回過頭,可以發現xx xx結構,形容詞在前,名詞在後。那麽沒有的的xx+xx組合也是前面是形容詞,後面是名詞了。這樣大致可以確定所有名詞。破解了一二三四等數位,接下來 年月日 也可以破解。數位後面的常用量詞 也可以破解。沿著這思路,我們大致可以確定漢語的語法結構了。同時可以確定名詞、動詞的位置。繼而開始研究名詞。

三、接著,透過詩詞、歌詞,我們大致可以破解讀音的韻母。大致按拼音方案分為35個韻母,但不好確定哪個字到底是什麽韻母?但聲母還不好破解。也就是說難以讀出每個字完整的音。至於聲調,除非有文獻論述,估計可能想都想不到。

四、再看對漢字分解研究那一條思路。因為對韻母的研究,可以大致發現一些表韻母或讀音部件。但很難發現為聲母部件。也就是說字雖然也應該表音,但不是拼音結構。根據對漢字和部件形態研究,會發現一些【根字】(是臨時造的概念)。所謂根字就是一個字可以單獨使用,也可以成為另一個字的部件。比如車可以單獨使用,也可以做輪、轉的部件。而且,我們依然可以找到一些高頻根字。比如車。我們可以發現很多高頻詞。前面說過我們根據詞的位置大致可以區分名詞和動詞。那麽,我們可以大致列出名詞:汽車、貨車、火車、小車、車門、車窗、車燈、車站、車牌等,動詞(組):開車、坐車、騎車、洗車、修車、買車。而且比較手機、衣等詞匯的使用頻率。並且發現開車、坐車和到什麽地方這個狀語連用。大致可以確定 就是表示車了。確定了車,對 開、坐、洗、門 等有很強的輔助辨認功能。接著對輪、轉、輛、轎估計可能與車有關。接著會發現 這個部件和水有關。畢竟江、河組成的詞不少,而且在狀語的位置不少,應該是地理位置。

五、開始研究時,可以假設一字多意,一字多種讀音,一字多音節,2~3字合成一個音節,等等。隨著研究深入,有些假設可能證實,有些基本否定。

六、這些需要海量的比較、計算。必須要上電腦程式。將第一次大量研究成果再放回文本中看句子的意思是不是自然流暢,又可以進行第二次調整。這樣,反復幾次。基本可以獲得一本類似【新華字典】。

綜合而言。如果只研究字義,漢字釋讀的難度不會很大。有AI,有一群人進行海量掃描輸入,估計幾個月到一年就可以意義釋讀。至少不會比拼音文字難度明顯大。但釋讀語音,難度很大。拼音文字釋讀語音靠擬聲詞,可以讀出幾個元音,輔音。但全面讀出音,也有相當難度。