當前位置: 華文星空 > 知識

zh

2013-11-07知識

先回答問題:

什麽關系?都是描述語言的。
什麽區別?描述語言的範圍不一樣。

徹底讓你搞明白這個問題需要追本溯源一直追到 http://www. rfc-editor.org/rfc/bcp/ bcp47.txt 規範才行,不過這裏我簡單描述下一般也能懂。

=== 進入正文 ===

首先一個語言的描述規則是下面這樣的:

language-extlang-script-region-variant-extension-privateuse 語言文字種類-擴充套件語言文字種類-變體(或方言)-使用區域-變體(或方言)-擴充套件-私有

這些字串對應的值拼接起來可以對應一個準確的語言。為了方便辨識和辨識,通常還有約定:

  • language 全小寫,通常兩位,新版規範三位,比如:zh
  • extlang 全小寫,三位,表示擴充套件語言,比如:粵語 yue (這裏還有個 macrolanguage 的事情,先不提了)
  • script 首字母大寫,四位,表示變體,比如:中文的 繁體字 Hant 和 簡體字 Hans
  • region 全大寫,兩位,表示用於地區,比如:都是繁體中文,香港的慣用語與台灣的會有區別
  • 所以你問題中的慣用寫法應該改成 zh-CN 和 zh-Hans。前者第二位用了地區限制匹配範圍,後者用了文字變體限制。具體值對應的內容可以在這裏搜尋 http://www. iana.org/assignments/la nguage-subtag-registry/language-subtag-registry 。幫你搬運過來就是:

    %% Type: region Subtag: CN Description: China Added: 2005-10-16 %%

    %% Type: script Subtag: Hans Description: Han (Simplified variant) Added: 2005-10-16 %%

    所以區別就很明顯了:

  • zh-CN 表示用在 中國大陸區域的中文 。包括各種大方言、小方言、繁體、簡體等等都可以被匹配到。
  • zh-Hans 表示 簡體中文 。適用區域範圍是全宇宙用中文簡體的地方,內容包括各種用簡體的方言等。
  • === update ===

    Script 和 Variant 的區別不是很好區分,轉譯過來就更加不準確了,所以我在上面轉譯部份都將其轉譯為「變體(或方言)「,如果你對語言學比較了解,歡迎評論補充。