词典软件繁简搜索【乾干著着】

至於「簡體化」,繁化姬的轉換策略,可能存在失誤。

一般正常情況下,繁體轉簡體,是指「大五碼」轉「GBK/GB-2312」。當然,在Unicode編碼的世界中,已無所謂「大五碼」或「GBK」,而全都是UCS-2、UCS-4或者UTF-8。在此借用「大五碼」或「GBK」的說法,意指:一個中文字,是否出現在了「大五碼」字集或「GBK」字集的範圍以內。

繁化姬為追求極致的、最嚴格意義上的「繁轉簡」,寧願將轉換出來的簡體字結果落在「GBK」字集之外,這與簡體字的日常使用習慣不相符。「GBK」字集以外的字,皆為Unicode BMP平面以外的「極罕用字」,在正常情況下,使用簡體字的普通人是用不到的,用普通的、常用的簡體字輸入法也難以輸入。故而,繁化姬轉換出來的簡體字,僅僅是理論上的絕對正確,然而實際上卻可能是失敗的轉換結果。