步驟 內(nèi)容 地點 說明
01: C1 HelloWorld.java C1泛指一個GBK字符
02: U1 JAVAC讀取 U1泛指一個Unicode字符
03: C1 getBytes()第一步 JAVA先和操作系統(tǒng)交流
04: B1,B2 getBytes()第二步 然后返回字節(jié)數(shù)組
05: C1 new String()第一步 JAVA先和操作系統(tǒng)交流
06: U1 new String()第二步 然后返回字符
07: C1 println(String) 能顯示“中”字,內(nèi)容和原來的相同
2.5.2)然后再以代碼段10為例,我們注意到只是:
步驟 內(nèi)容 地點 說明
01: C1 HelloWorld.java C1泛指一個GBK字符
02: U1 JAVAC讀取 U1泛指一個Unicode字符
03: C1 getBytes()第一步 JAVA先和操作系統(tǒng)交流
04: B1,B2 getBytes()第二步 然后返回字節(jié)數(shù)組
05: C3,C4 new String()第一步 JAVA先和操作系統(tǒng)交流,這時解析錯誤
06: U5,U6 new String()第二步 然后返回字符
07: C3,C4 println(String) 由于中字給分成了兩半,在ISO8859_1中剛好也沒有字符
能映射上,所以顯示為“??”。在上面的示例中,
“中文”兩個字就顯示為“????”
2.5.3)在完全中文模式下的其它情形類似,我就不多說了
2.6)我們接著看為什么在西文DOS窗口下編譯出來的類在中文窗口下也出現(xiàn)類似情形,特別是為什么居然有的情形下還能正確顯示漢字。
2.6.1)我們還是先以代碼段9為例:
步驟 內(nèi)容 地點 說明
01: C1C2 HelloWorld.java C1C2分別泛指一個ISO8859_1字符,“中”字被拆開
02: U3U4 JAVAC讀取 U1U2泛指一個Unicode字符
03: C5C6 getBytes()第一步 JAVA先和操作系統(tǒng)交流,這時解析錯誤
04: B5B6B7B8 getBytes()第二步 然后返回字節(jié)數(shù)組
05: C5C6 new String()第一步 JAVA先和操作系統(tǒng)交流
06: U3U4 new String()第二步 然后返回字符
07: C5C6 println(String) 雖然同是兩個字符,但已不是最初的“兩個ISO8859_1字符”,而是“兩個BGK字符”,“中”顯示成了“??”而“中文”就顯示成了“????”
2.6.2)下面我們以代碼段12為例,因為它能正確顯示漢字
步驟 內(nèi)容 地點 說明
01: C1C2 HelloWorld.java C1C2分別泛指一個ISO8859_1字符,“中”字被拆開
02: U3U4 JAVAC讀取 U1U2泛指一個Unicode字符
03: C1C2 getBytes()第一步 JAVA先和操作系統(tǒng)交流(注意還是正確的哦?。?
04: B5B6 getBytes()第二步 然后返回字節(jié)數(shù)組(這是很關鍵的一步!)
05: C12 new String()第一步 JAVA先和操作系統(tǒng)交流(這是更關鍵的一步,JAVA已經(jīng)知道B5B6要解析成一個漢字!)
06: U7 new String()第二步 然后返回字符(真是一個項兩!U7包含了U3U4的信息)
07: C12 println(String) 這就原來的“中”字,很委屈被JAVAC冤枉了一回,不過被程序員撥亂反正了一下!當然,“中文”兩個字都能正確顯示了!
3)那為什么有的時候用JDBC的
new String(Recordset.getBytes(int)[,encode])
Recordset.getSting(int)
Recordset.setBytes(String.getBytes([encode]))
和
Recordset.setString(String)
的時候會出現(xiàn)亂碼了呢?
其實問題就出現(xiàn)在編寫JDBC的的也考慮了編碼問題,它從數(shù)據(jù)庫讀取數(shù)據(jù)后,可能自作主張做了一個從GB2312(默認編碼)到Unicode的轉(zhuǎn)換,我的這個WebLogic For SQL Server的JDBC Driver就是這樣的,當我讀字串的時候,發(fā)出讀到的不是正確的漢字,可恨的是我卻可以直接寫漢字字串,這讓人多少有點難以接受!
也就是說,我們不得不在讀或?qū)懙臅r候進行轉(zhuǎn)碼,盡管這個轉(zhuǎn)碼有的時候不是那么明顯,這是因為我們使用了默認的編碼進行轉(zhuǎn)碼。JDBC Driver所做的操作,我們只有進入到源代碼內(nèi)部才能清楚,不是嗎?